Tải bản đầy đủ (.pdf) (60 trang)

Bảo vệ cơ sở dữ liệu bằng kỹ thuật thủy vân dựa vào giải thuật di truyền và thuật toán mở rộng hiệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.51 MB, 60 trang )

1


ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN
THÔNG

-----------------------------

PHẠM VIẾT HOÀI

BẢO VỆ CƠ SỞ DỮ LIỆU BẰNG KỸ THUẬT THỦY VÂN DỰA
VÀO GIẢI THUẬT DI TRUYỀN VÀ THUẬT TOÁN MỞ RỘNG
HIỆU

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Thái Nguyên - 2015

Số hóa bởi Trung tâm Học liệu – ĐHTN
2


LỜI CẢM ƠN

MỤC LỤC
....................................................................................... 5

CHƢƠNG 1.TỔNG QUAN ....................................................................... 7
1.1.Một số khái niệm cơ bản ...................................................................... 7
1.1.1.Khái niệm cơ sở dữ liệu ..................................................................... 7


1.1.2.Mô hình cơ sở dữ liệu quan hệ ........................................................... 7
1.1.3.Thủy vân số ..................................................................................... 10
1.1.4.Thủy vân CSDL quan hệ ................................................................. 13
1.2.

Các tính chất của thủy vân trên CSDL quan hệ .............................. 15

1.2.1.Khả năng có thể phát hiện ............................................................... 15
1.2.2.Tính bền vững và dễ vỡ ................................................................... 16
1.2.3.Khả năng cập nhật phần tăng thêm .................................................. 16
1.2.4.Không dễ cảm nhận đƣợc ................................................................ 16
1.3.Một số phép tấn công trên hệ thủy vân CSDL quan hệ ....................... 16
1.3.1.Cập nhật thông thƣờng .................................................................... 17
1.3.2.Tấn công có chủ đích ....................................................................... 17
1.4.Các ứng dụng chủ yếu của thủy vân trên CSDL quan hệ .................... 17
1.4.1.Bảo vệ bản quyền CSDL ................................................................. 18
1.4.2.Xác thực tính toàn vẹn của CSDL.................................................... 18
1.4.3.Dán nhãn ......................................................................................... 18
1.4.4.Điều khiển truy cập ......................................................................... 18
1.4.5.Điều khiển sao chép......................................................................... 19
1.5.Thủy vân CSDL không thuận nghịch bằng phƣơng pháp LSB ........... 19
1.5.1.Thuật toán nhúng thủy vân .............................................................. 21
1.5.2.Thuật toán trích dấu thủy vân .......................................................... 22
CHƢƠNG 2. THỦY VÂN CSDL QUAN HỆ BẲNG GIẢI THUẬT DI
TRUYỀN VÀ PHƢƠNG PHÁP MỞ RỘNG ........................................... 24
1.6.Một số phƣơng pháp thủy vân trên CSDL quan hệ ............................. 24
1.7.Phƣơng pháp mở rộng hiệu................................................................. 26
Số hóa bởi Trung tâm Học liệu – ĐHTN
3



1.7.1.Phép biến đổi Haar nguyên trên một cặp giá trị ............................... 26
1.7.2.Phƣơng pháp mở rộng hiệu .............................................................. 28
1.8.Thủy vân mở rộng hiệu kết hợp với thuật toán di truyền .................... 39
1.8.1.Giải thuật di truyền .......................................................................... 40
1.8.2.Hàm thích nghi ................................................................................ 42
1.8.3.Nhúng thủy vân ............................................................................... 44
1.8.4.Trích dấu thủy vân ........................................................................... 46
1.8.5.Phân tích độ phức tạp tính toán ........................................................ 47
CHƢƠNG 3.XÂY DỰNG PHẦN MỀM THỦY VÂN CƠ SỞ DỮ LIỆU
QUAN HỆ

..................................................................................... 49

1.9.Tổng quan về .NET ........................................................................... 49
1.9.1.Khái niệm .NET .............................................................................. 49
1.9.2.Visual Studio.Net ............................................................................ 50
1.9.3.Giới thiệu ngôn ngữ lập trình C# ..................................................... 51
1.10.Hệ quản trị cơ sở dữ liệu SQL Service 2008 ..................................... 53
1.10.1.Tổng quan về SQL......................................................................... 53
1.10.2.Hệ quản trị cơ sở dữ liệu SQL Server 2008 ................................... 55
1.11.Mô hình hoạt động của phần mềm .................................................... 55
1.12.Một số giao diện của phần mềm ....................................................... 57
KẾT LUẬN

..................................................................................... 59

Số hóa bởi Trung tâm Học liệu – ĐHTN
4



LỜI CẢM ƠN
Để hoàn thành đƣợc luận văn này tôi đã nhận đƣợc rất nhiều sự động
viên, giúp đỡ của nhiều cá nhân và tập thể.
Trƣớc hết, tôi xin bày tỏ lòng biết ơn sâu sắc và sự tôn kính đến
PGS. TS. Phạm Văn Ất đã hƣớng dẫn tôi thực hiện nghiên cứu luận
văn của mình.
Xin cùng bày tỏ lòng biết ơn chân thành tới TS Đỗ Văn Tuấn các thầy
cô giáo, ngƣời đã đem lại cho tôi những kiến thức bổ trợ, vô cùng có ích
trong trong thời gian thực hiện đề tài và trong những năm học vừa qua.
Đồng thời xin gửi lời cám ơn chân thành tới Ban Giám hiệu, Phòng
Đào tạo sau đại học, Đại học công nghệ thông tin & truyền thông đã tạo
điều kiện cho tôi trong quá trình học tập.
Cuối cùng tôi xin gửi lời cám ơn đến gia đình, bạn bè, những ngƣời
đã luôn bên tôi, động viên và khuyến khích tôi trong quá trình thực hiện đề
tài nghiên cứu của mình.

Số hóa bởi Trung tâm Học liệu – ĐHTN
5


ĐẶT VẤN ĐỀ
Truy cập Internet một cách dễ dàng đã thúc đẩy sự tăng trƣởng của
nhiều ngành nghề khác nhau và nhiều lĩnh khác. Ngày nay, việc chia sẻ
thông tin trực tuyến là một hoạt động quan trọng đối với kinh doanh và
nghiên cứu,không những vậy, nó còn liên quan đến việc mua bán của cơ sở
dữ liệu. Ví dụ, chia sẻ dữ liệu liên quan đến thời tiết, thị trƣờng chứng
khoán, tiêu thụ điện năng, y tế, khoa học… vv đƣợc thực hiện thƣờng
xuyên. Do đó, có một nhu cầu lớn trong việc cung cấp bảo mật cơ sở dữ
liệu để ngăn cản việc sao chép và phân phối bất hợp pháp trong môi trƣờng

internet. Kỹ thuật thuỷ vân đang đƣợc xem là một trong những giải pháp
đạt đƣợc kết quả cao trong việc bảo vệ bản quyền và xác thực tính toàn vẹn
của dữ liệu số. Vì vậy những năm gần đây xuất hiện một hƣớng nghiên cứu
mới là thủy vân thuận nghịch Trong giấu tin và thủy vân thuận nghịch
thƣờng sử dụng các phép biến đổi nguyên khả nghịch nhƣ dịch chuyển
Histogram, Wavelet nguyên, phép biến đổi tƣơng phản, phép biến đổi theo
thuật toán di truyền, phép biến đổi mở rộng hiệu, ….Trong số đó kỹ thuật
giấu tin và thủy vân dựa trên phép biến đổi theo giải thuật di truyền và mở
rộng hiệu đạt đƣợc hiệu quả cao nên đang đƣợc nhiều ngƣời quan tâm.
Chính vì vậy em chọn đề tài “Bảo vệ CSDL bằng kỹ thuật thủy vân dựa
vào giải thuật di truyền và thuật toán mở rộng hiệu” làm luận văn tốt
nghiệp của mình.
Nội dung luận văn đƣợc tổ chức thành 3 chƣơng: Chƣơng 1. Tổng
quan, Chƣơng 2. Thủy vân CSDL bằng giải thuật di truyền và phƣơng pháp
mở rộng hiệu, Chƣơng 3. Phần mềm thủy vân cơ sở dữ liệu quan hệ.

Số hóa bởi Trung tâm Học liệu – ĐHTN
6


CHƢƠNG 1.

TỔNG QUAN

1.1. Một số khái niệm cơ bản
Phần này trình bày một số khái niệm cơ bản về cơ sở dữ liệu, thủy vân
số nói chung và thủy vân cơ sở dữ liệu nói riêng.
1.1.1. Khái niệm cơ sở dữ liệu
Cơ sở dữ liệu là bộ sƣu tập về các loại dữ liệu tác nghiệp bao gồm:
chữ viết, văn bản, đồ họa, hình ảnh,... đƣợc lƣu trữ dƣới dạng file dữ liệu

trên băng từ, đĩa từ,... Cấu trúc lƣu trữ dữ liệu tuân theo các nguyên tắc dựa
trên lý thuyết toán học. Cơ sở dữ liệu là tài nguyên thông tin dùng chung
cho nhiều ngƣời, bất kỳ ngƣời dùng nào có quyền sử dụng, khai thác toàn
bộ hay một phần đều có thể sử dụng và khai thác nó nhằm thỏa mãn nhu
cầu khai thác thông tin
1.1.2. Mô hình cơ sở dữ liệu quan hệ
Mô hình cơ sở dữ liệu quan hệ đƣợc tiến sĩ E.F. Codd phát triển vào
năm 1970. Loại cơ sở dữ liệu này đã loại bỏ đƣợc những vấn đề liên quan
đến các thiết kế cơ sở dữ liệu khác. Sử dụng mô hình này có thể giảm thiểu
việc dƣ thừa dữ liệu, tiết kiệm đƣợc không gian lƣu trữ và có khả năng truy
xuất dữ liệu hiệu quả. Hiện nay cơ sở dữ liệu quan hệ đang đƣợc sử dụng
phổ biến cho các ứng dụng.
Mô hình cơ sở dữ liệu quan hệ lƣu trữ dữ liệu trên một hoặc nhiều
bảng, mỗi bảng gồm nhiều hàng (row), nhiều cột (column) và đƣợc gọi là
một quan hệ. Trong thực tế các hàng, các cột đƣợc gọi tên theo thuật ngữ là
bản ghi (record) và trƣờng (field).

Số hóa bởi Trung tâm Học liệu – ĐHTN
7


Hình 1.1.Biểu diễn quan hệ
- Thực thể: là đối tƣợng có trong thế giới thực mà ta cần mô tả các đặc
trƣng của nó.
Ví dụ: Thực thể NHANVIEN. Các đặc trƣng của thực thể NHANVIEN
gồm: Mã nhân viên (1), Họ (Trần Văn), Tên (An) Ngày sinh (15/4/1971),...
- Thuộc tính: Là tên các cột của quan hệ, các dữ liệu thể hiện các đặc
trƣng của thực thể, mỗi thuộc tính có một kiểu dữ liệu tƣơng ứng.

Hình 1.2.Biểu diễn thuộc tính


- Miền thuộc tính: Tập các giá trị có thể có của thuộc tính gọi là miền
giá trị của thuộc tính đó gồm có tên, kiểu dữ liệu, khuôn dạng,...
Ví dụ: Ten: kiểu dữ liệu và Text, Ngaysinh, kiểu dữ liệu: date/time,
khuôn dạng:dd/mm/yyyy

Số hóa bởi Trung tâm Học liệu – ĐHTN
8


- Bộ dữ liệu: Là các dòng (bản ghi) của quan hệ không kể dòng tên của
các thuộc tính, mỗi bộ chứa giá trị cụ thể của các thuộc tính.

Hình 1.3.Biểu diễn bộ dữ liệu
- Quan hệ: Cho 𝑅 = {𝐴1 , 𝐴2 , . . . , 𝐴𝑛 }(trong đó R là tên quan hệ,
A1,A2,...,An là các thuộc tính) là một tập hữu hạn các thuộc tính khác rỗng.
Mỗi thuộc tính 𝐴𝑖  𝑅; 𝑖 = 1 ÷ 𝑛có một miền giá trị xác định.
Mô hình cơ sở dữ liệu quan hệ thƣờng biểu diễn một quan hệ trên tập
các thuộc tính bằng bảng 2 chiều. Các thuộc tính của quan hệ là các cột
𝐴1 , 𝐴2 , . . . , 𝐴𝑛 , các hàng của quan hệ đƣợc gọi là các bộ (bản ghi), ký hiệu r
và giá trị của mỗi bộ gồm m thành phần. Quan hệ r đƣợc biểu diễn bởi
bảng sau:
A1

A2

...

An


r1

r1. A1

r1. A2

...

r1. An

r2

R2. A1

R2. A2

...

R2. An

...

...

...

...

...


rm

rm. A1

rm. A2

...

rm. An

Ví dụ:
SINHVIEN(MaSV

Ten

Ngaysinh

Điachi)

HCN01

Hải

12/10/1987

Hà Nội

HCN02

Bình


06/08/1989

Hải Phòng

HCN03

Minh

28/10/1990

Nghệ An

HCN04

Hoa

17/09/1991

Quảng Ninh

Số hóa bởi Trung tâm Học liệu – ĐHTN
9


Trong đó các thuộc tính là MaSV: Mã sinh viên; Ten: tên; Ngaysinh:
Ngày sinh; Diachi: Địa chỉ. Bộ giá trị là (HCN01, Hải, 12/10/1987, Hà
Nội).
- Lƣợc đồ quan hệ: Tập tất cả các thuộc tính trong một quan hệ cùng
với mối liên hệ giữa chúng đƣợc gọi là lƣợc đồ quan hệ.

- Khóa của quan hệ: Trong một lƣợc đồ quan hệ luôn tồn tại một thuộc
tính hay một tập các thuộc tính có khả năng biểu diễn duy nhất các thuộc
tính còn lại. Nói cách khác giá trị của một hay nhiều thuộc tính có thể xác
định duy nhất giá trị các thuộc tính khác. Ví dụ Số chứng minh thƣ sẽ xác
định đƣợc tất cả thông tin về ngƣời mang chứng minh thƣ đó. Tập thuộc
tính có tính chất nhƣ trên đƣợc gọi là khoá của lƣợc đồ quan hệ. Thông
thƣờng trong một lƣợc đồ quan hệ có thể tồn tại nhiều khoá. Trong số đó sẽ
chọn một khoá làm khoá chính sao cho đơn giản và không nhập nhằng
thông tin. Giá trị các thành phần của khoá không thể nhận giá trị null hay
các giá trị không xác định.
Khóa của quan hệ R xác định trên tập thuộc tính 𝑅 = {𝐴1 , 𝐴2 , . . . , 𝐴𝑛 } là
tập con K  R sao cho bất kỳ hai bộ khác nhau t1, t2 r luôn thỏa t1.K ≠
t2.K.
Khóa là khái niệm quan trọng trong thiết kế cơ sở dữ liệu quan hệ.
Khóa thƣờng đƣợc áp dụng trong việc tìm kiếm và cập nhật dữ liệu trong
các quan hệ cơ sở dữ liệu.
1.1.3. Thủy vân số
Thủy vân số là kỹ thuật nhúng thêm một lƣợng thông tin (dấu thủy vân)
vào dữ liệu đa phƣơng tiện nhƣ: văn bản, hình ảnh, âm thanh và cơ sở dữ
liệu (dữ liệu đa phƣơng tiện). Việc nhúng dấu thủy vân vào dữ liệu đa
phƣơng tiện có thể làm giảm chất lƣợng dữ liệu nhƣng nó là dấu vết để
chứng minh quyển sở hữu hoặc dùng để phát hiện ra sự đổi trái phép trên
dữ liệu trong quá trình trao đổi thông tin.

Số hóa bởi Trung tâm Học liệu – ĐHTN
10


Các lƣợc đồ thủy vân có thể đƣợc phân loại theo nhiều tiêu chí khác
nhau nhƣ:

Phân loại theo mục đích sử dụng:
Dựa vào mục đích sử dụng, các lƣợc đồ thủy vân có thể đƣợc chia
thành 2 loại nhƣ hình sau:
Thủy vân số

Thủy vân bền vững

Thủy vân dễ vỡ

Hình 1.1. Phân loại thủy vân theo mục đích sử dụng.
Trên Hình 1.1. thủy vân bền vững là các lƣợc đồ thủy vân có khả năng
chống đƣợc một số phép tấn công nhằm vi phạm bản quyền. Theo đó, dấu
thủy vân cần ít bị biến đổi (bền vững) trƣớc sự thay đổi của dữ liệu thủy
vân. Do vậy các lƣợc đồ thủy vân bền vững thƣờng đƣợc ứng dụng trong
bài toán bảo vệ bản quyền các sản phẩm dữ liệu sô. Trái với thủy vân bền
vững, thủy vân dễ vỡ yêu cầu dấu thủy vân phải nhạy cảm (dễ bị biến đổi)
trƣớc các sự thay đổi trái phép trên dữ liệu chứa dấu thủy vân. Vì vậy các
lƣợc đồ này đƣợc dùng để xác thực tính toàn vẹn của dữ liệu hay định vị
các vùng dữ liệu bị tấn công.
Phân loại theo cách sử dụng khóa:
Ngoài cách phân loại các lƣợc đồ thủy vân theo mục đích ứng dụng, ta
còn có thể phân loại theo cách sử dụng khóa nhƣ hình sau:

Số hóa bởi Trung tâm Học liệu – ĐHTN
11


Thủy vân số

Thủy vân khóa bí mật


Thủy vân khóa công khai

Hình 1.2. Phân loại thủy vân theo cách sử dụng khóa.
Trên Hình 1.2, các lƣợc đồ thủy vân khóa bí mật sử dụng chung khóa
cho cả quá trình nhúng và trích dấu (kiểm tra) dấu thủy vân. Do vậy, khi
triển khai ứng dụng cần phải thực hiện quá trình trao đổi khóa giữa bên gửi
và bên kiểm tra. Trái với thủy vân khóa bí mật, các lƣợc đồ thủy vân khóa
công khai sử dụng các khóa khác nhau cho hai quá trình. Thông thƣờng,
khóa bí mật đƣợc dùng bên phía ngƣời nhúng dấu thủy vân và khóa công
khai đƣợc sử dụng ở phía ngƣời kiểm tra dấu thủy vân. Cũng giống nhƣ các
hệ mật mã, từ khóa công khai khó có thể suy ra đƣợc khóa bí mật. Do
không phải thực hiện quá trình trao đổi khóa nên các lƣợc đồ thủy vân khóa
công khai thƣờng an toàn hơn và dễ dàng triển khai trong thực tế.
Phân loại theo sự hiện diện của dấu thủy vân:
Ngoài hai cách phân loại ở trên, dựa vào sự hiển thị hay không hiển thị
(ẩn) của dấu thủy vân trên các sản phẩm chứa dấu thủy vân ngƣời ta có thể
phân thành hai loại nhƣ:

Số hóa bởi Trung tâm Học liệu – ĐHTN
12


Thủy vân số

Thủy vân ẩn

Thủy vân hiện

Hình 1.3. Phân loại thủy vân theo sự hiện diện của dấu thủy vân.

Trong Hình 1.3, thủy vân hiện gồm các lƣợc đồ cho phép dấu thủy vân
hiển thị trên sản phẩm cần bảo vệ. Các dấu thủy vân này thƣờng là các logo
của các tổ chức. Một ví dụ điển hình về thủy vân hiện là biểu tƣợng của các
đài truyền hình đƣợc hiển thị trên màn hình tivi. Không giống nhƣ thủy vân
hiện, trong thủy vân ẩn, dấu thủy vân ẩn lấp dƣới dữ liệu cần bảo vệ. Và
bằng mắt thƣờng, ngƣời dùng khó có thể phân biệt sự khác biệt giữa dữ
liệu chứa dấu thủy vân và dữ liệu không chứa dấu thủy vân. Nói một cách
khác, dấu thủy vân trong suốt đối với ngƣời dùng. Dạng thủy vân ẩn hay
đƣợc sử dụng để phát hiện ra sự tấn công trái phép của các đối thủ, những
ngƣời muốn xuyên tạc thông tin hay làm giả các sản phẩm đa phƣơng tiện.
Ngoài 3 cách phân loại cơ bản nhƣ trên, dựa vào kiểu dữ liệu chứa dấu
thủy vân ngƣời ta cũng có thể phân thành: thủy vân trên ảnh số, thủy vân
trên video, thủy vân trên âm thanh và thủy vân trên cơ sở dữ liệu. Do mỗi
kiểu dữ liệu có những đặc trƣng khác nhau nên các lƣợc đồ thủy vân tƣơng
ứng cũng có cách tiếp cận riêng. Tuy nhiên, cũng có những phƣơng pháp
nhúng dấu thủy vân không phụ thuộc vào kiểu dữ liệu.
1.1.4. Thủy vân CSDL quan hệ
Ngày nay, việc sử dụng các cơ sở dữ liệu trong các ứng dụng càng ngày
càng tăng lên đang tạo ra một nhu cầu tƣơng tự đối với thủy vân cơ sở dữ
liệu. Internet hiện đang đƣa đến một sức ép rất nặng nề cho những ngƣời
Số hóa bởi Trung tâm Học liệu – ĐHTN
13


bảo vệ dữ liệu trong việc tạo ra các dịch vụ cho phép ngƣời sử dụng tìm
kiếm và truy cập cơ sở dữ liệu từ xa. Mặc dù xu hƣớng này là hữu ích cho
ngƣời dùng cuối nhƣng nó cũng bộc lộ một mối nguy hiểm cho những nhà
cung cấp dữ liệu trƣớc những kẻ trộm cắp dữ liệu. Do đó, những ngƣời
cung cấp dữ liệu đòi hỏi phải có công nghệ nhận dạng đƣợc những bản sao
các cơ sở dữ liệu của họ bị đánh cắp.

Cho dù có khá nhiều điều có thể học hỏi đƣợc từ các kết quả đã đạt
đƣợc về thủy vân dữ liệu đa phƣơng tiện nhƣng cho đến nay vẫn còn rất
nhiều thách thức kỹ thuật mới đối với lĩnh vực thủy vân các cơ sở dữ liệu
quan hệ bởi vì các dữ liệu quan hệ và các dữ liệu đa phƣơng tiện khác nhau
ở khá nhiều khía cạnh quan trọng. Chẳng hạn nhƣ, các phần khác nhau của
một đối tƣợng đa phƣơng tiện không thể cắt bỏ hoặc thay thế một cách tùy
ý mà không gây ra những thay đổi về cảm quan trong đối tƣợng. Ngƣợc lại,
việc thêm, bớt và cập nhật các bộ của một bảng quan hệ lại là những phép
toán chuẩn trong cơ sở dữ liệu. Do những khác nhau này mà các kỹ thuật
đƣợc phát triển cho các dữ liệu đa phƣơng tiện không thể đƣợc sử dụng
trực tiếp để thủy vân các quan hệ.
Thuỷ vân cơ sở dữ liệu quan hệ là phƣơng pháp nhúng một lƣợng thông
tin nào đó vào trong cơ sở dữ liệu quan hệ. Thuỷ vân cơ sở dữ liệu quan hệ
là thuỷ vân ẩn, bền vững.
Một thuỷ vân có thể đƣợc áp dụng cho bất kỳ một cơ sở dữ liệu quan hệ
nào có các thuộc tính mang một đặc điểm là những thay đổi nhỏ tại một số
giá trị của chúng không làm ảnh hƣởng đến các ứng dụng.
Một ví dụ khác là các nhà xuất bản sách khi in các bảng toán học (nhƣ
các bảng logarit và lịch thiên văn) thƣờng đƣa vào một số lỗi nhỏ để có thể
dễ dàng nhận dạng các bản sao bị ăn cắp.
Đối với hầu hết các cơ sở dữ liệu quan hệ trong đó có chứa các tham số
thì những sai lệch do hệ thống thuỷ vân gây ra có thể đƣợc điều chỉnh sao
cho chúng nằm trong miền dung sai của độ đo.
Số hóa bởi Trung tâm Học liệu – ĐHTN
14


1.2. Các tính chất của thủy vân trên CSDL quan hệ
Có thể thấy rằng thủy vân cơ sở dữ liệu quan hệ có những thách thức
kỹ thuật và có các ứng dụng trong thực tế cao, do đó cần phải phát triển

một hệ thống thủy vân và kèm theo đó là các kỹ thuật nhất định. Những kỹ
thuật này chắc chắn sẽ dựa phần lớn vào các nguyên tắc thủy vân đang tồn
tại. Tuy nhiên, chúng cũng sẽ đòi hỏi phải có những mở rộng và các sáng
kiến mới.
Để minh họa cho sự khả thi của một lƣợc đồ thủy vân cơ sở dữ liệu
quan hệ, một kỹ thuật hữu hiệu thỏa mãn những tiêu chuẩn của một hệ
thống thủy vân. Kỹ thuật này chỉ đánh dấu các thuộc tính (trƣờng) có kiểu
dữ liệu số thực và giả thiết là các trƣờng đƣợc đánh dấu có thể chấp nhận
những thay đổi nhỏ ở một số giá trị.
Ý tƣởng chính là đảm bảo tại một số vị trí bit của một số thuộc tính
trong một số bộ có chứa các giá trị nhất định. Các bản ghi (bộ), các thuộc
tính trong một bộ, các vị trí bit trong một thuộc tính và các giá trị bit nhất
định này đều phải đƣợc xác định một cách chính xác và logic dƣới sự kiểm
soát của một khóa bí mật của chủ nhân CSDL quan hệ. Mẫu bit này sẽ hình
thành ra thủy vân. Chỉ duy nhất chủ nhân của khóa bí mật mới có thể tìm
lại đƣợc thủy vân với một xác suất cao. Các phân tích chi tiết chỉ ra rằng
thủy vân này có thể bền vững trƣớc các tấn công gây hại khác nhau.
Giả thiết, Alice là chủ nhân của CSDL quan hệ R chứa  bộ, trong
đó cô đã đánh dấu  bộ. Hệ thống thủy vân cần phải thỏa mãn những tính
chất sau đây.
1.2.1. Khả năng có thể phát hiện
Alice cần phải có khả năng phát hiện thủy vân của cô bằng cách xem
xét  bộ từ cơ sở dữ liệu nghi ngờ. Rõ ràng là nếu mẫu bít của cô thủy vân
có mặt ở tất cả  bộ thì cô có lý do xác đáng để nghi ngờ có sự sao chép
trái phép. Tuy nhiên, Alice cũng có thể ngờ vực ngay cả khi mẫu của cô chỉ
có mặt ở ít nhất là 𝑡bộ (t), trong đó t phụ thuộc vào  và một giá trị
Số hóa bởi Trung tâm Học liệu – ĐHTN
15



cho trƣớc, đƣợc gọi là mức ý nghĩa của phép thử. Giá trị của t đƣợc xác
định sao cho xác suất để Alice sẽ tìm thấy mẫu bit của cô trong ít nhất t bộ
từ  bộ là nhỏ hơn .
1.2.2. Tính bền vững và dễ vỡ
Các dấu thủy vân cần phải bền vững trƣớc những tấn công nhằm xóa
bỏ. Khi đó, nói rằng thủy vân là an toàn đối với tấn công này nếu kẻ tấn
công không thể phá hủy các dấu hiệu thủy vân ở ít nhất tbộ, trong đó t
phụ thuộc vào  và .
Ngƣợc lại với thủy vân bền vững, trong các lƣợc đồ thủy vân dễ vỡ, khi
có bất kỳ tấn công nào lên dữ liệu thì các thủy vân không còn nguyên vẹn.
Vì vậy, kẻ tấn công dữ liệu mong muốn thay đổi  bộ trong quan hệ r của
chủ sở hữu mà vẫn không làm thay đổi thủy vân. Khi đó, nếu những thay
đổi của kẻ tấn công làm thay đổi các thủy vân đƣợc giấu thì ta có thể kết
luận rằng quan hệ đã bị tấn công.
1.2.3. Khả năng cập nhật phần tăng thêm
Sau khi có quan hệ R đã thủy vân, Alice có thể cập nhật R khi cần thiết
mà không làm hỏng thủy vân. Khi Alice thêm, bớt các bộ hoặc sửa đổi các
giá trị của các thuộc tính của R, thủy vân cần phải có khả năng cập nhật
trên những phần gia tăng. Tức là, các giá trị thủy vân chỉ phải tính toán lại
đối với các bộ đƣợc thêm vào hoặc bị sửa đổi.
1.2.4. Không dễ cảm nhận đƣợc
Thuỷ vân ẩn, không dễ nhận thấy đƣợc bằng mắt thƣờng của con ngƣời.
Sự thay đổi do các dấu hiệu thuỷ vân gây ra cho dữ liệu quan hệ không
đƣợc làm giảm giá trị sử dụng của cơ sở dữ liệu. Hơn nữa, các phép đo
thống kê thông thƣờng nhƣ trung bình, phƣơng sai của các thuộc tính số
cũng không nên bị ảnh hƣởng đáng kể.
1.3. Một số phép tấn công trên hệ thủy vân CSDL quan hệ
Để biện luận đƣợc đơn giản, ta sử dụng ba nhân vật điển hình vẫn
thƣờng đƣợc dùng trong các ví dụ về mật mã, giấu tin và thủy vân. Đó là
Số hóa bởi Trung tâm Học liệu – ĐHTN

16


một cô gái tên là Alice và bạn trai của cô tên là Bob. Hai ngƣời này thƣờng
hay gửi thƣ cho nhau và ở giữa là một anh chàng tên là Mallory thƣờng
xuyên làm phiền họ.
Do cơ sở dữ liệu quan hệ luôn luôn đƣợc cập nhật nên thuỷ vân đƣợc
giấu trong một cơ sở dữ liệu quan hệ có thể bị mất do những cập nhật thông
thƣờng (thêm, sửa, xóa) cũng nhƣ các tấn công có mục đích.
1.3.1. Cập nhật thông thƣờng
Giả thiết Mallory lấy trộm đƣợc dữ liệu của Alice mà không thể nhận ra
nó đã đƣợc thủy vân. Sau đó, Mallory tiến hành cập nhật dữ liệu đã ăn trộm
khi anh ta sử dụng nó.
Kỹ thuật đánh dấu cần đảm bảo rằng Alice không bị mất thủy vân của
cô ngay trong các dữ liệu bị ăn trộm, thậm chí đối với cả những cập nhật
của Mallory. Tức là các phép toán cập nhật thông thƣờng nhƣ xóa, sửa, bổ
sung các bộ trong cơ sở dữ liệu quan hệ.
Các kỹ thuật thuỷ vân cần đảm bảo rằng ngƣời chủ cơ sở dữ liệu không
bị mất thuỷ vân ngay trong dữ liệu bị kẻ khác ăn trộm, thậm chí đối với
những cập nhật của tên trộm đó.
1.3.2. Tấn công có chủ đích
Mallory có thể biết dữ liệu anh ta ăn trộm có chứa thủy vân, nhƣng anh
ta có thể cố xóa thủy vân này hoặc thử dùng các phƣơng tiện khác để đòi
quyền sở hữu trái phép. Hệ thống đánh dấu cần phải bảo vệ Alice trƣớc
những tấn công gây hại của Mallory. Nghĩa là các cơ sở dữ liệu có thể bị
những kẻ xấu ăn trộm, tấn công nhằm mục đích đòi quyền sở hữu trái phép
hay phá huỷ dữ liệu, phá huỷ thuỷ vân,... Do đó, hệ thống thuỷ vân cần
phải bảo vệ ngƣời chủ cơ sở dữ liệu trƣớc những tấn công gây hại của kẻ
trộm.
1.4. Các ứng dụng chủ yếu của thủy vân trên CSDL quan hệ

Có rất nhiều ứng dụng của thủy vân trên tài liệu số. Nhƣng có 2 ứng
dụng quan trọng và đƣợc sử dụng phổ biến là:
Số hóa bởi Trung tâm Học liệu – ĐHTN
17


1.4.1. Bảo vệ bản quyền CSDL
Đây là ứng dụng quan trọng nhất của thủy vân số. Một thông điệp đƣợc
nhúng vào dữ liệu để chứng minh quyền sở hữu của tác giả (gọi là
watermark hay thủy vân) trƣớc khi các dữ liệu này đƣợc đƣa lên mạng.
Thủy vân này chỉ có ngƣời sở hữu sản phẩm mới có và đƣợc sử dụng làm
minh chứng bản quyền của sản phẩm. Yêu cầu quan trọng với ứng dụng
này là tính bền vững của thủy vân, để ngƣời khác khó có thể gỡ chúng ra
khỏi các sản phẩm số đó.
1.4.2. Xác thực tính toàn vẹn của CSDL
Thủy vân số có thể đƣợc dùng để xác thực thông tin hay phát hiện giả
mạo. Thủy vân đƣợc dùng để kiểm tra xem dữ liệu là nguyên gốc hay đã
chịu sự tác động bằng các phƣơng pháp tấn công thông thƣờng. Ngƣời ta
thƣờng dùng phƣơng pháp thủy vân dễ vỡ để nhúng thông tin vào dữ liệu.
Nếu dữ liệu bị tác động bằng các phƣơng pháp xử lý thông thƣờng, thủy
vân sẽ không còn nguyên vẹn.
1.4.3. Dán nhãn
Trong ứng dụng này, thủy vân đƣợc dùng để nhận diện ngƣời gửi hay
ngƣời nhận thông tin. Ví dụ với trƣờng hợp nhận diện ngƣời nhận: Một bức
ảnh ban đầu bán cho các khách hàng khác nhau. Nó sẽ đƣợc nhúng
watermark là chữ ký của từng khách hàng tƣơng ứng. Sau đó, ảnh đƣợc
chuyển cho các khách hàng. Mỗi khách hàng có thể kiểm tra watermark
trong ảnh để chắc chắn ảnh đó chuyển cho mình.
1.4.4. Điều khiển truy cập
Trƣờng hợp khách hàng sử dụng các dịch vụ truyền hình, nhƣ trả tiền

cho các kênh truyền hình hay hoặc mua các đĩa phim mới. Mỗi khách hàng
sẽ có một set-top box và một thẻ thông minh (smart card), các thiết bị này
sẽ có định danh duy nhất, đại diện cho khách hàng.
Để ngăn chặn những ngƣời sử dụng dịch vụ mà không trả tiền, nhà
cung cấp dịch vụ sẽ mã hóa dữ liệu sử dụng các khóa trƣớc khi chuyển đến
Số hóa bởi Trung tâm Học liệu – ĐHTN
18


cho khách hàng. Khi smart card của khách hàng còn hiệu lực, set-top sẽ
giải mã dữ liệu chuyển đến. Sau đó, nó nhúng thủy vân là định danh của
ngƣời dùng vào dữ liệu đó. Quá trình ấy đƣợc gọi là ghi dấu vân tay
(fingerprinting). Dữ liệu sau khi đã đƣợc ghi dấu vân tay sẽ đƣợc sử dụng
bình thƣờng. Nếu một kháchhàng nào đó cố tình cho ngƣời khác sử dụng
trái phép những dữ liệu ấy, nhà cung cấp dịch vụ sẽ biết điều đó và ngăn
chặn hoặc xử phạt.
1.4.5. Điều khiển sao chép
Tất cả các ứng dụng của thủy vân số trình bày ở trên chỉ có tác dụng
sau khi ngƣời dùng đã làm sai. Khi có sự vi phạm bản quyền xảy ra, thì
mới dùng thủy vân để xác định chính xác ai là chủ sở hữu thực sự, hoặc sau
khi một bức ảnh đã bị thay đổi mới dùng thủy vân để xác định bức ảnh nào
là giả mạo,… Ứng dụng điều khiển sao chép có tác dụng ngăn chặn hành
động sai, cụ thể là ngăn chặn việc sao chép trái phép các nội dung có bản
quyền.
Ví dụ: Hệ thống quản lý sao chép DVD. Các thiết bị phát hiện thủy vân
sẽ đƣợc tích hợp vào thiết bị đọc ghi DVD. Khi muốn sao chép DVD, phải
có sự đồng ý của chủ sở hữu.
1.5. Thủy vân CSDL không thuận nghịch bằng phƣơng pháp LSB
Giống nhƣ các kiểu dữ liệu đa phƣơng tiện khác, trong những năm đầu
phát triển, các phƣơng pháp thủy vân cơ sở dữ liệu không có khả năng khôi

phục lại cơ sở dữ liệu gốc từ dữ liệu thủy vân. Đối với loại thủy vân này,
phƣơng pháp chèn bít thấp là một trong những phƣơng pháp phổ biến, bởi
dữ liệu sau khi nhúng có ít sự thay đổi so với dữ liệu gốc.
Kỹ thuật thủy vân sử dụng các bít LSB chỉ sử dụng các thuộc tính kiểu
số với giả thiết rằng sự thay đổi nhỏ về giá trị không làm ảnh hƣởng đến ý
nghĩa của thuộc tính. Ta ký hiệu quan hệ dùng để nhúng thủy vân là:
𝑅(𝑃 ; 𝐴1 , . . . , 𝐴𝑛 )

Số hóa bởi Trung tâm Học liệu – ĐHTN
19


trong đó, P là thuộc tính khóa chính và giả sử rằng các thuộc tính 𝐴𝑖 đều có
thuộc kiểu dữ liệu số, nếu không thì ta chỉ chọn các trƣờng kiểu số. Các
thuộc tính 𝐴𝑖 có chung tính chất là nếu thay đổi giá trị của bít thấp thứ 𝑘 thì
đều không ảnh hƣởng đến ý nghĩa của trƣờng.
Các bít ít ý nghĩa nhất (LSB – Least Significant Bits) là các bít ở bên
phải nhất của một chuỗi bít.
Ví dụ, trong chuỗi bít 11110000 thì các bít bít ít ý nghĩa nhất là 0 nhƣ
hình sau:

Hình 1.1. Khái niệm các bít có ý nghĩa thấp
Kỹ thuật thủy vân dựa vào các bít ít ý nghĩa nhất sử dụng hàm băm
mật mã để xây dựng mã xác thực (MAC – Message Authentication Code).
Để tính MAC của thông điệp (dãy byte có độ dài tùy ý) ta sử dụng hàm
băm 𝐻 nào đó nhƣ sau:
𝑀𝐴𝐶 = 𝐻(𝑀)
Trong đó, H là một trong những hàm băm cho trƣớc nhƣ
𝑀𝐷5, 𝑆𝐻𝐴1, 𝑆𝐻𝐴2, . .. Khi đó MAC có độ dài cố định và không phụ thuộc
vào độ dài của thông điệp M. Ngoài ra, hàm băm 𝐻 là hàm một chiều,

nghĩa là từ M tính MAC thì dễ dàng nhƣng từ MAC không thể suy ra đƣợc
𝑀.
Để tính MAC của bản ghi bất kỳ, các lƣợc đồ thủy vân xác định theo
công thức sau:
𝑀𝐴𝐶 = 𝐻(𝑆𝑘 ||𝐻(𝑃| 𝑆𝑘 )
Trong đó, 𝑆𝑘 là khóa bí mật và 𝑃 là giá trị của trƣờng khóa chính của
bản ghi đang xét, phép toán || dùng để ghép hai dãy.
Số hóa bởi Trung tâm Học liệu – ĐHTN
20


1.5.1. Thuật toán nhúng thủy vân
Thuật toán nhúng thủy vân sẽ chọn ra các bộ dữ (bản ghi) bao gồm các
thuộc tính và giá trị của thuộc tính, rồi tiến hành thay đổi giá trị của các bít
thấp của chúng.
Để đảm bảo an toàn, việc chọn các bản ghi, các thuộc tính để nhúng
thủy vân đều đƣợc chọn ngẫu nhiên và ngay cả vị trí bít thấp ứng với thuộc
tính đƣợc chọn cũng đƣợc xác định ngẫu nhiên.
Nội dung thuật toán nhúng thuỷ vân
Input:
- Quan hệ 𝑅 dùng để thủy vân
- Dãy bít thủy vân 𝐵 = 𝑏1 … . 𝑏𝑤
- Khóa bí mật 𝑆𝑘 chỉ chủ sở hữu CSDL mới biết
- 𝑛 là số thuộc tính số
- Tham số điều khiển khả năng nhúng tin 𝑌
- 𝑘 số bít thấp không ảnh hƣởng đến ý nghĩa của các thuộc tính số
Output:
- Quan hệ 𝑅 ′ chứa dẫy bít thủy vân
Thuật toán duyệt từng bản ghi 𝑟 ∈ 𝑅 mỗi bản thực hiện các bƣớc:
Bƣớc 1: Tính giá trị MAC của bản ghi

𝑀𝐴𝐶 = 𝐻(𝑆𝑘 ||𝐻(𝑟. 𝑃| 𝑆𝑘 )
Trong đó, r.P là giá trị của thuộc tính khóa của bản ghi r.
Bƣớc 2: Kiểm tra điều kiện nhúng
Nếu MAC mod Y ≠ 0 thì bản ghi r không dùng để nhúng tin. Nếu
trái lại thì sẽ nhúng tin vào bản ghi r, thuật toán đến Bƣớc 3.
Bƣớc 3: Xác định thuộc tính nhúng tin
Giả sử tập thuộc tính số đang xét là 𝐴1 … 𝐴𝑛 , các thuộc tính này đã
đƣợc sắp xếp theo tên của thuộc tính. Thuật toán sẽ xác định thuộc tính 𝐴𝑣
để nhúng tin theo công thức:
Số hóa bởi Trung tâm Học liệu – ĐHTN
21


𝑣 = 𝑀𝐴𝐶 𝑚𝑜𝑑 𝑛
Bƣớc 4: Xác định vị trí bít thấp để chứa tin
Sau khi xác định đƣợc thuộc tính 𝐴𝑣 dùng để chứa tin, thuật toán sẽ tiếp
tục xác định vị trí bít 𝑝 để chứa bít thủy vân nhƣ sau:
𝑝 = 𝑀𝐴𝐶 𝑚𝑜𝑑 𝑘
Bƣớc 5: Nhúng bít thủy vân
Việc chèn bít thủy vân 𝑏𝑖 vào vị trí bít thứ 𝑝 của giá trị thuộc tính 𝐴𝑣
đƣợc thực hiện đơn giản bằng phép toán thiết lập bít để nhận đƣợc giá trị
mới nhƣ sau:
𝐴𝑣 = 𝑏𝑖𝑡𝑠𝑒𝑡(𝐴𝑣 , 𝑏𝑖 , 𝑝)
Quá trình đó đƣợc thực hiện cho đến khi nhúng hết các bít thủy vân
hoặc duyệt hết các bản ghi.
1.5.2. Thuật toán trích dấu thủy vân
Để xác định quan hệ 𝑅 ′ có thuộc về tác giả có thủy vân W hay không?
Thuật toán thực hiện trích dãy bít thủy vân 𝐵 trên quan hệ này cùng với các
tham số do tác giả của 𝑊 cung cấp. Sau khi trích đƣợc dãy bít 𝐵, thuât toán
so sánh sự khác biệt giữa 𝐵 và 𝑊, nếu sự khác biệt nhỏ hơn một ngƣỡng

cho trƣớc thì kết luận quan hệ 𝑅 ′ thuộc về tác giả, trái lại thi không thuộc
về tác giả.
Input:
- Quan hệ 𝑅 ′ chƣa dấu thủy vân
- Khóa bí mật 𝑆𝑘
- 𝑛 là số thuộc tính số
- Tham số điều khiển khả năng nhúng tin 𝑌
- 𝑘 số bít thấp không ảnh hƣởng đến ý nghĩa của các thuộc tính số
Output:
- Dãy bít thủy vân 𝐵 = 𝑏1 … . 𝑏𝑤
Nội dung thuật toán

Số hóa bởi Trung tâm Học liệu – ĐHTN
22


Thuật toán duyệt từng bản ghi 𝑟 ′ ∈ 𝑅 ′ mỗi bản thực hiện các bƣớc:
Bƣớc 1: Tính giá trị MAC của bản ghi
𝑀𝐴𝐶 = 𝐻(𝑆𝑘 ||𝐻(𝑟 ′ . 𝑃′ | 𝑆𝑘 )
Bƣớc 2: Kiểm tra điều kiện nhúng
Nếu MAC mod Y ≠ 0 thì bản ghi 𝑟 ′ không nhúng tin. Nếu trái lại
thì bản ghi 𝑟 ′ , thuật toán đến Bƣớc 3.
Bƣớc 3: Xác định thuộc tính trich tin
Giả sử tập thuộc tính số đang xét là 𝐴1 … 𝐴𝑛 , các thuộc tính này đã
đƣợc sắp xếp theo tên của thuộc tính. Thuật toán sẽ xác định thuộc tính 𝐴𝑣
để nhúng tin theo công thức:
𝑣 = 𝑀𝐴𝐶 𝑚𝑜𝑑 𝑛
Bƣớc 4: Xác định vị trí bít thấp trích tin
Sau khi xác định đƣợc thuộc tính 𝐴𝑣 dùng để trích tin, thuật toán sẽ tiếp
tục xác định vị trí bít 𝑝 chứa bít thủy vân nhƣ sau:

𝑝 = 𝑀𝐴𝐶 𝑚𝑜𝑑 𝑘
Bƣớc 5: Trích bít thủy vân
Việc trich bít thủy vân 𝑏𝑖 tại vị trí bít thứ 𝑝 của giá trị thuộc tính 𝐴𝑣
đƣợc thực hiện đơn giản bằng phép toán bitget mới nhƣ sau:
𝑏𝑖 = 𝑏𝑖𝑡𝑔𝑒𝑡(𝐴𝑣 , 𝑝)
Khi đó, dẫy bít thủy vân B là tập hợp các bít 𝑏𝑖 đã trích đƣợc tại Bƣớc 5
của mỗi lần lặp. Việc xác định bản quyền có thể đƣợc xác định nhƣ sau:
𝜀=𝑊 ⊕ 𝐵
Trong đó, phép toán ⊕ dùng để so sánh theo bít giữa hay dãy nhị phân.
Nếu

𝜀 < 𝜏 thì kết luận cơ sở dữ liệu thuộc về tác giả có thủy vân W,

trái lại thì kết luận là không thuộc về tác giả.

Số hóa bởi Trung tâm Học liệu – ĐHTN
23


CHƢƠNG 2.

THỦY VÂN CSDL QUAN HỆ BẲNG GIẢI

THUẬT DI TRUYỀN VÀ PHƢƠNG PHÁP MỞ RỘNG
1.6. Một số phƣơng pháp thủy vân trên CSDL quan hệ
Ngày nay, Truy cập Internet dễ dàng đã góp phần tăng trƣởng sự phát
triển của kinh tế và nghiên cứu, ở đó, chia sẻ thông tin online là hoạt động
quan trọng liên quan đến CSDL mua và bán. Ví dụ nhƣ việc chia sẻ dữ liệu
về thời tiết, thị trƣờng chứng khoán, tiêu thụ điện năng, xu hƣớng ngƣời
tiêu dùng, y tế, khoa học,… Kết quả là sự cần thiết cung cấp cơ chế bảo

mật cho CSDL để ngăn chặn các hành vi sao chép và tái phân phối trái
phép trên Internet. Trong ngữ cảnh này, chứng minh quyền sở hữu và xác
định vùng giả mạo của CSDL là một vấn đề thách thức đặt ra đối với các
nhà nghiên cứu.
Thủy vân số cung cấp giải pháp cho rất nhiều các vấn đề gặp phải khi
phân phối các đối tƣợng đa phƣơng tiện nhƣ: ảnh, text, audio, và bảo vệ
CSDL quan hệ một cách hiệu quả. Tuy nhiên vấn đề gặp phải đối với cơ sở
dữ liệu quan hệ là khả năng nhúng tin là rất hạn chế so với các loại dữ liệu
đa phƣơng tiện khác nhƣ ảnh hay âm thanh. Mặt khác, đối với dữ liệu trong
các cơ sở dữ liệu chỉ chấp nhận sự thay đổi rất nhỏ so với dữ liệu gốc. Bởi
việc thay đổi nhiều có thể dẫn đến dữ liệu trong sau khi nhúng thủy vân
không còn ý nghĩa sử dụng.
Agrawal và Kiernan(2002) [6] đã bắt đầu thực hiện việc nhúng dấu
thủy vân vào các bít thấp của dữ liệu trong cơ sở dữ liệu làm minh chứng
để bảo vệ bản quyền tác giả. Việc nhúng dấu thủy vân vào bít thấp của dữ
liệu đảm bảo đƣợc sự thay đổi nhỏ, tuy nhiên các hack cũng có thể loại bỏ
toàn bộ các bít thấp của dữ liệu mà ít thay đổi ý nghĩa của dữ liệu. Điều đó
cũng có nghĩa thông tin về bản quyền cũng dễ dàng bị loại bỏ. Đây là một
trong những điều khó có thể chấp nhận trong các phƣơng pháp thủy vân
bền vững.

Số hóa bởi Trung tâm Học liệu – ĐHTN
24


Ở một nghiên cứu khác Sion và các cộng sự (2004) [7] thực hiện chọn
một số bộ (bản ghi) thông qua hàm băm để thực hiện nhúng các bít thủy
vân. Mỗi bản ghi đƣợc chọn Sion sẽ thực hiện nhúng một bít thủy vân vào
giá trị của hai thuộc tính (trƣờng). Tuy nhiên sau khi nhúng giá trị mới có
thể vƣợt ra ngoài miền giá trị của thuộc tính, điều này dẫn đến các dữ liệu

đột biến hay kỳ dị trong cơ sở dữ liệu. Do vậy Sion và các đồng sự thực
hiện quá trình đánh giá khả năng chịu đựng sự biến đối (kháng lỗi) của hai
thuộc tính, nếu sau khi nhúng một bít mà giá trị mới vƣợt ra ngoài khả năng
kháng lỗi thì bản ghi đó không đƣợc dùng để nhúng thủy vân và bít thủy
vân đƣợc chuyển sang bản ghi kế tiếp đã đƣợc chọn.
Giải thuật di truyền và tìm kiếm mẫu đã đƣợc sử dụng để nhúng dấu
thủy vân vào cơ sở dữ liệu quan hệ thông qua hàm cực tiểu hoặc cực đại.
Tuy nhiên khả năng kháng lỗi của dữ liệu sau khi nhúng còn khá hạn chế.
Mailing và các cộng sự (2008) [5] sử dụng giải thuật di truyền trong quá
trình xử lý dấu thủy vân để nhúng vào cơ sở dữ liệu quan hệ, tuy nhiên
phƣơng pháp này chỉ tập trung vào việc xử lý dấu thủy vân mà không tập
trung vào việc tìm giải pháp tốt đối với dữ liệu trong cơ sở dữ liệu quan hệ.
Ngoài ra, các phƣơng pháp đã đề cập không có khả năng khôi phục lại dữ
liệu gốc từ dữ liệu thủy vân. Đây là một hạn chế đáng kể của các phƣơng
pháp trên.
Kỹ thuật thủy vân dựa trên phép biến đổi mở rộng hiệu (DEW –
Difference Expand) đã đƣợc [4] ứng dụng trong việc bảo vệ bản quyền cơ
sở dữ liệu quan hệ. Phƣơng pháp DEW có khả năng khôi phục lại cơ sở dữ
liệu gốc từ dữ liệu thủy vân. Do vậy khách hàng có thể sử dụng thử trên cơ
sở dữ liệu đã thủy vân và họ có thể sử dụng dữ liệu gốc bằng cách mua
khóa (key) để khôi phục lại dữ liệu gốc. Nội dung tiếp theo luận văn trình
bày chi tiết phƣơng pháp mở rộng hiệu, ký hiệu DE (Difference Expand).

Số hóa bởi Trung tâm Học liệu – ĐHTN
25


×