Tải bản đầy đủ (.docx) (56 trang)

Bảo vệ sự toàn vẹn của cơ sở dữ liệu quan hệ bằng kỹ thuật thủy vân

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (440.71 KB, 56 trang )

TRẰN THỊ KIM DUNG
BẢO VỆ sự TOÀN VẸN CỦA cơ SỞ DỮ LIỆU
• • • • QUAN HỆ BẰNG KỸ THUẬT THỦY VÂN
LUẬN VĂN THẠC SĨ MÁY TÍNH
TRẦN THỊ KIM DUNG
BẢO VỆ sự TOÀN VẸN CỦA cơ SỞ DỮ LIỆU
a a a •
Bộ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC sư PHẠM HÀ NỘI 2
HÀ NỘI,
2014
QUAN HỆ BẰNG KỸ THUẬT THỦY YÂN
Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60 48 01 01
LUẬN VĂN THẠC SĨ MÁY TÍNH
Người hướng dẫn khoa học: PGS. TS BÙI THẾ HỒNG
Bộ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC sư PHẠM HÀ NỘI 2
HÀ NỘI,
2014
LỜI CẢM ƠN
Đe hoàn thảnh luận văn này tôi đã nhận được sự giúp đỡ tận tình của
thầy hướng dẫn khoa học, của các thày cô trường Đại học Sư phạm Hà Nội
2. Tôi xin chân thảnh cảm ơn các thầy cô trường Đại học Sư phạm Hà Nội 2
đã tạo điều kiện học tập, nghiên cứu và giúp đỡ tôi rất nhiều trong quá trình
làm luận văn. Đặc biệt tôi xin cảm ơn thầy PGS.TS Bùi Thế Hồng đã tận tình
hướng dẫn, chỉ bảo tôi ừong suốt quá trình học tập, nghiên cứu đề tài và
giúp tôi hoàn thảnh bản luận văn này.
Vĩnh Phúc, ngày 12 tháng 12 năm
2014 Hoc viên ■
Trần Thị Kim Dung
LÖI CAM DOAN


Toi xin cam doan luän van “Bäo ve sw toän ven cüa cct s& die lieu
«• • • quart he bang ky thuat thüy
van” la ket qua nghien emi cüa rieng toi duoi sy huong din khoa hoc cüa
PGS. TS Büi Th§ H6ng.
Cäc so lieu, ket qua neu trong luan van lä trung thuc vä chua titng
duoc cong bo trong bat ky cöng trinh näo khäc.
Hoc vien
Trän Thi Kim Dung
MỤC
LỤC
DANH MUC CÁC KÝ HIÊU, VIẾT TẤT
Ký hiệu Diễn giải Y nghĩa
CSDL Cơ sở dữ liệu
RBTV Ràng buộc toàn vẹn
MKSD Multi Key Single Data Đa khóa, đơn dữ liệu
SKMD Single Key Multi Data Đơn khóa, đa dữ liệu
LSB Least Significat Bit Bít ít ý nghĩa
EMC Encrypted Mark Code Mã đánh dâu được mã hóa
BCH Bose-Chaudhuri-Hocquenhem
SVR Support Vector Regression Hôi qui vector hô trợ
Sô hiệu
bảng
Tên bảng Trang
2.1 Danh mục các ký hiệu 27
3.1 Thông tin trong môi giao dịch 36

hiệu
hình
Tên hình Trang
1.1 Sơ đô biêu diên quá trình giâu tin 4

1.2 Sơ đô biêu diên quá trình giải mã 5
1.3 Phân loại kỹ thuật giâu tin 6
1.4 Cách phân loại thủy vân tiêu biêu 11
MỤC
LỤC
1.5
Mô tả kỹ thuật thủy vân cơ bản cho các cơ sở dữ liệu quan
hệ
14
2.1
Kỹ thuật thủy vân với cơ chê xác thực công khai vào thực

33
3.1 Giao diện chính của chương trình thực nghiệm 36
3.2 Minh họa các bước tạo ra R mã hóa 37
3.3 Minh họa các bước lây thủy vân WM” 38
3.4 Thủy vân sô gôc được dùng trong thực nghiệm 39
3.5 Giao diện chương trình mô hình thực nghiệm 1 39
3.6 a) Thủy vân gôc; b) Thủy vân thu được theo thực nghiệm 1 40
3.7 Giao diện chương trình mô hình thực nghiệm 2 40
3.8 a) Thủy vân gôc; b) Thủy vân thu được theo thực nghiệm 2 41
3.9 Giao diện chương trình mô hình thực nghiệm 3 41
3.10 a) Thủy vân gôc; b) Thủy vân thu được theo thực nghiệm 3 42
3.11 Giao diện chương trình mô hình thực nghiệm 4 42
3.12 a) Thủy vân gôc; b) Thủy vân thu được theo thực nghiệm 4 43
MỤC
LỤC
MỞ ĐẦU
1. Lý do chọn đề tài
Ngày nay, việc sử dụng các cơ sở dữ liệu, đặc biệt là cơ sở dữ liệu quan

hệ ừong các ứng dụng ngày càng tăng. Tốc độ phát triển Internet và các công
nghệ có liên quan đang đưa đến một sức ép khá nặng nề cho những người bảo
vệ dữ liệu trong việc tạo ra các dịch vụ (thường được gọi là các dịch vụ web
hoặc các tiện ích điện tử) cho phép người dùng có thể tìm kiếm và truy cập cơ
sở dữ liệu tò xa hoặc trong các dịch vụ thuê khoán bên ngoài. Mặc dù các xu
hướng này là hữu ích cho người dùng cuối nhưng nó cũng bộc lộ mối nguy
hiểm cho những nhà cung cấp dữ liệu trước những kẻ trộm cắp và giả mạo dữ
liệu. Do đó, những nhà cung cấp dữ liệu đòi hỏi phải có các công cụ hỗ trợ cho
việc bảo vệ bản quyền sản phẩm của họ, nhận dạng được những bản sao các cơ
sở dữ liệu bị đánh cắp hoặc bị xuyên tạc với ý đồ xấu.
Một trong những công cụ rất hữu ích dùng để bảo vệ bản quyền và
chống giả mạo đối với các cơ sở dữ liệu quan hệ đó là kỹ thuật thủy vân số.
Hiện tại, đã có khá nhiều lược đồ thủy vân được đề xuất, trong đó có thể chia
thành hai lớp. Một lớp là các lược đồ thủy vân dùng để bảo vệ bản quyền cho
các cơ sở dữ liệu quan hệ. Lớp thứ hai là các lược đồ thủy vân dùng để bảo vệ
sự toàn vẹn cho các cơ sở dữ liệu quan hệ.
Từ thực tế trên, em chọn đề tài nghiên cứu thuộc lớp thứ hai: “Bảo vệ
sự toàn vẹn của cơ sở dữ liệu quan hệ bằng kỹ thuật thủy vân”.
2. Mục đích nghiên cứu
- Nghiên cứu kỹ thuật thủy vân để bảo vệ sự toàn vẹn cho các cơ sở dữ
liệu quan hệ với cơ chế xác thực công khai.
- Phát triển chương trình thử nghiệm bảo vệ sự toàn vẹn cho các cơ sở dữ
liệu quan hệ với cơ chế xác thực công khai.
7
3. Nhiệm vụ nghiên cứu
- Nghiên cứu các cơ sở lý thuyết về cơ sở dữ liệu quan hệ và thủy vân số.
- Tìm hiểu về hệ mã hóa khóa đối xứng và khóa công khai.
- Sử dụng công cụ lập trình để phát triển chương trình thử nghiệm thủy
vân cơ sở dữ liệu quan hệ.
4. Đổi tưọng và phạm vi nghiên cứu

- Phạm vi nghiên cứu của đề tài là lý thuyết về thủy vân nói chung và về
cơ sở dữ liệu.
- Nghiên cứu cơ chế mã hóa và giải mã thủy vân cơ sở dữ liệu quan hệ
với cơ chế xác thực công khai.
5. Những đóng góp mói của đề tài
- Tìm hiểu và nghiên cứu các kỹ thuật thủy vân để bảo vệ sự toàn vẹn cho
cơ sở dữ liệu quan hệ.
- Cải tiến và nâng cao độ chính xác khi bảo vệ tính toàn vẹn của cơ sở dữ
liệu lớn.
- Cài đặt chương trình thử nghiệm để bảo vệ sự toàn vẹn của cơ sở dữ liệu
với cơ chế xác thực công khai.
6. Phương pháp nghiên cứu
- Phương pháp nghiên cứu chủ yếu ở đây là phương pháp tiếp cận lý
thuyết, sau đó áp dụng lý thuyết để kiểm chứng. Dựa ừên kết quả kiểm
chứng đó để đưa ra kết luận và các đề xuất nhằm hoàn thành mục tiêu
nghiên cứu.
- Nghiên cứu về lý thuyết thủy vân cơ sở dữ liệu. Nghiên cứu ứng dụng
và mô tả chi tiết về kỹ thuật thủy vân với cơ chế xác thực công khai.
7. Cấu trúc luân văn
Luận văn gồm: Lời mở đầu, ba chương nội dung, phần kết luận và sau
cùng là tài liệu tham khảo.
8
Chương 1: Tổng quan về kỹ thuật thủy vân cho cơ sở dữ liệu quan hệ.
Chương 2: Kỹ thuật thủy vân bảo vệ sự toàn vẹn của cơ sở dữ liệu với cơ chế
xác thực công khai.
Chương 3: Cài đặt và thử nghiệm.
CHƯƠNG 1: TỔNG QUAN VỀ KỸ THUẬT THỦY VÂN CHO Cơ SỞ Dữ
LIỆU QUAN HỆ
1.1. Kiến thức cơ bản về giấu tin
1.1.1. Khái niệm giấu tin

Từ trước đến nay, nhiều phương pháp bảo vệ thông tin đã được đưa ra,
trong đó giải pháp dùng mật mã được ứng dụng rộng rãi nhất. Thông tin ban
đầu được mã hoá, sau đó sẽ được giải mã nhờ khoá của hệ mã. Đã có nhiều hệ
mã phức tạp được sử dụng như DES, RSA, NAPSACK , rất hiệu quả và phổ
biến.
Một phương pháp mới khác đã và đang được nghiên cứu và ứng dụng
mạnh mẽ ở nhiều nước trên thế giới, đó là phương pháp giấu tin. Giấu thông
tin là kỹ thuật nhúng một lượng thông tin số nào đó vào trong một đối tượng
dữ liệu số khác. Một trong những yêu cầu cơ bản của giấu tin là đảm bảo tính
chất ẩn của thông tin được giấu đồng thời không làm ảnh hưởng đến chất
lượng của dữ liệu gốc.
Sự khác biệt chú yếu giữa mã hoá thông tin và giấu thông tin là mã hoá
làm cho các thông tin thể hiện là có được mã hoá hay không, còn với giấu
thông tin thì người ta sẽ khó biết được là có thông tin giấu bên trong.
9
1.1.2. Phân loại các kỹ thuật gỉấu tin
Do kỹ thuật giấu thông tin mới được hình thành ưong thời gian gần đây
nên xu hướng phát triển chưa ổn định. Nhiều phương pháp mới, theo nhiều
khía cạnh khác nhau đang được đề xuất, vì vậy đã tồn tại nhiều cách phân ỉoại
rất khác nhau.
1
0
Hình 1.1: Sơ đồ biểu diễn quá trình giấu tin
•y 9
JW
Hình 1.2: Sơ đô biêu diên quả trình giải mã
Dựa ưên việc thống kê các công trình đã công bố trên các tạp chí, cùng
với thông tin về tên và tóm tắt nội dung của các công trình đã công bé trên
Internet, người ta chia lĩnh vực giấu tin ra làm hai hưứng lớn, đó là thủy vân và
giấu tin bí mật

Steganography (giấu tin bí mật) quan tâm tới ứng dụng che giấu các bản
tin đòi hỏi độ bí mật cao và dung lượng lớn.
Watermark (thủy vân) quan tâm nhiều đến ứng dụng giấu các mẩu tin
ngắn nhưng đòi hỏi độ bền vũng lớn của thông tin cần giấu (trước các biến đổi
thông thường của tệp dữ liệu môi trường).
HÌNH 1.3: PH ÂN LOẠI K Ỹ T H UẬT GIẤ U T I N Đối với
từng hướng lớn ừên, quá trình phân loại theo các tiêu chí khác nhau dựa theo
ảnh hưởng các tác động từ bên ngoài, người ta có thể chia thủy vân thành hai
loại, một loại bền vững với các tác động sao chép trái phép, loại thứ hai có tính
chất hoàn toàn đốỉ lập: dễ bị phá huỷ trước các tác động nóỉ ữên. Cũng có thể
1
1
chia thủy vân theo đặc tính, một loại cần được che giấu để chỉ có một số người
tiếp xúc với nó có thể thấy được thông tin, loại thứ hai đối lập, cần được mọi
người nhìn thấy.
1.1.3. Môi trường giấu tin
Kỹ thuật giấu tin đã được nghỉên cứu và áp dụng trong nhiều môi trường
dữ liệu khác nhau như trong dữ liệu đa phương tỉện (văn bản, hình ảnh, âm
thanh, phim ), trong sản phẩm phần mềm và gần đây là những nghiên cứu
trên lĩnh vực cơ sở dữ liệu quan hệ. Trong các dữ liệu đó, dữ liệu đa phương
tiện là môi trường chiếm tỉ lệ chủ yếu ữong các kỹ thuật giấu tin.
1.1.3.1. Giấu tin trong ảnh (image)
Giấu thông tin trong ảnh, hiện nay, là một bộ phận chiếm tỉ lệ lớn nhất
ừong các chương trình ứng dụng, các phần mềm, hệ thống giấu tin trong đa
phương tiện do lượng thông tin được trao đổi bằng ảnh là rất lớn và hơn nữa
giấu thông tin ừong ảnh cũng đóng vai trò quan trọng ừong hầu hết các ứng
dụng bảo vệ an toàn thông tin như: xác thực thông tin, xác định xuyên tạc
thông tin, bảo vệ bản quyền tác giả, điều khiển truy cập, giấu tin bí mật Do
đó vấn đề này đã nhận được sự quan tâm lớn của các cá nhân, tổ chức, trường
đại học và viện nghiên cứu trên thế giới.

Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít
thay đổi và không ai biết được rằng sau ảnh đó mang những thông tin có ý
nghĩa. Ngày nay, khi ảnh số đã được sử dụng phổ biến, giấu thông tin trong
ảnh đã đem lại nhiều những ứng dụng quan trọng trong nhiều lĩnh vực trong
đời sống xã hội. Ví dụ đối với các nước phát triển, chữ kí tay đã được số hoá
và lưu trữ sử dụng như hồ sơ cá nhân của các dịch vụ ngân hàng và tài chính,
nó được dùng để xác thực trong các thẻ tín dụng của người tiêu dùng. Phần
mềm WinWord của Microsoft cũng cho phép người dùng lưu trữ chữ kí trong
ảnh nhị phân rồi gắn vào vị trí nào đó ừong file văn bản để đảm bảo tính an
1
2
toàn của thông tin. Tài liệu sau đó được truyền trực tiếp qua máy fax hoặc lưu
truyền trên mạng. Theo đó, việc xác thực chữ kí, xác thực thông tin đã trở
thành một vấn đề quan ừọng khi việc ăn cắp thông tin hay xuyên tạc thông tin
bởi các tin tặc đang trở thành một vấn nạn đối với bất kì quốc gia nào, tổ chức
nào. Hơn nữa có nhiều loại thông tin quan trọng cần được bảo mật như những
thông tin về an ninh, thông tin về bảo hiểm hay các thông tin về tài chính, các
thông tin này được số hoá và lưu trữ ừong hệ thống máy tính hay ừên mạng.
Chúng dễ bị lấy cắp và bị thay đổi bởi các phần mềm chuyên dụng. Việc xác
thực cũng như phát hiện thông tin xuyên tạc đã ừở nên vô cùng quan ừọng, cấp
thiết. Một đặc điểm của giấu thông tin trong ảnh là thông tin được giấu trong
ảnh một cách vô hình, tương tự cách truyền thông tin mật cho nhau mà người
khác không thể biết được bởi sau khi giấu thông tin chất lượng ảnh gàn như
không thay đổi đặc biệt đối với ảnh mầu hay ảnh xám. Ví dụ về vụ việc ngày
11-9 gây chấn động nước Mĩ và toàn thế giới, chính tên trùm khủng bố quốc tế
Osma BinLaDen đã dùng cách thức giấu thông tin trong ảnh để liên lạc với
đồng bọn, và hắn đã qua mặt được cục tình báo trung ương Mĩ CIA và các cơ
quan an ninh quốc tế. Chắc chắn sau vụ việc này, việc nghiên cứu các vấn đề
liên quan đến giấu thông tin ừong ảnh sẽ rất được quan tâm.
I.I.3.2. Giấu tin trong âm thanh (audio)

Giấu thông tin trong âm thanh mang những đặc điểm riêng khác với giấu
thông tin trong các đối tượng đa phương tiện khác. Một trong những yêu cầu
cơ bản của giấu tin là đảm bảo tính chất ẩn của thông tin được giấu đồng thời
không làm ảnh hưởng đến chất lượng của dữ liệu gốc. Để đảm bảo yêu cầu
này, kỹ thuật giấu thông tin trong ảnh phụ thuộc vào hệ thống thị giác của con
người - HVS còn kỹ thuật giấu thông tin trong âm thanh lại phụ thuộc vào hệ
thống thính giác - HAS. Một vấn đề khó khăn là hệ thống thính giác của con
người nghe được các tín hiệu ở các dải tần rộng và công suất lớn nên đã gây
1
3
khó khăn đối với các phương pháp giấu tin trong âm thanh. Nhưng hệ thống
thính giác của con người lại kém trong việc phát hiện sự khác biệt các dài tần
và công suất, điều này có nghĩa là các âm thanh to, cao tàn có thể che giấu
được các âm thanh nhỏ thấp một cách dễ dàng. Các mô hình phân tích tâm lí đã
chỉ ra điểm yếu trên và thông tin này sẽ giúp ích cho việc chọn các âm thanh
thích họp cho việc giấu tin. vấn đề khó khăn thứ hai đối với giấu thông tin
trong âm thanh là kênh truyền tin. Kênh truyền hay băng thông chậm sẽ ảnh
hưởng đến chất lượng thông tin sau khi giấu.
Ví dụ: Để nhúng một đoạn java applet vào một đoạn âm thanh (16 bit,
44.100 Hz) có chiều dài bình thường thì các phương pháp nói chung cũng cần
ít nhất là 20 bits. Giấu thông tin ừong âm thanh đòi hỏi yêu càu cao về tính
đồng bộ và tính an toàn của thông tin, Các phương pháp giấu thông tin trong
âm thanh đều lợi dụng điểm yếu trong hệ thống thính giác của con người.
I.I.3.3. Giấu tin trong video
Cũng giống như giấu thông tin ừong ảnh hay trong âm thanh, giấu tin
trong video cũng được quan tâm và được phát triển mạnh mẽ cho nhiều ứng
dụng như điều khiển truy cập thông tin, xác thực thông tin và bảo vệ bản quyền
tác giả. Các kỹ thuật giấu tin trong video cũng được phát triển mạnh mẽ và
theo hai khuynh hướng là thuỷ vân số và giấu thông tin. Một phương pháp giấu
tin trong video được Cox đưa ra là phương pháp phân bố đều. Ý tưởng cơ bản

của phương pháp này là phân phối thông tin giấu dàn trải theo tần số của dữ
liệu gốc. Nhiều nhà nghiên cứu đã dùng những hàm cosin riêng và các hệ số
truyền sóng riêng để giấu tin. Trong các thuật toán đầu tiên thường các kỹ
thuật cho phép giấu các ảnh vào trong video nhưng thời gian gần đây các kỹ
thuật cho phép giấu cả âm thanh và hình ảnh vào video.
Giấu tin là một công nghệ mới phức tạp, đang được các nhà khoa học
tập trung nghiên cứu ở nhiều nước trên thế giới như Đức, Mỹ, Ý, Canada, Nhật
1
4
Bản, Tuy nhiên, những kết quả thực nghiệm cho thấy để có thể ứng dụng thực
tế thì lĩnh vực này cần phải có thêm thời gian để nghiên cứu thẩm định nhưng
các nhà khoa học cũng khẳng định rằng đây là một công nghệ mới đầy hứa hẹn
cho vấn đề an toàn và bảo mật thông tin. Công việc hiện nay của các nhà khoa
học là đang tập trung xây dựng một hệ thống lí thuyết chính xác cho vấn đề
giấu tin, đây là một mảnh đất mới cho các nhà khoa học khám phá. Một trong
những kỹ thuật quan trọng của giấu tin đang được rất nhiều các nhà khoa học
quan tâm và phát triến nhất, đó là kỹ thuật thuỷ vân (watermark).
1.2. Kiến thức cơ bản về thủy vân
1.2.1. Khái niệm thuỷ vân
Thuỷ vân số (digital watermarking) là quá trình chèn thông tin vào dữ liệu
số đảm bảo không thể cảm nhận được bằng các giác quan của con người nhưng
lại dễ dàng phát hiện bởi các thuật toán của máy tính. Một dấu thuỷ vân
(watermark) mà một mẫu thông tin trong suốt và không thể nhìn thấy được bằng
các giác quan được chèn vào một vị trí thích họp trong dữ liệu số bằng cách sử
dụng một thuật toán đặc biệt.
Tuỳ thuộc vào mục đích và ứng dụng mà các yêu cầu của hệ thống thủy
vân được đặt ra. Với các hệ thống thực tế, hệ thống thuỷ vân đòi hỏi các yêu
cầu sau:
+ Tính không nhận thấy được (Imperceptibility): Các điều chỉnh gây ra
do nhúng thủy vân phải thấp hơn ngưỡng cảm thụ của con người, nghĩa là các

mẫu dùng ừong nhúng thủy vân chỉ được phép thay đổi rất nhỏ trong giới hạn
cho phép.
+ Tính bền vững (Robustness): Tùy vào từng loại ứng dụng mà tính bền
vững này được nhìn nhận dưới nhiều quan điểm khác nhau, nếu như đối với
các ứng dụng dùng để bảo vệ quyền sờ hữu thì thủy vân cần phải bền vững qua
một số các hành động cập nhật của dữ liệu. Nếu như đối với ứng dụng để
1
5
chống làm giả hoặc chống lại sự thay đổi ừên dữ liệu thì đòi hỏi thủy vân phải
huỷ bỏ khi có các tác vụ này xảy ra.
+ Tính không chia tách được (Inseparability): Sau khi dữ liệu được
nhúng thủy vân thì yêu càu là phải rất khó hoặc không thể tách thành 2 phần
riêng biệt như lúc đầu.
+ Bảo mật (Security): Sau khi đã nhúng thủy vân vào dữ liệu, thì yêu cầu
là chỉ cho phép những người sử dụng có quyền mới chinh sửa và phát hiện
được thủy vân điều này được thực hiện nhờ vào key dùng làm khoá trong giải
thuật nhúng thủy vân vào dữ liệu và giải thuật phát hiện ra thủy vân trong dữ
liệu.
+ Tìm lại thủy vân: Có thể cần hoặc không càn đến dữ liệu gốc vẫn
có thể tìm lại được thuỷ vân đã nhúng.
+ Trích thủy vân hay kiểm chứng: Cho phép kiểm tra sự tồn tại của
thủy vân trong dữ liệu đã nhúng.
1.2.2. Một số vấn đề có liền quan đến thuỷ vân
Có nhiều phương pháp để phân loại thủy vân, dưới đây trình bày
phương pháp phân loại phổ biến nhất:
1
6
HÌNH 1.4: CÁ C H PHÂN L OẠI TH Ủ Y VÂN T IÊU B I Ể U
Dựa vào miền tác động, chúng ta có thể phân loại thủy vân thành tác động
lên miền không gian ảnh (spatial domain) và tác động lên miền tần số ảnh

(frequency domain).
Dựa vào kiểu dữ liệu được nhúng thủy vân số, chúng ta có thủy vân
được nhúng vào ảnh, vào audio, video hay text.
Dựa vào tác động tới thị giác con người, chúng ta có thủy vân hiện
(visible watermark) hoặc thủy vân an (invisible watermark). Thủy vân ẩn
lại được chia thành thủy vân bền vững (robust watermark) và thủy vân dễ
vỡ (fragile watermark).
Thủy vân hiện có ưu điểm là nhìn được bằng mắt thường, khiến cho tất
cả người sử dụng đều biết được bản quyền của ảnh. Tuy nhiên, nó sẽ tác động
tới chất lượng ảnh và gây mất thẩm mỹ.
1.2.3. Các ứng dụng của thủy vân
Bảo vệ quyền sở hữu: Thủy vân có thể được dùng để bảo vệ quyền sở
hữu đối với các sản phẩm số. Nội dung của các sản phẩm số này sẽ chứa thêm
các thông tin về người sở hữu. Khi các sản phẩm số này được sử dụng bất hợp
pháp thì ta có thể dùng bộ dò thủy vân số để phát hiện.
Chống sao chép bất hợp pháp: Các sản phẩm có chứa thủy vân biểu hiện
cho việc sản phẩm này không được sao chép, vì nếu sao chép sẽ phạm luật.
Nhà sản xuất tong bị các phương tiện dùng để sao chép (như CD writer ) đều
có khả năng phát hiện xem thủy vân có chứa trong sản phẩm số hay không, nếu
có thì sẽ từ chối không sao chép. Một số phần mềm cũng có chức năng này, ví
dụ như phần mềm xem phim của hãng DivX sẽ từ chối chiếu các bộ phim
nhúng thủy vân.
Theo dõi quá trình sử dụng: Thủy vân có thể được dùng để theo dõi quá
trình sử dụng của các sản phẩm số. Mỗi bản sao của sản phẩm số được chứa
1
7
bằng một thủy vân duy nhất dùng để xác định người sử dụng là ai. Nếu có sự
sao chép bất hợp pháp, ta có thể truy ra người vi phạm nhờ vào thủy vân được
chứa bên trong sản phẩm số đó.
Chống giả mạo: Thủy vân có thể được dùng để chống sự giả mạo. Nếu

có bất cứ sự thay đổi nào về nội dung của các sản phẩm số thì thủy vân này sẽ
bị hủy đi. Do đó rất khó làm giả sản phẩm số có chứa thủy vân.
Theo dõi truyền thông: Các công ty truyền thông và quảng cáo có thể
dùng kỹ thuật thủy vân để quản lý xem có bao nhiêu khách hàng đã dùng dịch
vụ cung cấp.
Truyền tin bí mật: Bỏi vì thủy vân là một dạng đặc biệt của việc che dấu
dữ liệu nên người ta có thể dùng để truyền các thông tin bí mật.
1.2.4. Quá trình thực hiện thủy vân nói chung
Quy trình thực hiện thủy vân được trải qua bốn bước như sau:
> Tạo thủy vân
> Nhúng thủy vân
> Tách thủy vân
> Kiểm tta thủy vân
1.3. Kỹ thuật thủy vân cho các cơ sở dữ liệu quan hệ
Thuỷ vân cơ sở dữ liệu là kỹ thuật cho phép người chủ dữ liệu có thể
nhúng một thuỷ vân ẩn vào dữ liệu. Một thuỷ vân thường mô tả những thông
tin có thể được dùng để chứng minh quyền sở hữu dữ liệu, chẳng hạn như là
tên chủ sở hữu, nguồn gốc, hoặc người tiếp nhận nội dung này. Việc nhúng
thông tin ал toàn đòi hỏi thủy vân được nhúng ừong dữ liệu không thể bị làm
giả mạo hoặc bị tẩy xoá một cách dễ dàng. Đồng thời, khi nhúng thuỷ vân vào
dữ liệu cần phải đảm bảo các thay đổi trên dữ liệu là trong giới hạn cho phép
của từng ứng dụng cụ thể.
Các kỹ thuật được trình bày ở đây sẽ được phân loại dựa trên các yếu tố
1
8
sau:
(i) Các kỹ thuật làm thay đổi cơ sở dữ liệu.
(ii)Kiểu của dữ liệu mà thủy vân được nhúng.
(iii) Kiểu của dữ liệu thủy vân.
Dựa trên yếu tố làm thay đổi cơ sở dữ liệu, các kỹ thuật có thể được

phân loại thành hai nhóm kỹ thuật: Các kỹ thuật làm thay đổi cơ sở dữ liệu và
không làm thay đổi cơ sở dữ liệu.
1
9
về cơ bản, các kỹ thuật thủy vân cho các cơ sở dữ liệu quan hệ bao gồm
hai giai đoạn: Giai đoạn nhúng thủy vân số vào cơ sở dữ liệu và giai đoạn xác
thực thủy vân số được nhúng trong cơ sở dữ liệu. Trong giai đoạn nhúng thủy
vân số vào cơ sở dữ liệu, khóa bí mật к được sử dụng để nhúngthủy vân số w
vào các cơ sở dữ liệu gốc. Khi đó, cơ sở dữ liệu được nhúng thủy vân số sẽ
được mang ra sử dụng ngoài cộng đồng (như chia sẻ trên Internet, ). Để xác
thực quyền sở hữu của các cơ sở dữ liệu thuộc về ai (thực hiện đối với cơ sở dữ
liệu nghi vấn), quá trình được thực hiện như sau:
Đưa cơ sở dữ liệu nghi vấn làm đầu vào trong hệ thống xác thực và dùng
khóa bí mật K (khóa K này chính là khóa được đùng ừong giai đoạn nhúng
thủy vân), lúc này thủy vân được nhúng vào cơ sở dữ liệu sẽ được trích rút ra
và được so sánh vói thủy vân gốc.
Key ( K )
2
0
Watermark information (W)
Suspicious Waten nark
Database Verification
Hình 1.5: MÔ tả kỹ thuật thủy vân cơ bản cho các cơ sở dữ liệu quan hệ
1.3.1. Kỹ thuật thủy vân làm thay đẩi dữ liệu trong CSDL quan hệ
Các kỹ thuật thủy vân số thuộc loại này, ừong giai đoạn nhúng thủy vân
vào các cơ sở dữ liệu quan hệ thì sẽ làm thay đổi dữ liệu và mức độ thay đổi
được tạo ra trong cơ sở dữ liệu là chấp nhận được và không tạo ra dữ liệu vô
nghĩa. Các kỹ thuật thủy vân thuộc loại này có thể được thực hiện trên các giá
trị thuộc tính cố những kỉểu dữ liệu khác nhau như kiểu số (numeric), kiểu xâu
(string), tại mức bít hoặc mức ký tự hoặc mức cao han (như là mức thuộc tính

hoặc mức bản ghi).
2
1
OriỉLÌnLll
Dntutrasc
WalLïnnurke
d Dill
abase
Watermark
Embeddi
ng
Key
(ÄD
Claim as
true or
false
VVâtủriHarit Iilfoi'iiiiklioil Î
1.3.1.1. Kỹ thuật thủy vân dựa trên thuộc tính kiểu dữ liệu số
a, Ảnh như là thông tin thủy vân
Wang et al. [8] miêu tả một lược đồ thủy vân số dựa trên ảnh ở đây thay
vì ảnh gốc nhúng thủy vân, một ảnh được chộn dựa ttên biến đổi Arnold vói hệ
số chộn d được dùng. Vì biến đổi Arnold của một ảnh có tính chu kỳ p, kết quả
được lấy trong giai đoạn trích rút có thể được khôi phục từ định dạng chộn tới
gốc sau đó lặp (P-d). Trong giai đoạn nhúng, ảnh gốc của kích thước NxN đầu
tiên được chuyển vào ảnh chộn khi đó được biểu diễn bởi một xâu nhị phân b
s
của độ dài L = NxN. Thứ hai, tất cả các bản ghi trong cơ sở dữ liệu quan hệ
được nhóm vào L nhóm. Giá trị băm được tính dùng khóa chính của bản ghi,
khóa bí mật và thứ tự của ảnh, xác định nhóm trong mỗi bản ghi thuộc. Cuối
cùng, bit thứ i của b

s
là được nhúng vào yị trí bít được chọn của giá trị thuộc
tính cho các bản ghi đó trong nhóm thứ i mà thỏa mãn tiêu chuẩn riêng nào đó.
Giai đoạn dò dùng kỹ thuật theo số đông. Tuy nhiên, bảo mật của lược đồ
không chỉ phụ thuộc vào khóa bảo mật mà còn phụ thuộc hệ số trộn d và thứ tự
của ảnh N.
Trong nhúng ảnh được trộn, kỹ thuật thủy vân trong [10] nhúng ảnh gốc
bằng cách, đầu tiên chuyển đổi nó thành dãy bít (EMC, Encrypted Mark
Code), và sau đó bằng cách cho phép các bước thuật toán giống như trong [8].
Chỉ có hai điểm khác đó là (i) kỹ thuật chèn thủy vân số trong [8] cho rằng
thuộc tính phải được cố định để đánh dấu cho tất cả các bản ghi ừong khi đó
[10] không như thế, và (ii) trong khi lựa chọn các vị trí bít, thứ tự của
ảnh là không được xem xét trong [10]. Cuối cùng, sau khi nhúng, [10]
kiểm tta khả năng dùng của dữ liệu. Nếu chấp nhận thì thay đổi, ngược
lại quay lại.
Lược đồ thủy vân số khác để nhúng ảnh định dạng BMP đã được trình
bày trong [11]. Trong giai đoạn nhúng thủy vân số, ảnh BMP được phân chia
2
2
thành hai phần: phàn dữ liệu header và phàn dữ liệu ảnh. Một phương pháp
hiệu chỉnh lỗi của mã BCH (Bose-Chaudhuri-Hocquenhem) là được sử dụng
giải mã phần dữ liệu ảnh trong thủy vân số. Dựa trên giá trị ID của bản ghi
được tính từ hàm băm với tham số khóa chính của bản ghi và dữ liệu header
của ảnh BMP, tất cả các bản ghi được gắn tới các tập con phân biệt k, ở đây k
là độ dài của thủy vân. Cuối cùng, mỗi k bít của thủy vân được sử dụng để
đánh dấu mỗi k tập con của các bản ghi. Trong khi đánh dấu, các vị trí bít ít ý
nghĩa được chọn trong các thuộc tính được chọn của các bản ghi cụ thể thỏa
mãn một chuẩn riêng được thay đổi. Lựa chọn của các vị trí bít phụ thuộc vào
hàm HASH hoặc MAC với tham số dữ liệu header của ảnh BMP, khóa chính
của bản ghi và tham số khác như số lượng các bít ít ý nghĩa trong giá trị thuộc

tính. Qua quan sát thấy rằng các vị trí bít được lựa chọn không là một tập các
bít thủy vân trực tiếp, tập các bít mặt nạ được tính toán từ hai giá trị hàm băm
và bít thủy vân.
Lược đồ thủy vân vỡ dựa trên ảnh trong [12] hướng tới duy trì tính toàn
vẹn của cơ sở dữ liệu và dùng hồi qui vector hỗ trợ (SVR) để huấn luyện các
thuộc tính tương quan cao để tạo ra hàm dự đoán SVR cho thủy vân nhúng vào
các thuộc tính số. Lược đồ này bao gồm ba giai đoạn: (i) Giai đoạn huấn luyện:
Lựa chọn các bản ghi huấn luyện và lấy hàm dự đoán SVR được huấn luyện;
(ii) Giai đoạn nhúng thủy vân: Tất cả các bản ghi trong cơ sở dữ liệu quan hệ
là được sử dụng để nhúng thủy vân ảnh ở đây số lượng các bít thủy vân được
thiết kế bằng số lượng các bản ghi. Mỗi giá trị thuộc tính số Ci của bản ghi ti
thứ i dược dự đoán dùng hàm dự đoán SVR kết quả là CI = F (TỊ ). Dựa trên
bít thủy vân bị thứ i (được lấy sau khi chuyển đổi ảnh vào luồng bít), giá trị
của Q được thay đổi bằng cách Ci +1 hoặc Ci -1; (iii) Dò giả mạo: Hàm dự đoán
SVR được huấn luyện được sử dụng để sinh giá trị được dự đoán cho mỗi bản
ghi và được so sánh vói giá trị được lấy ra ừong cơ sở dữ liệu. Sự khác nhau
2
3
giữa hai giá trị đó xác định thông tin thủy vân và có thể đảm bảo cơ sở dữ liệu
được giả mạo hay không giả mạo. Tuy nhiên, hạn chế của lược đồ này đó là nó
có thể xác định sự thay đổi chỉ xảy ra trong tập thuộc tính đối tượng. Lược đồ
này làm việc tốt trong trường hợp các bản ghi trong bảng dữ liệu là độc lập
nhưng có sự tương quan cao giữa các thuộc tính.
b. Ngôn ngữ như là thông tin thủy vân
Wang et al. [13] đề xuất dùng ngôn ngữ của người sở hữu để sinh thủy
vân duy nhất. Thủy vân từ ngôn ngữ bao gồm các bước sau: Nén dữ liệu ngôn
ngữ để đưa vào thủy vân, cải thiện dữ liệu ngôn ngữ để loại bỏ nhiễu trong
miền tần số, chuyển đổi dữ liệu ngôn ngữ vào luồng bít và cuối cùng tạo ra
thủy vân bằng cách dùng thông điệp bản quyền của người sở hữu và kết quả
được chuyển dữ liệu ngôn ngữ. Nhúng thủy vân được thực hiện ở mức bít bằng

cách cho phép các bước thuật toán giống như trong kỹ thuật dựa trên ảnh của
[14].
c. Thông tin thủy vân dựa trên thuật toán di truyền
Các tác giả trong [13] đề xuất kỹ thuật dựa trên thuật toán di truyền để
tạo ra thông tin thủy vân, tập trung trên vấn đề tối ưu. Họ đưa ra các bước thuật
toán giống như trong [10].
d. Các đặc tính nội dung như là thông tin thủy vân
Các lược đồ thủy vân trong [14], [15] là được thực hiện dựa trên nội
dung của chính cơ sở dữ liệu.
Trong [14], giai đoạn nhúng thủy vân trích rút vài bít, được gọi là đặc
tính cục bộ, từ đặc tính của thuộc tính Ai của bản ghi t và nhúng các bít đó vào
trong thuộc tính thủy vân A
2
của bản ghi giống nhau. Lựa chọn các bản ghi phụ
thuộc vào giá tậ ngẫu nhiên được sinh (giữa 0 và 1) là nhỏ hơn sự cân đối được
nhúng A của các cơ sở dữ liệu quan hệ và yêu càu not Null của giá trị thuộc
tính đặc tính. Trong giai đoạn dò thủy vân, bằng cách cho phép thủ tục tương
2
4
tự, đặc tính cục bộ của thuộc tính đặc tính được trích rút và được so sánh chống
lại các bít cuối cùng của thuộc tính thủy vân.
Trong [15], các tác giả đưa ra một lược đồ thủy vân YỠ có thể xác thực
tính toán vẹn của cơ sở dữ liệu quan hệ. Trong lược đồ đưa ra, tất cả các bản
ghi trong cơ sở dữ liệu quan hệ đầu tiên là được phân chia bảo mật thành các
nhóm và được sắp xếp. Trong mỗi nhóm, có hai loại thủy vân được nhúng:
thủy vân thuộc tính Wi bao gồm Y thủy vân độ dài V và thủy vân bản ghi w
2
bao
gồm V thủy vân độ dài Ỵ , ở đây ỵ và V là số lượng các thuộc tính trong một bản
ghi và số lượng trung bình của các bản ghi ttong mỗi nhóm tương ứng. Wi và

w
2
được tạo bằng cách trích rút dãy bít từ giá trị hàm băm. Đối vói thủy vân
thuộc tính Wi, giá trị hàm băm được tạo liên quan tới mã xác thực thông điệp
và cùng thuộc tính của tất cả các bản ghi trong các cùng nhóm, trong khi đối
với thủy vân bản ghi w
2
, nó được hình thành từ cùng mã xác thực thông điệp
và tất cả các thuộc tính của cùng bản ghi. Qua quan sát thấy rằng, trong giai
đoạn nhúng và dò thủy vân, chúng bỏ các bít ít ý nghĩa của tất cả các thuộc
tính của kiểu số ngoại trừ khóa chính khi tính các giá tri hàm băm. Thủy vân
thuộc tính được nhúng ở mức LSB, trong khi đó thủy vân bản ghi được nhúng
tại mức kế tiếp LSB. Theo cách này, các thủy vân được nhúng thực sự hình
thành một lưới thủy vân giúp để dò, định vị và xác định rõ sự thay đổi.
e. Mô hình đám mây như là thông tin thủy vân
Lược đồ thủy vân đám mây trong [16] được dựa trên mô hình đám mây
với ba đặc tính: Giá tri kỳ vọng (Ex), Entropy (En) và Hyper Entropy (He).
Trong giai đoạn tạo thủy vân, nó dùng thuật toán sinh đám mây phía trước để
sinh các giọt mây từ đám mây và các giọt đám mây đó được nhúng vào trong
các cơ sở dữ liệu như là thủy vân, ừong khi đó thuật toán dò thủy vân dùng
thuật toán sinh đám mây phía sau để trích rút đám mây với các tham số Ex, En
2
5

×