Tải bản đầy đủ (.pdf) (136 trang)

Bài giảng Bảo mật cơ sở dữ liệu: Chương 5 - Trần Thị Kim Chi

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.13 MB, 136 trang )

CHƯƠNG 5

1


Mục tiêu




Chúng ta đi sâu vào các vấn đề suy diễn
trên các CSDL thống kê.
Thảo luận một số kỹ thuật bảo vệ cơ bản:







Kỹ thuật dựa vào khái niệm
Kỹ thuật dựa vào hạn chế
Kỹ thuật dựa vào gây nhiễu

Đánh giá chung về đặc trưng của các kỹ

thuật này.
2


Nội dung


4.1 Giới thiệu
4.2 Các khái niệm cơ bản và giả định
4.3 Một số kiểu tấn công suy diễn
4.4 Các kỹ thuật chống suy diễn
4.4.1 Các kỹ thuật khái niệm
4.4.2 Các kỹ thuật dựa vào hạn chế
4.4.3 Các kỹ thuật dựa vào gây nhiễu

4.5 Khung làm việc chung dành cho việc so sánh
các kỹ thuật chống suy diễn

3


4.1 Giới thiệu


CSDL thống kê (SDB) là một CSDL chứa
các bản ghi nhạy cảm mô tả về các cá nhân
nhưng chỉ các câu truy vấn thống kê (như:
COUNT, SUM, MEAN, MAX, MIN…)
mới được trả lời, ngoài các câu truy vấn
này thì những truy vấn vào các mục dữ
liệu riêng sẽ không được đáp lại
4


Ví dụ một số câu truy vấn thống kê



COUNT:








Select count(*) from Nhanvien
(Trả lại tổng số lượng các bg trong table)
Select count(Luong) AS count_Luong from
Nhanvien
Select count(Distinct Luong) from Nhanvien
(Trả lại số lượng các loại lương phân biệt nhau)
select count(*) from nhanvien where
Luong<=1000

5


Ví dụ một số câu truy vấn thống kê


SUM:








Select SUM(Luong) as sum_Luong from Nhanvien
Select SUM(Distinct Luong) as sum_Luong from
Nhanvien
Select Chucvu, Sum(Luong) from Nhanvien GROUP
BY chucvu
Select HoTen, chucvu, Luong from nhanvien
ORDER by chucvu
Compute SUM(Luong) by chucvu
(Thêm cột tổng lương với từng kiểu chức vụ)
6


Ví dụ một số câu truy vấn thống kê


AVG:







Select AVG(Luong) AS avg_Luong from Nhanvien
Select AVG(Luong) AS avg_Luong from Nhanvien
where Luong>1000
Select AVG(distinct Luong) AS avg_Luong from
Nhanvien

Select chucvu, AVG(Luong) as avg_Luong,
SUM(Luong) as sum_luong from Nhanvien
Group by chucvu
Order by chucvu
7


Ví dụ một số câu truy vấn thống kê


MIN:





Select MIN(Luong) from Nhanvien
Select MIN(Distinct Luong) from Nhanvien

MAX



Select MAX(Distinct Luong) from Nhanvien
Select MAX(Luong) from Nhanvien

8


4.1 Giới thiệu





Ứng dụng của SDB (Statistical Database):
CSDL điều tra dân số, CSDL về số người tử
vong, về kế hoạch kinh tế, CSDL thống kê về
khám chữa bệnh, CSDL về các vụ tai nạn ô tô,
CSDL về công nhân, CSDL thống kê về tội
phạm…
Ví dụ:

9


4.1 Giới thiệu




Vấn đề bảo vệ SDB: Vấn đề chính trong bảo
vệ SDB là dàn xếp giữa các yêu cầu cá nhân
và quyền của các tổ chức để biết và xử lý
thông tin => vấn đề suy diễn trong SDB.
Suy diễn: trong một SDB có nghĩa là có thể
thu được các thông tin bí mật trong các thực
thể đơn lẻ, bằng cách lợi dụng các câu truy
vấn thống kê.
10



4.1 Giới thiệu




Một SDB chắc chắn bị lộ: nếu người sử
dụng phát hiện được một cá nhân có một
đặc điểm cụ thể nào đó, nghĩa là người dùng
biết cá nhân này được biểu diễn trong SDB
có một số giá trị thuộc tính nào đó.
Một SDB hoàn toàn không bị lộ: nếu
người sử dụng biết được một cá nhân cụ thể
không nắm giữ một đặc điểm nào đó.
11


4.1 Giới thiệu


Các đặc tính của SDB cần được bảo vệ:




SDB tĩnh: SDB không thay đổi trong suốt thời
gian tồn tại của chúng.
SDB động: thay đổi liên tục theo sự thay đổi của
dữ liệu thực, cho phép sửa đổi, nghĩa là được phép
chèn hoặc xoá các thực thể để phản ánh các thay

đổi động của thế giới thực (ví dụ các CSDL nghiên
cứu trực tuyến, lớp học trực tuyến khi bổ sung
thành viên,…).
12


4.1 Giới thiệu




SDB trực tuyến (online): trong đó người sử
dụng nhận được các phản hồi thời gian thực
cho các câu truy vấn thống kê của mình.
SDB ngoại tuyến (offline): trong đó người sử
dụng không biết khi nào các thống kê của họ
được xử lý, việc SDB bị lộ sẽ khó khăn.

13


4.1 Giới thiệu




Kiến thức làm việc (working knowledge) là tập
các mục thông tin liên quan đến các giá trị thuộc
tính trong SDB và các kiểu thống kê có sẵn
trong SDB

Kiến thức bổ sung của người sử dụng
(sumplementary knowledge): Người sử dụng có
thể có kiến thức bổ sung về các cá nhân được
biểu diễn trong SDB. Họ hoàn toàn có thể lợi
dụng kiến thức này cho các mục đích suy diễn.
14


Mô hình làm lộ SDB

15


Ví dụ về làm lộ một SDB
Ví dụ 1 (lộ chính xác)

16


Ví dụ 2 (lộ

xấp xỉ)

17


Ví dụ 2

18



Nội dung






4.1 Giới thiệu
4.2 Các khái niệm cơ bản và giả định
4.3 Một số kiểu tấn công suy diễn
4.4 Các kỹ thuật chống suy diễn






4.4.1 Các kỹ thuật khái niệm
4.4.2 Các kỹ thuật dựa vào hạn chế
4.4.3 Các kỹ thuật dựa vào gây nhiễu

4.5 Khung làm việc chung dành cho việc so
sánh các kỹ thuật chống suy diễn

19


4.2 Các khái niệm cơ bản và các giả định



CSDL thống kê (SDB): ta xem xét cấu trúc của một
SDB là một dạng quan hệ, giả sử là R.
 N là số bản ghi: Xi là bản ghi thứ i
 M là số thuộc tính: A1, A2, …, AM
 Xij là giá trị của thuộc tính Aj trong bản ghi xi
 Mỗi thuộc tính Aj (1 j  M) có thể có |Aj | giá
trị.

20


4.2 Các khái niệm cơ bản và các giả định

21


4.2 Các khái niệm cơ bản và các giả định


Ví dụ về một SDB:


SDB về công nhân (Lương):

ID

Tên

Chức vụ


Phòng

Tuổi

Giới tính

Lương

01

Nam

Nhân viên

Maketing

29

M

3500

02

Lan

Trưởng phong

Kế hoạch


33

F

6200

03

Huệ

Nhân viên

Kế hoạch

27

F

4000

04

Minh

Giám sát viên

Maketing

24


M

3600

05

Quỳnh

Nhân viên

Kế hoạch

24

F

2900
22


4.2 Các khái niệm cơ bản và các giả định


SDB về các vụ tai nạn ô tô

HoTen

Tuoi


Đ/C

MauXe

LoaiXe

ThoiGian

Nguyễn Văn Tài

25

HN

Xanh

Honda

37

HD

Đỏ

Hoàng Văn Minh

42

PT


Vũ Bình Minh

32

Trần Quang Hòa

22

Lê sỹ Hoàng

CoLoi

SayRuou

13.30

1

1

Toyota

6.25

1

0

Trắng


Audi

17.45

0

0

PT

Vàng

Volkswagon 3.30

0

1

HN

Xanh

Honda

1

0

6.30


23


4.2 Các khái niệm cơ bản và các giả định


SDB về các Sinh viên
Giới
tính

Địa chỉ

Phụ cấp

Nghiện ma
túy

Lớp

Minh

M

HN

500

1

Toán1


Hải

M

HD

0

0

Toán2

Tuyết

F



300

0

Tin1

Nam

M

BG


100

3

Tin2

Phương

F

NA

200

1

Toán2

Hạnh

F

HT

100

0

Toán1


Tên

24


4.2 Các khái niệm cơ bản và các giả định


SDB vĩ mô về các Sinh viên
Toán1

Toán2

Tin1

Tin2

M

500

0

0

100

F


100

200

300

0

Tổng cộng

600

200

300

100

Tổng phụ cấp theo giới tính và theo lớp
25


×