1
Cơ sở dữ liệu nâng cao
Phạm Thị Anh Lê – ĐH Sư phạm Hà nội
Giới thiệu
CSDL suy diễn
CSDL phân tán
CSDL hướng đối tượng
Phạm Thị Anh Lê ĐHSPHN
2
Chương I: CSDL suy diễn
(Deductive Database DDB)
1.
2.
3.
4.
Giới thiệu
Logic và CSDL suy diễn
Ngôn
ngữ
luật
Datalog
(rule
languages)
Đánh giá và mô hình hoá các câu hỏi
suy diễn
3
Giới thiệu
Các hệ CSDL quan hệ đã thu được những thành tựu to lớn về cả phương diện lý thuyết và
thực hành.
Một số hạn chế của CSDL quan hệ: ngữ nghĩa của mô hình quan hệ chưa đủ phong phú,
việc quản lý các dữ liệu động và phức tạp kém hiệu quả,...
Một số hướng nghiên cứu mở rộng được đề xuất: CSDL suy diễn, CSDL hướng đối tượng,
CSDL phân tán
Phạm Thị Anh Lê ĐHSPHN
4
Giới thiệu
CSDL cổ điển không có khả năng suy dẫn ra sự kiện mới, khả năng tiềm ẩn không
được khai thác hết.
Ví dụ: quan hệ cha-con không suy diễn được Hoa là cháu của ai.
1970-1980: có một trào lưu sôi nổi muốn đưa vào CSDL quan hệ những cơ chế suy
diễn, những tri thức tổng quát
Sự gặp gỡ của AI và CSDL
Phạm Thị Anh Lê ĐHSPHN
5
Mở đầu
Các hệ
CSDL
Có khả năng quản lý các khối lượng lớn
DL
Dữ liệu ngoại diên: các sự kiện
Các hệ chuyên
gia
Có các khả năng suy luận
Tri thức nội hàm: các luật
Tính toàn vẹn, khôi phục, tối ưu
hoá câu hỏi
Được bảo trì bởi những nhà quản
trị
Cần những khả năng suy luận bên
trong CSDL
Biểu diễn tri thức
Được bảo trì bởi các chuyên
gia
Cần một hoàn thiện để quản lý
các khối lượng lớn thông tin
CSDL suy
diễn
? Thị Anh Lê Phạm
ĐHSPHN
6
Giới thiệu
CSDL suy diễn: - bổ sung các khả năng suy diễn cho CSDL, CSDL chứa các sự kiện (intensional
relations) và các luật để suy dẫn ra các sự kiện mới (extensional relations)
CSDL là cơ sở tri thức
- mở rộng việc truy vấn
Datalog là một công cụ của DDB
tương tự với Prolog
có các sự kiện và các luật
các luật định nghĩa – có khả năng đệ qui - views
Phạm Thị Anh Lê ĐHSPHN
7
1. Logic và CSDL suy diễn
Từ logic đến CSDL suy diễn
Lý thuyết chứng minh
Lý thuyết thể hiện
Thế nào là CSDL suy diễn
Vấn đề thông tin âm
Chức năng và phương pháp luận của một CSDL suy diễn
Phạm Thị Anh Lê ĐHSPHN
8
2. Các ngôn ngữ luật đối với các
CSDL
Cú pháp của Datalog
Ngữ nghĩa của Datalog
Mở rộng Datalog với:
các hàm
phép phủ định
phép tập hợp
phép cập nhật
các điều kiện phi Horn
Phạm Thị Anh Lê ĐHSPHN
9
3. Đánh giá và mô hình hoá
các câu hỏi suy diễn
Đánh giá dưới lên
Đánh giá trên xuống
Mô hình hoá các luật bằng đồ thị
Cây và đồ thị quan hệ
Cây VÀ/HOẶC và các đồ thị luật/đích
Đánh giá các luật đệ quy
Phạm Thị Anh Lê ĐHSPHN
10
Từ logic đến CSDL suy
diễn
Logic vị từ (tân từ) cấp một (first-order logic - FOL) là một ngôn ngữ hình thức diễn tả
các quan hệ giữa các đối tượng và để suy diễn ra các quan hệ mới từ các quan hệ
được xem là đúng
Trong FOL, các công thức nguyên tố (atomic formulas) được diễn giải như các phát
biểu về các quan hệ giữa các đối tượng.
Phạm Thị Anh Lê ĐHSPHN
11
Từ logic đến CSDL suy
diễn
Ví dụ:
∀x (Người(x)→chết(x)) Mọi người đều phải chết
∀x (Nữ(x)∧¬yêu(a, chị(x)) → yêu(x))
Phạm Thị Anh Lê ĐHSPHN
12
Logic vị từ cấp một
Cú pháp
Vị từ và hằng:
Xét các phát biểu
« Mai là nữ
Bình là nam
Mai và Bình là vợ chồng”
Trong FOL, các phát biểu nguyên tố được biểu diễn bởi các vị từ, với các hằng như các đối số:
Nữ(mai)
Nam(bình)
Vợ_chồng(mai, bình)
Kí hiệu hằng: a, b, c,...
Kí hiệu vị từ: P, Q,...
Phạm Thị Anh Lê ĐHSPHN
13
Logic vị từ cấp một
Cú pháp
Biến và lượng từ:
Xét các phát biểu
« Mọi người là nữ hoặc là nam”
« Một người là nam thì sẽ không là nữ”
Trong FOL, các vị từ có thể xem các biến như các đối số, mà giá trị của nó được giới hạn bởi các lượng từ
Nữ(x) ∨Nam(x)
∀x
∀x Nữ(x) →¬ Nam(x)
Kí hiệu biến : x, y, z,...
Kí hiệu lượng từ: ∀, ∃
Suy diễn (tại sao ?)
Mai không là nam
¬Nam(mai)
Phạm Thị Anh Lê ĐHSPHN
14
Logic vị từ cấp một
Cú pháp
Hàm
Xét các phát biểu
« Bố của một người là nam”
Trong FOL, các đối tượng của miền có thể được biểu thị bởi các hàm áp dụng lên các đối
tượng (đối tượng khác)
∀x Nam(Bố (x))
Kí hiệu hàm : f(x1,...xn), g, h,...
Phạm Thị Anh Lê ĐHSPHN
15
Logic vị từ cấp một
Cú pháp
Bảng ký hiệu:
- hằng: a, b, c,...
- biến: x, y, z,...
- hàm: f(x1,...,xn), g, h,...
- các ký tự tân từ: P, Q,...
- các liên kết logic: ∧, ∨, ¬, ⇒, ⇔
- các lượng từ: ∀, ∃
- dấu ngoặc
Phạm Thị Anh Lê ĐHSPHN
16
Logic vị từ cấp một
Cú pháp
Công thức được xây dựng:
Hạng thức (term):
(i) Mọi biến và hằng
(ii) Nếu f là hàm n-ngôi và t1,..., tn là các hạng thức thì f(t1, ...,
tn) cũng là một hạng thức
Công thức nguyên tố
φ →P(t ,...,t )
1
n
Phạm Thị Anh Lê ĐHSPHN
17
Logic vị từ cấp một
Cú pháp
Công thức được xây dựng:
Công thức được thiết lập đúng đắn (wff – well-formed formula):
(i) Mọi công thức nguyên tố
(ii) Nếu f, g là các wff thì f∧g, f∨g, ¬f, f⇒g, f⇔g là các wff
(iii) Nếu f là wff thì tác động lượng từ ∀, ∃ vào f được công
thức được thiết lập đúng đắn
literal là một công thức nguyên tố hay dạng phủ định của công thức
nguyên tố
công thức dương (không có ¬)
Phạm Thị Anh Lê ĐHSPHN
18
Logic vị từ cấp một
Cú pháp
Biến tự do và biến giới hạn:
∀x (R(y, z) ∧∃ y (¬P(y, x) ∨R(y, z)))
Các biến tô màu đỏ gọi là biến tự do, các biến còn lại là biến
giới hạn
Công thức đóng và mở
Một công thức là đóng nếu nó không chứa biến tự do. Khi xây
dựng các lý thuyết, người ta chỉ sử dụng các công thức đóng
Phạm Thị Anh Lê ĐHSPHN
19
Logic vị từ cấp một
Ngữ nghĩa
Thể hiện (Interpretation)
Cho D là một miền khác rỗng
gán mỗi hằng một phần tử thuộc D
gán cho mỗi hàm f n ngôi một ánh xạ Dn→D
gán cho mỗi tân từ P n ngôi một ánh xạ Dn→{0, 1}
Mô hình
Cho W là tập hợp wff. Một mô hình là một thể hiện sao cho mọi công thức thuộc W đều
nhận giá trị đúng.
Phạm Thị Anh Lê ĐHSPHN
20
Logic vị từ cấp một
Cơ chế suy diễn
Hệ quả logic của W
Cho w là một wff, w∈W. Ta nói w là hệ quả logic của W nếu w nhận giá trị TRUE với mọi mô hình của W,
Kí hiệu W╞ w
Phạm Thị Anh Lê ĐHSPHN
21
Logic vị từ cấp một
Cơ chế suy diễn
Hệ quả suy diễn của W
Cho T là một lý thuyết cấp một
(1)
{A1,...,An} là hệ tiên đề
(2)
{R1,...,Rm} là tập qui tắc suy diễn
W là tập các wff, w là một wff, w∈W.
(1)
Ta nói w được suy diễn từ W nếu w được suy diễn từ W bằng cách sử dụng các tiên đề trong hệ và các
(2)
qui tắc suy diễn . Nói cách khác, có một dãy công thức thiết lập đúng đắn f1, f2, ..., ft (ft≡ w),
Kí hiệu W├ w
Phạm Thị Anh Lê ĐHSPHN
22
Logic vị từ cấp một
Cơ chế suy diễn
Cho một lý thuyết cấp một T
Hệ qui tắc suy diễn gọi là đúng nếu
∀w: W├ w kéo theo W╞ w
Hệ qui tắc suy diễn được gọi là đủ nếu
∀w: W╞ w kéo theo W├ w
Phạm Thị Anh Lê ĐHSPHN
23
Logic vị từ cấp một
Cơ chế suy diễn
Hợp nhất hai công thức
Làm cho chúng giống hệt nhau bằng cách thay thế các biến trong một công thức bằng các hạng thức (hằng, biến khác,
hàm)
Không phải bao giờ cũng hợp nhất được
Thuật toán hợp nhất
Phạm Thị Anh Lê ĐHSPHN
24
Logic vị từ cấp một
Cơ chế suy diễn
Hợp nhất hai công thức
Ví dụ:
-
P(a, b) và P(x, y) hợp nhất được
x/a, y/b
-
P(f(x),a) và P(f(f(a)),y) hợp nhất được
x/f(a), y/a
-
P(f(x),a) và P(f(f(x)),x) không hợp nhất được
Phạm Thị Anh Lê ĐHSPHN
25