Tải bản đầy đủ (.ppt) (49 trang)

Chương 3: CÁC PHƯƠNG PHÁP BIỂU DIỄN TRI THỨC VÀ XỬ LÝ TRI THỨC ppsx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (683.6 KB, 49 trang )

CHƯƠNG 3 :
CÁC PHƯƠNG PHÁP BIỂU
DIỄN TRI THỨC VÀ XỬ LÝ
TRI THỨC
2
1. Giới thiệu
So với chương trình truyền thống (được cấu
tạo từ hai "chất liệu" cơ bản là
dữ liệu

thuật toán
), chương trình trí tuệ nhân tạo
được cấu tạo từ hai thành phần là
cơ sở
tri thức
(knowledge base) và
động cơ suy
diễn (inference engine).

3
1. Giới thiệu
(tt)

Cơ sở tri thức : là tập hợp các tri thức liên quan
đến vấn đề mà chương trình quan tâm giải
quyết.

Động cơ suy diễn : là phương pháp vận dụng tri
thức trong cơ sở tri thức để giải quyết vấn đề.
4
1. Giới thiệu


(tt)
Cơ sở tri
thức là một
dạng dữ liệu
đặc biệt

Động cơ suy diễn là một dạng của
thuật toán đặc biệt
5
1. Giới thiệu
(tt)
Cấu trúc của một chương trình trí tuệ nhân tạo.
2. Phân loại tri thức:
Tri thức sự kiện : là các khẳng định về một sự kiện,
khái niệm nào đó (trong một phạm vi xác định). Các định
luật vật lý, toán học, thường được xếp vào loại này.
(Chẳng hạn : mặt trời mọc ở đằng đông, tam giác đều có
3 góc 60
0
, )
Tri thức thủ tục : thường dùng để diễn tả phương
pháp, các bước cần tiến hành, trình từ hay ngắn gọn là
cách giải quyết một vấn đề. Thuật toán, thuật giải là một
dạng của tri thức thủ tục.
Tri thức mô tả : cho biết một đối tượng, sự kiện, vấn
đề, khái niệm, được thấy, cảm nhận, cấu tạo như thế
nào (một cái bàn thường có 4 chân, con người có 2 tay, 2
mắt, )
Tri thức Heuristic : là một dạng tri thức cảm tính. Các
tri thức thuộc loại này thường có dạng ước lượng, phỏng

đoán, và thường được hình thành thông qua kinh nghiệm.
7
Sự phân lớp của tri thức:
S i e âu t r i t h ö ùc
T r i t h ö ùc
T h o ân g t i n
D ö õ l i e äu
D ö õ l i e äu t o ái n g h ó a , c h ö a r o õ r a øn g
3. Đặc điểm của tri thức:
Làm thế nào để phân biệt thông tin vào máy tính là dữ liệu hoặc tri
thức. Giữa tri thức và dữ liệu có một số đặc trưng khác nhau.
Tự giải thích nội dung: Tri thức tự giải thích nội dung còn dữ liệu
không tự giải thích được. Chỉ có người lập trình mới hiểu được nội dung
ý nghĩa các dữ liệu.
Ví dụ:
Dữ liệu là số 7.
Tri thức là số 7: là số lẻ, là số nguyên tố, là số dương,…
Tính cấu trúc: Một trong những đặc trưng cơ bản của hoạt động nhận
thức con người đối với thế giới xung quanh là khả năng phân tích cấu
trúc các đối tượng.Ở mức đơn giản nhất là cấu trúc: là một bộ phận
của toàn thể, là một giống của một loài nào đó, là phần tử của lớp nào
đó.
Tri thức đưa vào máy cũng cần có khả năng tạo được phân cấp giữa
các khái niệm và quan hệ giữa chúng.
3. Đặc điểm của tri thức:
(tt)
Tính liên hệ: Ngoài các quan hệ về cấu trúc của mỗi tri
thức (khái niệm, quá trình, sự kiện, hiện tượng,…) giữa
các đơn vị tri thức còn có nhiều mối liên hệ khác (không
gian, thời gian, nhân-quả, …)

Ví dụ: Các khái niệm: chó, sủa, động vật, bốn chân,
đuôi.
10
Đặc điểm của tri thức:
(tt)
-
Có tính chủ động:
Dữ liệu hoàn toàn bị động do con người khai thác, còn
tri thức thì có tính chủ động. Khi hoạt động bất kỳ ở
đâu trong lĩnh vực nào, con người cũng bị điều khiển
bởi tri thức của mình. Các tri thức biểu diễn trong máy
tính cũng vậy, chúng chủ động hướng người dùng biết
cách khai thác dữ liệu.
4. CÁC PHƯƠNG PHÁP BIỄU DIỄN
TRI THỨC
1. Logic mệnh đề:
-
Định nghĩa: Mệnh đề là một khẳng định có thể nhận giá trị
đúng hoặc sai.
2. Logic vị từ :
-
Định nghĩa: là sự mở rộng của logic mệnh đề bằng cách
đưa vào các khái niệm vị từ và các lượng từ phổ thông
dụng (∀, ∃).

Một mệnh đề = các đối tượng tri thức + mối liên hệ giữa
chúng (gọi là vị từ).

Các mệnh đề sẽ được biểu diễn dưới dạng :


Vị từ (<đối tượng 1>, <đối tượng 2>, …, <đối tượng n>)

Như vậy để biểu diễn vị của các trái cây, các mệnh đề sẽ
được viết lại thành :

Cam có vị Ngọt ~ Vị (Cam, Ngọt)

Cam có màu Xanh ~ Màu (Cam, Xanh)
12
4. CÁC PHƯƠNG PHÁP
BIỄU DIỄN TRI THỨC
(tt)

Câu cách ngôn "Không có vật gì là lớn nhất và không có
vật gì là bé nhất!" có thể được biểu diễn dưới dạng vị từ
như sau :

LớnHơn(x,y) = x>y

NhỏHơn(x,y) = x<y

" ∀ x ∃ y : LớnHơn(y,x) và " ∀ x ∃ y : NhỏHơn(y,x)

Câu châm ngôn "Gần mực thì đen, gần đèn thì sáng"
được hiểu là "chơi với bạn xấu nào thì ta cũng sẽ thành
người xấu" có thể được biểu diễn bằng vị từ như sau :

NgườiXấu (x) = ∃ y : Bạn(x,y) và NgườiXấu(y)

Công cụ vị từ đã được nghiên cứu và phát triển thành

một ngôn ngữ lập trình đặc trưng cho trí tuệ nhân tạo.
Đó là ngôn ngữ PROLOG.
13
MỘT SỐ THUẬT GIẢI LIÊN
QUAN ĐẾN LOGIC MỆNH ĐỀ
Thuật toán Vương Hạo (Havard – 1960):
Bước 1: Phát biểu lại giả thiết và kết luận của vấn đề dưới
dạng chuẩn như sau:
GT1, GT2, …, GTn → KL1, KL2, … KLm
Trong đó các GTi và KLj được xây dựng từ các biến mệnh đề
và các phép toán ∧, ∨, ¬.
Bước 2: Chuyển vế các GTi và KLj có dạng phủ định.
Ví dụ:
p ∨ q, ¬(r ∧s), ¬q, p∨r → s, ¬p
⇒p ∨ q, p∨r, p → s, r ∧s, q
Bước 3: Thay dấu “∧” ở trong GTi và dấu “∨” ở trong KLj bằng
dấu “,” (phẩy).
Ví dụ:
p ∨ q, r ∧ (¬p ∨ s) → ¬q ∨ ¬r
⇒ p, q, r, ¬p ∨s → ¬q, ¬r
14
Thuật toán Vương Hạo
(Havard – 1960)
Bước 4: Nếu GTi còn dấu “∨” và KLj còn dấu “∧” thì dòng đó được tách
thành hai dòng con.
Ví dụ:
Bước 5: Nếu một dòng được chứng minh: nếu tồn tại chung một mệnh
đề ở cả 2 vế thì coi như đúng.
Ví dụ: p, q → p: mệnh đề đúng
Bước 6:

+ Nếu một dòng không còn dấu liên kết tuyển và hội mà cả ở hai vế đều
không có chung biến mệnh đề nào thì dòng đó không được chứng minh.
Ví dụ: p, ¬q → q
+ Một vấn đề được giải quyết một cách trọn vẹn nếu mọi dòng dẫn xuất
từ dạng chuẩn được chứng minh.
Lưu ý:
Từ bước 2 đến bước 4 không cần làm theo thứ tự.
p,
¬
p

q

q
p, ¬p → q p, q → q
doøng 1 doøng 2
15
Thuật toán Vương Hạo
(Havard – 1960)
Khi một vấn đề được phân thành n vấn đề con, ta phải
chứng minh tất cả các mệnh đề con đều đúng thì mệnh
đề đầu mới đúng. Nếu chứng minh được một mệnh đề
con sai thì mệnh đề chính sai.
Ví dụ: Giả sử có một vấn đề được hiểu dưới dạng chuẩn
sau, hãy chứng minh vấn đề này đúng hay sai.
Kết luận: Vấn đề trên sai.

r, ¬p ∨ s → ¬q, ¬r ∧ s

Ta coù:

r, ¬p → ¬q, ¬r ∧ s r, s → ¬q, ¬r ∧ s

r, ¬p → ¬q, ¬r r, ¬p → ¬q, s r, s → ¬q, ¬r r, s → ¬q,s

khoâng chöùng minh khoâng chöùng minh khoâng chöùng minh chöùng minh
16
Thuật toán Vương Hạo
(Havard – 1960)
Đánh giá giải thuật: Nếu ở một dòng có n dấu
∧, ∨ thì:
+ Để lập bảng chân trị cần 2n cột để xét giá
trị.
+ Nếu dùng thuật toán thì phải tách ra 2n
dòng.
⇒ Độ phức tạp của thuật toán đơn giản hơn
phương pháp lập bảng chân trị.
17
Thuật toán Robinson (1961)
Bước 1: Phát biểu lại giả thiết và kết luận của vấn
đề dưới dạng chuẩn như sau:
GT1, GT2, …, GTn → KL1, KL2, … KLm
Trong đó các GTi và KLj được xây dựng từ các
biến mệnh đề và các phép toán ∧, ∨, ¬.
Bước 2: Biến đổi dòng trên thành danh sách các
mệnh đề:
{GT1, GT2, …, GTn, ¬KL1, ¬KL2, …, ¬KLm}
Bước 3: Nếu trong danh sách mệnh đề có 2 mệnh
đề đối ngẫu nhau thì vấn đề được giải quyết xong.
Nếu không thì chuyển sang bước 4.
18

Thuật toán Robinson (1961)
Bước 4: Xây dựng một mệnh đề mới bằng cách
tuyển một cặp mệnh đề từ danh sách mệnh đề ở
bước 2. Nếu mệnh đề mới có các biến mệnh đề đối
ngẫu thì các biến mệnh đề đó được loại bỏ.
Ví dụ:
(p ∨¬q) ∨ (¬r ∨ s ∨ q)
⇒p ∨ ¬r ∨ s
Bước 5: Bổ sung mệnh đề mới này vào danh sách
các mệnh đề và loại bỏ 2 mệnh đề được tuyển
thành mệnh đề mới đó.
Bước 6: Nếu không xây dựng thêm được mệnh đề
mới nào và trong danh sách các mệnh đề không có
2 mệnh đề nào đối ngẫu nhau thì vấn đề phát biểu
ở dạng chuẩn của bước 1 là sai
19
Thuật toán Robinson (1961)
Ví dụ: Có một vấn đề phát biểu ở dạng
chuẩn như sau, hãy chứng minh vấn đề
đúng hay sai:
¬p ∨ q, ¬q ∨ r, ¬r ∨ s, ¬u ∨ ¬s → ¬p, ¬u
{¬p ∨ q, ¬q ∨ r, ¬r ∨ s, ¬u ∨ ¬s, p, u}
{¬p ∨ r, ¬r ∨ s, ¬u ∨ ¬s, p, u}
{¬p ∨ s, ¬u ∨ ¬s, p, u}
{¬p ∨ ¬u, p, u}
{¬u, u}
Kết luận: Điều phải chứng minh là đúng
20
5. BIỂU DIỄN TRI THỨC BẰNG
LUẬT SINH

Các luật sinh có dạng: P1 ∧ P2 ∧ P3 ∧ … ∧ Pm → Q.
Tùy thuộc vào bản chất của lĩnh vực đang quan tâm mà có
những ngữ nghĩa khác nhau về luật sinh:
Trong logic vị từ:
P1, P2, …, Pm, Q : là những biểu thức logic
→ : phép kéo theo
Trong ngôn ngữ lập trình: if P1 and P2 and … and Pm then
Q
Trong ngôn ngữ tự nhiên. Ví dụ: one → một.
Trong hệ chuyên gia (Expert System):
+ Cơ sở dữ liệu các sự kiện: F = {f
1
, f
2
, …, f
k
} (F: Fact –
Sự kiện)
+ Cơ sở luật sinh: f
i1
∧ f
i2
∧ … ∧ f
ik
→ Q (R: Rule – Luật)
21
5. BIỂU DIỄN TRI THỨC BẰNG
LUẬT SINH
(tt)
Ví dụ: Cho một cơ sở tri thức sau:

+ Cơ sở sự kiện: H, K
+ Tập các luật (quy tắc):
(R1): A → E
(R2): B → D
(R3): H → A
(R4): E ∧ G → C
(R5): E ∧ K → B
(R6): D ∧ E ∧ K → C
(R7): G ∧ K ∧ F → A
22
Cơ chế suy luận
trên các luật sinh
Suy luận tiến:
là quá trình suy luận xuất phát từ một số sự kiện ban đầu,
xác định các sự kiện có thể được "sinh" ra từ sự kiện này.
Sự kiện ban đầu : H, K
Ta có: {H, K}
Từ (R3): H → A thì {A, H, K}
(R1): A → E thì {A, E, H, K}
(R5): E ∧ K → B thì {A, B, E, H, K}
(R2): B → D thì {A, B, D, E, H, K}
(R6): D ∧ E ∧ K → C thì {A, B, C, D, E, H, K}
23
Cơ chế suy luận
trên các luật sinh
Suy diễn lùi : là quá trình suy luận ngược xuất phát từ một số sự kiện
ban đầu, ta tìm kiếm các sự kiện đã "sinh" ra sự kiện này.
(R1): A → E
(R2): B → D
(R3): H → A

(R4): E ∧ G → C
(R5): E ∧ K → B
(R6): D ∧ E ∧ K → C
(R7): G ∧ K ∧ F → A
24
Vấn đề tối ưu luật
Rút gọn bên phải
Luật sau hiển nhiên đúng :
A V B -> A
Do đó luật
A V B -> A -> C
Là hoàn toàn tương đương với
A V B -> C
Quy tắc rút gọn

: Có thể loại bỏ những sự kiện bên vế
phải nếu những sự kiện đó đã xuất hiện bên vế trái. Nếu
sau khi rút gọn mà vế phải trở thành rỗng thì luật đó là
luật hiển nhiên. Ta có thể loại bỏ các luật hiển nhiên ra
khỏi tri thức.
25
Vấn đề tối ưu luật
Rút gọn bên trái
Xét các luật :
(L1) A, B -> C {sự kiện B trong luật là dư thừa, và có thể loại bỏ được}
(L2) A -> X
(L3) X -> C
Luật A, B -> C có thể được thay thế bằng luật A -> C mà không làm
ảnh hưởng đến các kết luận.
Phân rã và kết hợp luật

Ví dụ: Luật A V B -> C
Tương đương với hai luật
A -> C
B -> C

×