Tải bản đầy đủ (.docx) (12 trang)

Tìm hiểu về Hệ chuyên gia Prospector

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (289.95 KB, 12 trang )

Học Viện Công Nghệ Bưu Chính Viễn Thông
Khoa Công Nghệ Thông Tin
----------

BÁO CÁO MÔN HỌC
CÁC HỆ THỐNG DỰA TRÊN TRI THỨC

ĐỀ TÀI : TÌM HIỂU VỀ HỆ CHUYÊN GIA PROSPECTOR
Giảng viên hướng dẫn : Nguyễn Quan Hoan
Nhóm lớp : 02
Sinh viên : Nguyễn Thị Hương
Trần Duy Long

1

D12HTTT2

D12HTTT2


Mục Lục

I.
1.


Hệ chuyên gia PROSPECTOR
Giới thiệu về hệ chuyên gia prospector
PROSPECTOR là một trong những ứng dụng của hệ chuyên ,ra đời với
mục đích “Thăm dò khoáng sản” (mineral exploration) được phát triển bởi
Viện nghiên cứu Stanford (Theo Duda et al., 1979). Dự án được khởi động





từ năm 1974 cho tới năm 1983.
PROSPECTOR đã sử dụng kiến trúc hợp nhất nhằm kết hợp các luật và
các mạng ngữ nghĩa. PROSPECTOR có tới hơn 1000 luật giúp tái hiện miền



kiến thức vô cùng rộng lớn.
PROSPECTOR được vận hành theo phương thức tiếp nối (follows). Người
dùng, một nhà thăm dò địa chất học, được yêu cầu đưa các đặc trưng đầu
vào của quặng khoáng sản đang được nghi ngờ: thiết lập địa trắc học, kiến
trúc, các loại đá và khoáng sản. Sau đó chương trình sẽ so sánh những đặc
trưng này với các dạng mẫu của các quặng khoáng sản, hoặc nếu cần thiết,
yêu cầu người dùng tìm kiếm thêm những thông tin bổ sung. Cuối cùng.
PROSPECTOR sẽ đánh giá các quặng tình nghi và đưa ra kết luận.

2




Trong thăm dò địa chất học, một quyết định quan trọng thường được đưa ra
một cách không chắc chắn, với những hiểu biết chưa hoàn thiện và mờ. Để
đối mặt với những hiểu biết này, PROSPECTOR kết hợp với các luật Bayes.
Hệ thống này trợ giúp các nhà địa chất trong việc khai thác một số loại mỏ.
Hệ thống đã mã hóa các tri thức chuyên gia của các nhà địa chất về các loại
mỏ khác nhau vào mô hình để xác định khả năng có mỏ tại một vài nơi theo
các quan sát. Hệ chuyên gia cũng trợ giúp trong việc khoan thăm dò.


2.



Mạng suy luận Prospector
Mỗi mô hình xử lý tri thức được thể hiện trong hệ thống Prospector theo một
mạng suy luận riêng.
Mỗi mạng là tập các nút ứng với những giả thuyết hay sự kiện hiển nhiên,
được liên kết bằng quan hệ không chắc chắn. Một nút sơ khởi, hay nút mạng
các thông tin do tương tác với người dùng cung cấp thể hiện dấu hiệu mà



người dùng nhập vào.
Ta có ví dụ : “ Độ tin cậy là bao nhiêu về khả năng có chất X tại vùng đất
Y?” Thông tin của các nút này lại được sử dụng để xác định độ tin cậy của
nút trung gian khác.
Vỉa thuận lợi
Kết cấu porphyry phù hợp

1, 0.1

50, 0.3

430, 0.1

Đá porphyry trong gốc trẻ
nhất


Kết cấu porphyry phù hợp

Hình thái và kích
thước thuận lợi

1000000, 0.000001
Kết cấu porphyry phù hợp

12, 0.1
10, 0.075

5, 0.005
3

68, 0.2


Kích thước hạt < 0.25
mm

Quartz và khoáng chất

3. Các luật Prospector
3.1.
Khả năng đủ và khả năng
 Khả năng đủ
− Người ta dùng khái niệm khả

Kết cấu aplitic


cần thiết của Bayes.
năng đủ để xảy ra hay còn được gọi là khả

năng đủ LS(Likelihood of Sufficiency)-trợ giúp cho giả thuyết H khi có sự



kiện E.
LS được gọi là khả năng đủ bởi lẽ giá trị của nó cho biết cần cố gắng để tin
vào giả thuyết H ra sao để thấy được sự kiện E.
Ta có công thức tính LS: LS= p(E|H)/ p(E|∼ H).
Mà ta đã biết :
p(∼ H|E)= (p(∼ H)∗ p(E|∼ H)) / p(E).
O(H|E)=p(H|E)/p(~H|E)
⇒ O(H|E)=LS ∗ O(H): Biểu thức này gọi là dạng khả
năng thuận lợi của định lí Bayes.
Vậy triển khai LS ta được :
LS = p(E|H)/ p(E|∼ H)
= O(H |E) / O(H)
= (p(H|E)/p(~H|E)) / (p(H) / p(~H))



Khả năng cần thiết.
Người ta gọi LN( likelihood of necessity) là khả năng cần thiết ,cho phép đo



sự không tin vào giả thuyết H nếu không có sự kiện E.
LN được gọi là khả năng cần thiết bởi giá trị của nó thể hiện sự cố gắng để




phát triển vắng mặt.
Tương tự ta có công thức tính LN:



LN = p(~E/H) / P(~E/~H)
= O(H |~E) / O(H)
4

= (p(H|~E)/p(~H|~E)) / (p(H) / p(~H))


3.2.
Các luật Prospector
− Trong mạng của hệ thống

Prospector có các liên kết LS và LN(vì Prospector

có sử dụng và kết hợp với các luật Bayes).Quan hệ liên kết được cấu trúc


theo luật : IF E THEN H( LS,LN ).
Thuật ngữ E ứng với nút thể hiện dấu hiệu và được nối với nút giả thuyết H.
Liên kết này là không chắc chắn và được diễn tả bằng LS ,LN.
Theo ví dụ ban đầu thì các chuyên gia có dùng các luật :

IF kết cấu vỉa là aplitic THEN vỉa là thuận lợi đối với loại mỏ porphyry[68,0.2]

Với xác suất trước


p(E)= 0,001

p(H)=0.002

Nếu E là nút sơ khởi thì người dùng chung cấp độ tin cậy vào E. Giá trị này
dùng để xác định giá trị liên kết LS và LN, cũng như để tạo mức tin cậy vào
kết luận. Mức độ tin cậy của các nút trung gian, theo cơ chế truyền trong
toàn mạng.

PROSPECTOR dùng tiếp cận Bayes để truyền xác suất trong mạng suy luận.
4.

Các luật nhiều giả thuyết

Khi xác định xác suất gắn với 1 nút , mạng đã dùng thông tin từ nhiều nút.
Thực ra phải khẳng định từ trước về tính độc lập có điều kiện của các thông tin
này. Đây là cách đơn giản để tính xác suất sau của giả thuyết. Nếu ghép thông
tin tại các nút lại với nhau thì người ta thu được 1 giả thuyết chung do thông tin
tại các nút cung cấp. Khi gộp các nút này thì ta có thể thực hiện theo chuẩn
AND hoặc OR.
4.1.
Các luật
− Dạng chung

theo chuẩn AND
của chuẩn AND đối với luật là :


IF AND … AND THEN H
5


Để kết luận được H thì các dấu hiện phải đúng. Mỗi lại dựa vào dấu hiệu .
Ta có mô tả bằng bảng sau :



Chuẩ
n

Dạng chung

AND

IF AND … AND
THEN H

Hình vẽ minh họa

Công thức
p(E|)= min{p(|)}.

AND

C

4.2.
Các luật theo chuẩn OR.

− Dạng chung của luật chuẩn OR


OR

là :
IF OR … OR THEN H .
Ta có mô tả bằng bảng sau :
IF OR… OR
THEN H

p(E| ) = max{p(|)}
C
OR

5.


Cập nhật các điều thuận
PROSPECTOR thay đổi điều thuận của giả thuyết mỗi khi có dấu hiệu được
bổ sung vào hệ thống. Đối với trường hợp dùng luật một giả thiết, điều thuần



đối với H trước được tính là O(H| ) = p(H| )/ (1 - p(H| )).
Giả sử các là độc lập điều kiện thì trong trường hợp dùng luật đa giả thiết
người ta có O(H| , ,… ) = L* O(H), i = 1, 2,… n. L ở đây là tỉ lệ xảy ra khả




năng đúng L = O(H| )/ O(H) = p(, H) / p(| ~H).
Tương tự nếu tất cả dấu hiệu dùng cho H là sai thì :
O(H| ~, ~,… ~) = L* O(H), với i = 1, 2,… n.

L = O(H| ~) / O(H) = p(~, H) / p(~| ~H).
6


6.


Đo độ chắc chắn
Prospector cho phép người ta nhập độ tin cậy về các phần sự kiện hiển
nhiên. Thay vì p(E/E’) thì người ta đưa ra khái niệm mới : độ đo chắc chắn



CF(E/E’).
Trong Prospector thì người ta dùng CF(E/E’) là độ chắc chắn về E khi có
dấu hiệu quan sát được E’. Và ta có -5≤CF≤5.
Với : -5 ứng với E chắc chắn sai, 5 ứng với E chắc chắn đúng,và giá trị ở
giữa là 0 ứng với “không biết”.












II.

Người ta có thể ánh xạ giá trị đo chắc chắc sang xác suất của sự kiện theo:
• IF CF(E| = -5
THEN p(E| = 0;
• IF CF(E| = 0
THEN p(E| = P(E);
• IF CF(E| = +5
THEN p(E| = 1;
Để thể hiện quan hệ các đoạn tuyến tính giữa p(H| và p(E| , người ta chi tiết
hóa như sau:
• Với 0 p(E| p(E) thì CF(E| = 5 * (p(E| – p(E)) / p(E); và
• Với p(E) p(E| 1 thì CF(E| = 5 * (p(E| – p(E)) / (1 - p(E)).
Hai đẳng thức này có thể xác định p(E| dựa theo tin tưởng do người dùng
cung cấp về dấu hiệu CF(E| .
• Nếu CF(E| > 0 thì p(E| = [CF(E| * (1 - p(E| ) + 5 * p(E)] / 5;
• Và ngược lại thì p(E| = [CF(E| * p(E| ) + 5 * p(E)] / 5.
Hai xác suất sau của H khi đã có E có thể được đánh giá theo LS và xác suất
trước về H là
p(H| E = LS * O(H) / (1 + LS * O(H)).
Tương tự :
p(H| = LN * O(H) / (1+ LN * O(H)).
Người ta ước lượng nhân tố chắc chắn được cập nhật với các giả thuyêt vừa
nêu theo cách sau :
• Nếu 0 p(E| p(E) thì CF(H| = 5 * (p(E| – p(E)) / p(E);
• Nếu p(E) p(E| 1 thì CF(H| = 5 * (p(E| – p(E)) /( 1 - p(E));
• Trong đó p(H| ) = O(H| , ,… ) / (1 + O(H| , ,… )).

Thí dụ dùng PROSPECTOR

Sau khi tiếp tục nghiên cứu và ứng dụng trên Prospector thì đến năm 1981 đã
phát triển ngôn ngữ công nghệ tri thức gọi là KAS. Ngôn ngữ này về cơ bản

7


thì có khung hệ thống giống của Prospector , tuy nhiên lại không giữ các tri
thức về địa lí.
1.


Bài Toán
Ta có bài toán ví dụ sau : Một người cần quyết định xem có nên mua oto
hay không? Với giả thuyết là : “ không mua”.
− Mạng suy luận sử dụng các luật :
a. R1. Điều kiện xe tồi (kí hiệu là sự kiện ) OR giá cao (kí hiệu là sự kiện )
b.
c.
d.

THEN không mua xe (kí hiệu là giả thuyết )
R2. Xe đi quá 100.000 dặm () AND xe chỉ đi trong thành phố () AND
thân xe xấu () THEN điều kiện là xe tồi ()
R3. IF xe bị lõm () THEN thân xe xấu () (LS = 1000, LN = 0.001)
R4. IF xe rỉ () THEN thân xe xấu () (LS = 100, LN = 1)
.
− Ta có mô tả hình học như sau :


H1. Không mua
OR
E1. Điều kiện tồi

E2. Giá cao
1

AND
E3.Đi quá 100.000
E5. Điều kiện
E4.xe
Chỉtồiđi trong thành phố
dặm
5

5
E6. Bị lõm

E7. Có gỉ

4

-1

8


Hình 2. Mạng suy luận “không mua xe”
Hai luật R3, R4 cùng kết luận nhưng giá trị LS, LN khác nhau. Theo R3 thì “xe bị
lõm” rất thuận lợi để “điều kiện xe tồi” và việc không quan tâm đến vết lõm là rất

có lợi để ủng hộ kết luận. Còn R4 thì “xe gỉ” là tạm thuận lợi cho kết luận và
không thấy gỉ cũng không ảnh hưởng gì mấy.
2.

Tương tác hệ thống với người dùng.

Giả sử các chuyên gia đã cho xác suất trước của các dấu hiệu là 0.1 hay p()=0.1
Khi đó phiên tương tác hỏi đáp sẽ là :











3.

Hệ thống: với giả thuyết xe chạy trên 100.000 dặm, thì mức độ tin là bao
nhiêu? ().
Người dùng: 5.
Hệ thống: Mức độ tin về giả thuyết xe chạy trong thành phố hợp? ().
Người dùng: 5.
Hệ thống: Mức độ tin vào việc xe bị lõm là phù hợp? ().
Người dùng: 4
Hệ thống: Mức độ tin vào việc xe rỉ là phù hợp? ().
Người dùng: -1.

Hệ thống: Mức độ tin vào việc giá xe cao là phù hợp? ().
Người dùng: 1.
⇒Kết luận: điều chắc chắn của tôi trong việc không mua xe là 3.97.
Truyền giá trị xác suất.

Tại sao kết quả của ví dụ trên lại là 3.97 ???
Ta thực hiện các thao tác truyền bá giá trị xác suất .Khi đó ta có các bước làm:
1)

CF(| ) = CF(| ) = 5; người dùng quan sát thấy và là toàn bộ chắc chắc cho
và .

2)

Ta cần tìm sự chắc chắn cho . Mà lại được và hỗ trợ. Nên ta cần tìm CF(| )
theo các bước sau :
9


a)
b)

Tính O(). O() = p() / (1 - p()) = 0.111
Tính P(| ) và P(| )
LS = 1000 và LN = 0.001 cho trường hợp
p(| ) = LS * O() / (1 + LS * O()) = 0.9911
p(| ~) = LS * O() / (1 + LN * O()) =

c)


Tính p(| ) và p(| ~)
LS=100 và LN=1
p(| ) = LS * O() / (1 + LS * O()) = 0.9174
p(| ~) = LS * O() / (1 + LN * O()) = 0.1

d)

Ta có CF(| )=4>0 nên :
p(| ) = [CF(| ) * (1- p()) + 5 * p()] / 5 = 0.82

e)

Ta có có CF(| )= -1<0 nên :
p(| ) = [CF(| ) * p() + 5 * p()] / 5 = 0.08

f)

Do 0.1 = p() p(| ) = 0.82 nên người ta tìm p(| ) :
p(| ) = [(p() - p(| ) * p()) / (1 - p()] +
[p(| ) * (p(| ) - p() / (1 - p())]
= 0.8129

g)

Do 0.08 p(| ) = p() = 0.1 nên người ta tính p(| ) theo:
p(| ) = p(| ~) + (p(| ) / p()) * (p() - p(| ))
= 0.1

h)


Các giá trị thuận được cập nhật:
O(| ) = p(| ) / (1- p(| )) = 4.34;
O(| ) = p(| ) / (1- p(| ))= = 0.111

i)

Giá trị thuận tổng cộng trên theo quan sát và , và lưu ý rằng vì LN = 1
nên trả lời âm tính đối với không làm giảm các giá trị thuận cập nhật.
O(| , ) = [O(| ) / O() * [O(| ) / O()] * O()
10


= 4.379
j)
k)

Tiếp theo là: p(| ) = O(| , ) / (1 - O(| , )) = 0.814
Do 0.814 = p(| ) > p() = 0.1 nên cuối cùng người ta tìm được độ tin
cậy vào theo quan sát và theo:
CF(| , ) = 5 * (p(| ) - p()) / (1 - p()) = 3.97

3)

Ta xác định độ tin tưởng vào theo quan sát theo luật R2 theo chuẩn AND:
CF() = min{5, 5, 3.97} = 3.97

4)

Độ tin tưởng vào theo luật R1 theo chuẩn OR:
CF() =max{3.97, 0.1} = 3.97.


⇒ Vậy điều chắc chắn trong việc không mua xe là 3.97
4.
-

Khẳng định lại kết quả
Do giá trị tin cậy là 3.97 nằm trong vùng xác định tin cậy [-5,5] nên bài
toán này “thành thật khuyên rằng không nên mua xe “nếu có những dấu hiệu

-

trên.
Sau khi tương tác với người dùng, truyền các giá trị xác suất và đưa ra
được kết quả của độ tin cậy thì hệ thống cần xác định lại một lần nữa kết quả
đã đưa ra. Việc khẳng định này làm tăng tính tin tưởng vào kết luận của hệ

III.

thống.
Tài liệu tham khảo

[1] Đỗ Trung Tuấn, “Hệ chuyên gia”, NXB Giáo dục 1999
[2] Phan Huy Khánh,“Hệ chuyên gia”, Nhà xuất bản Khoa học và Kỹ thuật 2004.
[3] Michael Negnevitsky -Artificial Intelligence,Second Edition
[4] Geogre F. Luger – Artificial Intelligence, Structures and Strategies for
Complex Problem Solving– Addison – Wesley Publishing Company, Inc – 2002

11



12



×