Tải bản đầy đủ (.pdf) (72 trang)

Nghiên cứu suy diễn xác suất trong các hệ trị thức f luật

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (763.81 KB, 72 trang )

bộ giáo dục và đào tạo
trờng đại học Bách khoa hà nội

NgÔ thị HIềN

Nghiên cứu suy diễn xác suất
trong các hệ tri thức F-luật
Chuyên ngành: Công nghệ Thông tin

LUậN VĂN THạC Sĩ khoa học
Công nghệ thông tin

Ngời hớng dẫn khoa học:
PGS. TS. Nguyễn Thanh Thủy

Hà Nội - 2010


MỤC LỤC
Trang
LỜI CẢM ƠN

3

LỜI CAM ĐOAN

4

MỞ ĐẦU

5



Chương 1. SUY DIỄN XÁC SUẤT

11

1.1. Biểu diễn tri thức theo cách tiếp cận xác suất

11

1.2. Thế giới có thể và xác suất trên lớp thế giới có thể

13

1.2.1. Thế giới có thể

13

1.2.2. Xác suất trên lớp thế giới có thể

14

1.3. Suy diễn xác suất ngoài

15

1.3.1. Logic xác suất giá trị khoảng

15

1.3.2. Toán tử suy diễn xác suất ngoài


16

1.4. Suy diễn xác suất trong

19

1.4.1. Biểu diễn tri thức với C-luật, F-luật

21

1.4.2. Toán tử suy diễn trong với C-luật, F-luật

22

1.5. Ví dụ áp dụng

25

Kết luận chương 1

30

Chương 2. HỆ TRI THỨC F-LUẬT

31

2.1. Các định nghĩa về hệ tri thức F-luật

31


2.2. Các toán tử suy diễn

32

2.2.1. Toán tử suy diễn tổng thể

32

2.2.2. Toán tử suy diễn bộ phận

32

2.3. Tính dừng, ổn định, mâu thuẫn của các hệ tri thức F-luật

34

2.4. Biểu diễn hệ tri thức F-luật

35

1


2.5. Ví dụ áp dụng

39

Kết luận chương 2


43

Chương 3. SUY DIỄN TRONG HỆ TRI THỨC F-LUẬT ĐƠN ĐIỆU

45

3.1. Hệ tri thức F-luật đơn điệu

45

3.1.1. Các định nghĩa

45

3.1.2. Siêu luật và phép đơn điệu hóa

46

3.2. Suy diễn trong hệ tri thức F-luật đơn điệu mạnh

48

3.2.1. Định nghĩa hệ tri thức F-luật đơn điệu mạnh

48

3.2.2. Tính ổn định của hệ tri thức F-luật đơn điệu mạnh

49


3.3. Suy diễn trong hệ tri thức F-luật đơn điệu yếu

52

3.4. Hệ tri thức F-luật đơn điệu với phép lập luận bộ phận
và phép lập luận tổng thể

55

3.4.1. Tính ổn định của hệ tri thức F-luật đơn điệu với phép lập luận
tổng thể và phép lập luận bộ phận

55

3.4.2. Hiệu quả của phép lập luận bộ phận

57

3.5. Ví dụ áp dụng

58

Kết luận chương 3

63

Chương 4. MỘT SỐ VẤN ĐỀ VÀ GIẢI PHÁP

64


4.1. Đặt vấn đề

64

4.2. Vấn đề 1

65

4.3. Vấn đề 2

68

Kết luận chương 4

69

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

70

TÀI LIỆU THAM KHẢO

71

2


LỜI CẢM ƠN
Luận văn được hoàn thành dưới sự hướng dẫn của PGS. TS. Nguyễn Thanh
Thủy, Trường Đại học Bách khoa Hà Nội. Em xin được bày tỏ lòng biết ơn chân

thành và sâu sắc tới thầy hướng dẫn, người đã định hướng đề tài và chỉ bảo tận tình
để có được những kết quả trong luận văn này.
Em xin trân trọng cảm ơn Ban lãnh đạo, các thầy cô giáo, cán bộ viên chức
của Viện Sau đại học và Viện Công nghệ Thông tin và Truyền thông, Trường Đại
học Bách khoa Hà Nội về sự quan tâm, giảng dạy và giúp đỡ tận tình.
Em xin chân thành cảm ơn lãnh đạo, cán bộ viên chức Trường Đại học Sư
phạm Hà Nội 2, các thầy cô giáo, các bạn đồng nghiệp Khoa Công nghệ Thông tin,
Trường Đại học Sư phạm Hà Nội 2 đã tạo điều kiện thuận lợi và giúp đỡ trong suốt
quá trình học tập và công tác.
Xin được gửi lời tri ân tới các bạn trong lớp Cao học Công nghệ Thông tin
khóa 2008-2010, Trường Đại học Bách khoa Hà Nội đã sẻ chia, giúp đỡ trong quá
trình học tập và nghiên cứu.

3


LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi, dưới sự hướng
dẫn khoa học của PGS. TS. Nguyễn Thanh Thủy, Trường Đại học Bách khoa
Hà Nội.
Các căn cứ, số liệu, trích dẫn và kết quả nêu trong luận văn là trung thực.

Hà Nội, ngày 28 tháng 9 năm 2010
Tác giả

Ngô Thị Hiền

4



MỞ ĐẦU
Tri thức luôn là một nhân tố quan trọng trong sự phát triển kinh tế xã hội. Tri
thức tác động đến mọi lĩnh vực hoạt động khoa học, văn hóa, kinh tế. Vì vậy, con
người luôn muốn tìm kiếm, thu thập thật nhiều tri thức với mục đích làm tăng lượng
kiến thức về mọi lĩnh vực trong cuộc sống, để sáng tạo ra những thành tựu mới
nhằm nâng cao chất lượng cuộc sống.
Ngày nay khi khoa học kĩ thuật và công nghệ đã phát triển đến trình độ rất
cao, con người ngày càng chuyển giao cho máy móc không chỉ các thao tác hoạt
động cơ bắp mà còn truyền cho nó cả các thao tác hoạt động trí tuệ. Kết quả là tạo
ra những máy móc có tính thông minh. Những máy móc có khả năng đưa ra những
tín hiệu điều khiển dựa trên việc phân tích các tín hiệu phản hồi, mô phỏng theo các
hoạt động tư duy của bộ não con người được gọi là trí tuệ nhân tạo. Với độ thông
minh nhất định, mặc dù không dự báo trước được tương lai, nhưng máy tính thực sự
có ảnh hưởng lớn tới cuộc sống ngày nay và tương lai phát triển của văn minh nhân
loại. Nó sẽ luôn là công cụ hữu hiệu trợ giúp con người trong một số loại hoạt động
trí óc để tạo ra những tri thức mới phù hợp với nhu cầu của thời đại. Nhiều phương
pháp khoa học và giải pháp công nghệ khác nhau để biểu diễn, thu thập, tìm kiếm,
xử lí và quản trị tri thức đã được đề xuất nhằm tiếp cận tới những tri thức đa dạng,
đặc trưng riêng cho các ứng dụng của thực tế.
Giai đoạn đầu tiên trong ứng dụng máy tính điện tử vào mô phỏng và trợ giúp
các hoạt động trí tuệ gắn với quan điểm tất định luận trong nhận thức, một quan
điểm đã thống trị trong khoa học suốt nhiều thế kỉ. Trong các lí thuyết khoa học,
mỗi tri thức phải là một chân lí mà tính đúng đắn của nó phải được thừa nhận là
hoàn toàn chắc chắn và một phán đoán đưa ra luôn có giá trị chân lí hoặc đúng,
hoặc sai. Ngôn ngữ thông dụng biểu diễn tri thức có thể quy về dạng ngôn ngữ của
logic mệnh đề và logic tân từ. Các phương pháp suy luận nhằm tìm ra các phán
đoán đúng mới từ các phán đoán ban đầu, tuân theo các quy luật của logic hình thức
cổ điển, về cơ bản đã được hình thành từ thời Aristotle với các quy luật đồng nhất,

5



phi mâu thuẫn, bài trung, phủ định kép, các quy luật quy định mối quan hệ giữa các
loại phán đoán phổ biến, đặc thù và đơn nhất, và với phép suy luận diễn dịch kiểu
tam đoạn luận hay modus ponens. Sơ đồ chung của các bài toán được đặt ra như
sau: Cho một số tri thức ban đầu (có thể là tập các điều kiện, một tiên đề, …), và
một mệnh đề đích. Vấn đề là xây dựng một phương pháp chung để từ đó tìm một
chuỗi suy luận hợp logic sao cho từ các tri thức ban đầu suy ra được mệnh đề đích.
Những phương pháp chung như vậy được xây dựng rất công phu và chủ yếu dựa
vào các kết quả nghiên cứu logic. Các phương pháp chung này đã được đưa vào ứng
dụng và thu được nhiều thành tựu trong các lĩnh vực khác nhau.
Hướng nghiên cứu về xử lí trong các hệ tri thức chắc chắn đã, đang và vẫn sẽ
tiếp tục phát triển mạnh mẽ. Tuy vậy, khi mở rộng phạm vi ứng dụng sang các lĩnh
vực đa dạng của cuộc sống thì gặp nhiều vấn đề mới. Đây chính là lí do cần có
những quan điểm mới về tri thức và các quá trình lập luận trên các tri thức đó.
Trong nhiều lĩnh vực của thực tế, việc yêu cầu mọi tri thức đều có tính chân lí chắc
chắn như trong các hệ tri thức chắc chắn nói chung khó được đáp ứng. Phần lớn tri
thức mà con người có được trong cuộc sống hàng ngày đều là dạng hoặc không
chắc chắn, hoặc không đầy đủ. Đối với những loại tri thức này, khó có thể xác định
được chân lí của nó là đúng hay sai. Nhiều loại hệ tri thức đã được đưa ra nhằm tiếp
cận gần hơn với những tri thức trong thực tế trên.
Tri thức không chắc chắn có thể do chỉ biết một cách mơ hồ về các khái niệm,
có thể là do không biết chính xác điều gì đã xảy ra. Trong trường hợp mơ hồ về khái
niệm, một trong những cách tiếp cận đáng chú ý là tập mờ của Zadeh. Ví dụ nói:
“con gái có tóc dài thì xinh” là mơ hồ do không thể nói đúng sai về các khái niệm
“tóc dài” và “xinh”. Theo Zadeh, những khái niệm như vậy là những tập mờ và
được cho một cách chủ quan bởi các hàm thuộc trên những tập giá trị thích hợp. Từ
việc biểu diễn những khái niệm mơ hồ đó, Zadeh cũng như các nhà nghiên cứu sau
này đã xây dựng logic tập mờ và đã có nhiều ứng dụng. Các tri thức không chắc
chắn có thể được mô tả bởi lí thuyết xác suất. Nguồn gốc của lí thuyết xác suất liên

quan chủ yếu đến các trò chơi cá cược và những bài toán tổ hợp. Xác suất có thể

6


được nhìn từ hai góc độ khác nhau, đó là: xác suất theo nghĩa tần suất hay thống kê
được xem là xác suất khách quan; xác suất chủ quan xuất phát từ những đánh giá
chủ quan của một cá nhân về mức độ đúng đắn của một số phán đoán nào đó.
Từ những năm đầu của thập kỉ 80, mô hình xác suất mới thực sự được chấp
nhận để xử lí thông tin không chắc chắn, mặc dù có lịch sử phát triển lâu dài. Mô
hình logic xác suất và lập luận trong [6] đã đề xuất việc kết hợp logic và xác suất cổ
điển, dựa trên việc xác định phân bố xác suất cho tập các thế giới có thể. Mỗi thế
giới có thể được hiểu như là một phép gán phi mâu thuẫn giá trị chân lí cho các
mệnh đề trong cơ sở tri thức. Cụ thể hơn, từ các tri thức ban đầu ta có thể xác định
hệ ràng buộc cho phân bố xác suất trên các thế giới có thể. Hệ ràng buộc này chưa
đủ thông tin để có thể xác định được giá trị cho phân bố xác suất trên các thế giới có
thể. Do đó, người ta đã đề nghị một số phương pháp bổ sung thêm thông tin để xác
định được cụ thể giá trị phân bố xác suất này. Cách tiếp cận này khá phức tạp và đòi
hỏi phải giải bài toán quy hoạch phi tuyến. Nếu như không bổ sung thêm thông tin
thì nhờ việc giải bài toán quy hoạch tuyến tính (tuy đơn giản hơn nhiều nhưng vẫn
phức tạp), ta có thể rút ra được giá trị đúng của mệnh đề đích nằm trong một khoảng
giá trị. Vì vậy, trong [3] đã phát triển mô hình logic giá trị khoảng dựa trên mô hình
của [6]. Trong mô hình này, thuận lợi ở chỗ, cho phép đưa vào các mệnh đề ban đầu
với giá trị khoảng (xác suất đúng của mệnh đề nằm trong một khoảng giá trị). Với
cách biểu diễn giá trị mệnh đề bởi một khoảng, không những giúp ta xác định được
độ chính xác của mệnh đề đó mà ta còn có thể đánh giá được lượng thông tin mà ta
biết về tính đúng đắn của mệnh đề đó (khoảng càng hẹp thì lượng tin càng lớn).
Cách biểu diễn này tiếp cận gần hơn đến các tri thức thực tiễn.
Cùng với mong muốn tiếp cận tới những tri thức trong thực tế và các phương
pháp suy diễn trong các hệ tri thức đó. Trong luận văn này, chúng tôi nghiên cứu về

vấn đề suy diễn xác suất trong các hệ tri thức F-luật, một loại hệ tri thức không chắc
chắn. Ý tưởng xây dựng hệ tri thức này được đề xuất ban đầu bởi [9] và được phát
triển tiếp trong [5, 8, 11]. Trong hệ tri thức F-luật, giá trị chân lí của một mệnh đề
hay một câu cũng được biểu diễn bởi một khoảng, biểu thị niềm tin của ta về tính

7


đúng đắn của mệnh đề đó. Mỗi F-luật cho ta quan hệ về giá trị chân lí của một mệnh
đề với một số các mệnh đề khác, quan hệ này biểu diễn bởi một hàm. Từ việc biểu
diễn tri thức như vậy đã có một số phương pháp suy diễn được đề xuất dựa trên các
toán tử suy diễn.
Vấn đề suy diễn xác suất khoảng nhằm rút ra giá trị khoảng cho một câu đích
từ một cơ sở tri thức xác suất khoảng đã cho. Bài toán này được đưa về bài toán quy
hoạch tuyến tính: Tìm max (min) của một biểu thức tuyến tính trên miền lồi xác định
với các bất đẳng thức tuyến tính cho bởi cơ sở tri thức ban đầu.
Suy diễn để rút ra giá trị xác suất khoảng của một câu từ cơ sở tri thức xác suất
với những câu có độ chắc chắn ngoài gọi là suy diễn ngoài. Giá trị xác suất ngoài
gán cho một câu σ nào đó nhằm nắm bắt đánh giá chủ quan của một người về tính
đúng đắn của phán đoán σ . Khi biểu diễn mối liên quan phụ thuộc trực tiếp giữa độ
chắc chắn của một câu đối với độ chắc chắn của các câu khác thì gọi là độ chắc
chắn trong. Độ chắc chắn trong được xem xét từ quan điểm của lập trình logic bởi
Raymond Ng và Subrahmanian [9]. Ở đây, ta quan tâm đến những dạng biểu diễn
và cách xây dựng phương pháp suy diễn từ những dạng tri thức với độ chắc chắn
trong, cụ thể là F-luật. Suy diễn trong phần cơ sở tri thức với độ chắc chắn trong
này sẽ là một thủ tục lặp các F-luật và gọi là suy diễn trong.
Mục đích của luận văn là nghiên cứu và phát triển các cách tiếp cận xác suất
đối với việc biểu diễn tri thức và các phương pháp suy diễn của logic xác suất dựa
vào việc khai thác hệ tri thức F-luật với các tính chất trên nó, cụ thể như sau:
(1) Khảo sát một số đặc trưng của suy diễn xác suất: suy diễn xác suất

(khoảng) ngoài, suy diễn xác suất trong.
(2) Nghiên cứu các tính chất của hệ tri thức F-luật: hệ tri thức là ổn định nếu
quá trình suy diễn dừng và phi mâu thuẫn. Nếu hệ ổn định, tìm các
phương pháp suy diễn hiệu quả để khai thác hệ.
(3) Nghiên cứu tính chất và các phương pháp suy diễn trong các hệ tri thức
F-luật đơn điệu.

8


(4) Đề xuất giải pháp trong trường hợp hệ không ổn định vẫn có thể kết luận
giá trị chân lí của các biến mệnh đề (atom) sau quá trình suy diễn với cơ
sở tri thức F-luật ban đầu. Khi đó, hệ tri thức không ổn định này vẫn có ý
nghĩa trong một phạm vi nhất định nào đó.
Đối với vấn đề thứ nhất, luận văn xem xét cách gán ngữ nghĩa xác suất của
một câu nhờ phân bố xác suất trên tập các lớp thế giới có thể; mô hình logic xác
suất giá trị khoảng; các cách biểu diễn C-luật và F-luật và các toán tử suy diễn của
chúng. Vấn đề thứ hai và thứ ba, luận văn xem xét dựa trên hai cách tiếp cận chính:
cấu trúc cơ sở tri thức (đồ thị biểu diễn, tính chất luật) và các phương pháp lập luận
dựa trên các toán tử suy diễn. Đối với vấn đề thứ tư, luận văn thu nhỏ lớp bài toán
và xét ở trường hợp bước thứ n thỏa mãn điều kiện cụ thể, từ đó có thể kết luận giá
trị khoảng xấp xỉ của các atom. Giá trị này được gọi là n-ổn định.
Luận văn ngoài phần mở đầu và kết luận bao gồm 4 chương.
Chương 1, tổng quan các vấn đề về suy diễn xác suất. Luận văn tập trung xem
xét phương pháp suy diễn trong các cơ sở tri thức logic xác suất giá trị khoảng, bao
gồm suy diễn ngoài và suy diễn trong.
Chương 2, giới thiệu chung về hệ tri thức dạng F-luật. Phần đầu bao gồm các
định nghĩa về việc biểu diễn tri thức, các toán tử suy diễn và các tính chất của hệ.
Phần thứ hai, đề cập tới đồ thị tương ứng với hệ tri thức F-luật. Bằng cách đưa ra
khái niệm đồ thị bị rạn đã khẳng định được tính dừng của các hệ tri thức F-luật với

toán tử suy diễn tổng thể có đồ thị tương ứng là bị rạn.
Chương 3, tập trung nghiên cứu suy diễn trong các hệ tri thức F-luật đơn điệu.
Phương pháp tiếp cận ở đây là thu hẹp dần hoặc mở rộng dần không gian bài toán.
Trước tiên xem xét tính đơn điệu, cùng với nó thu hẹp phạm vi nghiên cứu trong
các hệ tri thức đơn điệu. Với việc thừa nhận tính đúng đắn của phép đơn điệu hóa,
luôn có thể đưa một hệ tri thức bất kì về hệ tri thức đơn điệu. Bằng cách thu hẹp
đáng kể lớp đơn điệu, chúng ta thu được một lớp hệ tri thức đơn điệu mạnh. Hệ tri
thức đơn điệu yếu lại là một sự mở rộng từ hệ tri thức đơn điệu mạnh với sự ràng

9


buộc luật ít chặt chẽ hơn. Trong chương này cũng chỉ ra dấu hiệu phát hiện tính
dừng của hệ tri thức đơn điệu mạnh và đưa ra kết luận về mối quan hệ giữa các
phép lập luận là: các phương pháp lập luận cho kết quả tương đương đối với các hệ
ổn định, từ đây, cho phép tìm các phương pháp suy diễn nhanh dựa vào toán tử suy
diễn bộ phận.
Chương 4 đề xuất giải pháp khắc phục trường hợp hệ tri thức không ổn định.
Hệ tri thức F-luật không ổn định được đánh giá là không tốt và do đó, hoặc ta phải
hiệu chỉnh nó, hoặc ta bỏ đi không xét. Việc nghiên cứu quá trình suy diễn trong các
hệ tri thức F-luật thực sự có ý nghĩa trong trường hợp hệ là ổn định. Khi đó, luôn
kết luận được giá trị của các atom sau quá trình suy diễn, do đó luôn mong muốn có
được những hệ tri thức ổn định. Xuất phát từ điều này, chúng tôi đề xuất giải pháp
trong trường hợp hệ không ổn định thì hệ vẫn có ý nghĩa trong một phạm vi nhất
định nào đó. Bằng cách đưa ra một giá trị gọi là n-ổn định, có thể kết luận được giá
trị chân lí xấp xỉ của các atom sau quá trình suy diễn, với giả thiết hệ tri thức là phi
mâu thuẫn, không dừng. Tại bước thứ n, dựa vào giá trị khoảng xấp xỉ của các
atom, có thể xác định được lượng thông tin về tính đúng đắn của các atom đó (giá
trị khoảng càng hẹp thì lượng tin càng lớn). Trường hợp hệ tri thức F-luật mâu
thuẫn ở bước thứ n của quá trình suy diễn, đề xuất giải pháp để kết luận hệ phi mâu

thuẫn ở bước thứ m (0 ≤ m < n).
Mỗi chương đều có phần kết luận chương và đưa ra một số ví dụ áp dụng.
Phần kết luận chung, trình bày tóm tắt kết quả chính đã đạt được và đưa ra các
hướng phát triển tiếp theo của đề tài.

10


Chương 1

SUY DIỄN XÁC SUẤT
Một trong những đề tài thu hút được nhiều nhà nghiên cứu trí tuệ nhân tạo
(Artificial Intelligence) đó là mối liên kết giữa các phương pháp tiếp cận biểu diễn
tri thức dựa trên logic trong trí tuệ nhân tạo và lí thuyết xác suất trong toán học. Bài
báo logic xác suất (Probabilistic logic) của Nilsson [6] đã thực sự đánh dấu một
bước quan trọng cho các nhà nghiên cứu về mối quan tâm này. Mô hình của Nilsson
đã được phát triển lên thành mô hình logic xác suất giá trị khoảng trong [3] bởi
Phan Đình Diệu.
Chương này sẽ trình bày tổng quan mô hình logic xác suất giá trị khoảng và
đưa ra một số phương pháp suy diễn với các hệ tri thức logic xác suất giá trị
khoảng, cụ thể là suy diễn xác suất ngoài, suy diễn xác suất trong, suy diễn với Cluật và F-luật mà ban đầu là các dạng biểu diễn và các toán tử suy diễn.

1.1. Biểu diễn tri thức theo cách tiếp cận xác suất
Chúng ta nhắc lại một số khái niệm cơ bản của lí thuyết xác suất.
Cho (Ω, ε) là một không gian mẫu, trong đó Ω là tập hữu hạn những phán
đoán loại trừ lẫn nhau (hay còn gọi là không gian sự kiện), ε = 2Ω . Một hàm tập giá
trị thực P: ε → [0,1] gọi là (hàm) xác suất nếu nó thỏa mãn những điều kiện sau:
(i)

P(A) ≥ 0 với ∀ A ∈ ε ;


(ii) P(Ω) = 1; P( φ ) = 0;
(iii) P(A ∪ B) = P(A) + P(B), với ∀ A, B ∈ ε thỏa mãn A ∩ B = φ .
(Với A ⊆ Ω ⇒ P(A) ∈ [0, 1]).

11


Một phân phối xác suất là một hàm số p: Ω → [0,1] sao cho

∑ p(ω ) = 1 . Khi

ω∈Ω

đó, xác suất của một tập A được xác định là: P( A) =

∑ p(ω ) .

ω∈A

Trường hợp xác suất có điều kiện, biểu thị khả năng xảy ra sự kiện A trong
tình huống sự kiện B đã xảy ra, kí hiệu: P(A/B). Khi đó, xác suất này được xác định
như sau:
P( A | B) =

P( A ∩ B)
P( B)

Ví dụ 1.1. Tung một đồng xu, xảy ra hai khả năng: đồng xu xuất hiện mặt sấp; đồng
xu xuất hiện mặt ngửa.

Khi đó, Ω = {sấp, ngửa}. P: 2Ω → [0,1]. Ta có P({sấp}) = P({ngửa}) =

1
.
2

Đối với các dạng tri thức không chắc chắn dựa trên luật, chúng ta đưa vào mức
độ chắc chắn của các luật hoặc các sự kiện trong cơ sở tri thức. Chúng ta sẽ gán cho
mỗi luật hoặc sự kiện một mức độ chắc chắn nào đó, mức độ chắc chắn này là một
số nằm trong đoạn [0, 1], hay còn gọi là xác suất.
Cú pháp:
If <A1, P1> ∧ <A2, P2> ∧ … ∧ <An, Pn> then <B, P>.
Trong đó, Pi là xác suất xảy ra Ai hay mức độ chắc chắn của Ai, P là xác suất xảy ra
B hay mức độ chắc chắn của B.
Trường hợp đặc biệt, khi luật chỉ có một điều kiện If A then B, xác suất hay
mức độ chắc chắn của luật là: P(B│A).
Ví dụ 1.2. P(Nghiêm túc/chăm học) = 0.7;
P(Nghiêm túc/không chăm học) = 0.4;
P(chăm học/nghiêm túc)?
Chúng ta cũng có thể biểu diễn tri thức xác suất tổng quát dưới dạng như sau:

12


S = {<S1, P1>, <S2, P2>, …, <Sn, Pn>},
trong đó Si là biểu thức logic bất kì, Pi là xác suất tương ứng với Si, i = 1, n .
Ví dụ 1.3. S = {<A, 0.5>, <B, 0.6>}, <A ∧ B,?>: nghĩa là, xác suất của A là 0.5,
xác suất của B là 0.6; cần tìm xác suất của A ∧ B?
S = {<A, 0.8>, <A → B,0.5>}, <B → A, ?>.
S = {<A ∨ B, 0.9>, <A ∧ B, 0.5>}, {<A, ?>, <B, ?>}


1.2. Thế giới có thể và xác suất trên lớp thế giới có thể
1.2.1. Thế giới có thể
Cách tiếp cận dựa trên khái niệm thế giới có thể (possible world) được xem là
khuôn mẫu chuẩn tắc để xây dựng ngữ nghĩa của nhiều logic như logic xác suất,
logic khả năng, modal logic, …
Về mặt trực giác, khái niệm thế giới có thể được hiểu như thế nào? Chúng ta
thường nói một phán đoán, một phát biểu nào đó đúng trong tình huống, thời điểm
hay ngữ cảnh này nhưng không đúng trong tình huống, thời điểm hay ngữ cảnh
khác. Có thể coi mỗi tình huống, thời điểm hay ngữ cảnh đó là một thế giới có thể.
Từ “có thể” ở đây được hiểu là ngoài trạng thái thực sự hiện thời mà mỗi cá nhân
đang xem xét, có những trạng thái hay thế giới khác mà cá nhân này xem là có thể.
Chúng ta xem tập các thế giới mà một cá nhân xem là có thể như là cách định
tính để đo độ chắc chắn của anh ta. Càng nhiều thế giới mà anh ta xem là có thể thì
anh ta càng không chắc chắn về trạng thái thực của thế giới và anh ta càng biết ít
hơn. Khi có một tập thế giới có thể như vậy, định lượng độ không chắc chắn bằng
cách thêm phân bố xác suất trên tập các thế giới đó.
Khái niệm thế giới có thể trong ngôn ngữ của logic mệnh đề sẽ được hình thức
hóa như sau: Giả sử ∑ = {S1, ..., Sl} là tập các câu. Gọi A = {A1, ..., Am} là tập các
biến mệnh đề (atom) xuất hiện trong các câu của ∑, và L∑ là ngôn ngữ mệnh đề sinh

13


ra bởi các atom trong A với các phép toán mệnh đề đã biết: ¬, ∧, ∨, →, ↔ . Kí hiệu
true là mệnh đề hằng đúng, false là mệnh đề hằng sai.
Một “thể hiện” trong logic mệnh đề là phép gán những giá trị chân lí đúng (1)
hay sai (0) cho các atom. Có thể xem mỗi thể hiện là một thế giới có thể cho tập các
câu trong ∑. Một vector Bool ( σ 1 , ..., σ l ) ( σ i nhận giá trị 0 hoặc 1, với ∀i = 1, l ) gọi
là ∑-phi mâu thuẫn nếu có một thế giới có thể ω sao cho Si nhận giá trị chân lí

σ i với ∀i = 1, l . Kí hiệu valω(Si) = σ i , (i = 1, l ).

Rõ ràng mỗi vector ∑-phi mâu thuẫn tương ứng với một số hữu hạn các phép
gán giá trị chân lí cho các atom trong A. Ngược lại mỗi phép gán như vậy xác định
một vector ∑-phi mâu thuẫn.
Hai thế giới có thể ω1và ω2 được gọi là ∑- tương đương nếu
valω1 ( S i ) = valω2 ( S i ) với ∀i = 1, l . Dễ dàng kiểm chứng được rằng ∑-tương đương là

một quan hệ tương đương. Quan hệ này xác định một phân hoạch trên tập các thế
giới có thể thành các lớp tương đương. Như vậy, mỗi ∑- tương đương các thế giới
có thể ω tương ứng với một vector ∑-phi mâu thuẫn ( σ 1 , ..., σ l ) và ngược lại. Do
đó, có thể gọi lớp ∑- tương đương các thế giới có thể là lớp các thế giới có thể và
vector các giá trị chân lí ∑-phi mâu thuẫn là vector các giá trị chân lí phi mâu
thuẫn.
Giả sử có k-vector các giá trị chân lí phi mâu thuẫn khác nhau. Khi đó, tập Ω
gồm k-lớp tương đương các thế giới có thể {ω1 ,...,ωk } , nghĩa là Ω = {ω1 ,..., ω k } . Kí
hiệu ω i =α biểu thị rằng ωi thỏa mãn α hay câu α là đúng trong thế giới có thể ωi.

1.2.2. Xác suất trên lớp thế giới có thể
Mục này sẽ xem xét xác suất được xây dựng trên khái niệm thế giới có thể như
thế nào. Kí hiệu Ω = {ω1 ,...,ωk } là tập các lớp thế giới có thể, ở đó mỗi lớp ω i đặc
trưng bởi vector biểu diễn những giá trị chân lí của những câu trong Σ . Xác suất
của một câu, theo [6], được xác định bởi phân bố xác suất trên tập các lớp thế giới

14


có thể Ω. Giả sử p là phân bố xác suất như vậy. Khi đó, xác suất của câu σ ∈ ∑ được
định nghĩa là tổng của những xác suất trên những lớp thế giới có thể trong đó σ
đúng, nghĩa là:


∑ p(ω )

P(α ) =

ωi∈Ω ,ωi =σ

i

Tất cả những câu xét ở đây là những câu mệnh đề nên giá trị chân lí của nó
hoặc đúng hoặc sai và xác suất của câu σ không phải giá trị chân lí của nó mà là độ
chắc chắn hay độ tin cậy vào tính đúng đắn của σ .

1.3. Suy diễn xác suất ngoài
Mục này trình bày tổng quan về mô hình lập luận xác suất ngoài trong logic
xác suất giá trị khoảng. Trước hết, chúng ta xem xét một số kiến thức về logic xác
suất giá trị khoảng.

1.3.1. Logic xác suất giá trị khoảng
Logic xác suất trong [6] là một sự kết hợp giữa logic cổ điển và lí thuyết xác
suất, trong đó đã sử dụng khái niệm lớp thế giới có thể để xây dựng không gian mẫu
cho phân bố xác suất. Dựa trên mô hình của Nilsson, một logic xác suất giá trị
khoảng đã được phát triển trong [3] bởi Phan Đình Diệu. Độ chắc chắn của một câu
trong logic xác suất giá trị khoảng thay bởi cho bằng một giá trị đơn là một giá trị
khoảng. Nghĩa là, khi cho khoảng xác suất của câu X là khoảng [a, b] ⊆ [0,1], kí
hiệu <X, [a, b]>, độ tin cậy vào tính đúng đắn của câu X hay xác suất đúng của X
nằm trong khoảng [a, b]. Trong đó, a được gọi là mức độ nhất thiết và b gọi là mức
độ có thể của độ tin cậy của một tác nhân nào đó về tính đúng đắn của câu X.
Với kí hiệu <X, [a, b]>, từ nay về sau sẽ gọi [a, b] là độ chắc chắn ngoài hay
xác suất ngoài của X.

Một số trường hợp đặc biệt:

15


¾ <X, [a, a]>: Xác suất của một câu X là một giá trị điểm a.
¾ <X, [0, 0]>: Câu X có độ tin cậy là 0, hay hiểu là câu X chắc chắn sai.
¾ <X, [1, 1]>: Câu X có độ tin cậy là 1, hay câu X chắc chắn đúng.
¾ <X, [0, 1]>: Biểu diễn mức độ không biết của một tác nhân nào đó về
câu X, hay tác nhân đó không biết gì về X.

1.3.2. Toán tử suy diễn xác suất ngoài
Bài toán lập luận xác suất có thể được phát biểu như sau: Cho một cơ sở tri
thức xác suất khoảng B gồm một tập hợp các câu cùng với các giá trị xác suất
tương ứng của nó. Hãy rút ra giá trị xác suất khoảng cho một câu đích bất kì.
Giả sử cho một cơ sở tri thức xác suất khoảng ngoài B bao gồm tập các câu
∑ = {S1,…,Sl} và các khoảng giá trị tương ứng Ii = [ai, bi], (i = 1, l ) biểu diễn những

độ chắc chắn ngoài về những câu trên. Kí hiệu:
B = {<Si, Ii> | i = 1, l }
Gọi S là một câu đích bất kì mà ta cần tìm giá trị xác suất khoảng từ cơ sở tri
thức B trên. Để tiện trình bày, chúng ta sử dụng kí hiệu như sau: Nếu S ∈ ∑ , đặt n=l
và giả sử rằng S = Sn = Sl; ngược lại, đặt n = l + 1 và kí hiệu Sn = S. Đặt:
X ={S1, …, Sn}
Dễ thấy, X = ∑ nếu S ∈ ∑ và X = ∑ ∪ {Sn} nếu S = Sn ∉ ∑ . Giả sử tồn tại k
lớp X-tương đương các thế giới có thể Ω = { ω1 ,..., ω k } và V1,…,Vk là những vector
cột X-phi mâu thuẫn tương ứng. Mỗi vector cột Vi biểu diễn các giá trị chân lí của
những câu trong X trong lớp thế giới có thể tương ứng ω i . Kết hợp các vector cột
V1,…,Vk nhận được một ma trận V gồm n dòng, k cột (Vnxk) và được gọi là ma trận
cơ bản của X.


16


Giả sử p = (p1, …, pk) là phân bố xác suất trên Ω và Π = ( π 1 ,..., π n ) là các giá
trị xác suất của Si (i = 1, n ), nghĩa là π (S i ) = π i với i = 1, n . Lúc này ta có phương
trình ma trận sau:
Π = VP

(1)

Trong đó, Π = ( π 1 ,..., π n )t, V là ma trận k cột V1,…,Vk và P = pt = (p1, …, pk)t.
Phương trình (1) được gọi là phương trình xác suất của tập các câu trong X.
Gọi Ui, (i = 1, n ) là các vector dòng trong ma trận V tương ứng với các câu
trong X, khi đó:
Ui = (ui1, …, uik),
với uij (nhận giá trị 0 hoặc 1) là giá trị chân lí của Si trong lớp thế giới có thể ω j ,
(i = 1, n ; j = 1, k ).
Giá trị π ∈ [0,1] được gọi là chấp nhận được cho xác suất đúng của S tương
ứng với cơ sở tri thức B nếu tồn tại một phân bố xác suất P = (p1, …, pk)t và các giá
trị π i , (i = 1, n ), sao cho π 1 ∈ I 1 ,..., π l ∈ I l , π n = π và phương trình (1) thỏa mãn.
Gọi F(S, B) là tập tất cả các giá trị chấp nhận được cho xác suất đúng của S
tương ứng với B. Khi đó F(S, B) là tập những giá trị của hàm:
π n ( P) = u n1 p1 + ... + u nk p k

(2)

với vector P = (p1, …, pk)t thay đổi trong miền lồi ∆ xác định bởi các điều kiện sau
đây:
⎧π i = vi1 p1 + ... + vik p k ∈ I i , (i = 1, l )

⎪k

⎪∑ p j = 1, p j ≥ 0, ( j = 1, k )
⎩ j =1

Ràng buộc xác định miền lồi ∆ có thể biểu diễn bởi phương trình ma trận:
Π* = V*P

(3)

17


Trong đó V* là ma trận có được từ V bằng cách bỏ dòng giá trị chân lí của S trong V
và thêm dòng các giá trị 1; Π* có được từ Π bằng cách bỏ dòng giá trị π n và thêm
dòng giá trị 1 sao cho Π*t ∈ {1} × I1 × … × Il.
Ta gọi (3) là phương trình ma trận điều kiện hay ngắn gọn là phương trình
điều kiện. Biểu thức (2) xác định ánh xạ tuyến tính π n từ miền lồi ∆ trong Rk vào R.
Do đó, F(S,B) là tập lồi đóng trong R tức là khoảng con đóng [a, b] của khoảng đơn
vị [0, 1]. Ta gọi khoảng này là giá trị khoảng (cho xác suất đúng) của S suy diễn từ
cơ sở tri thức B và viết: B |– <S, F(S, B)>. Dễ dàng nhận thấy rằng F(S, B) ≠ φ khi
và chỉ khi cơ sở tri thức B là phi mâu thuẫn.
Như vậy, việc suy diễn ra giá trị khoảng F(S, B) của câu S từ cơ sở tri thức B
dẫn về bài toán tối ưu sau đây:
Tìm a = min P∈∆ π n ( P ) , b = Max P∈∆ π n (P) với π n (P) xác định bởi (2) và ∆
là miền xác định bởi (3).
Chúng ta gọi suy diễn để rút ra giá trị khoảng cho một câu từ cơ sở tri thức
khoảng ngoài là suy diễn ngoài để tiện trình bày và phân biệt với suy diễn trong sẽ
được đề cập sau này.
Toán tử suy diễn xác suất ngoài được xác định như sau:

Cho một cơ sở tri thức xác suất khoảng B và một tập hợp các câu X bất kì (X
có thể chứa các câu trong B). Gọi Λ là tập tất cả các ánh xạ từ X vào C[0, 1], với
C[0, 1] là tập các khoảng con đóng của khoảng [0, 1]. Ánh xạ I ∈ Λ xác định một
giá trị khoảng I(Q) ∈ C[0, 1] cho mỗi câu Q ∈ X. Lúc này I và B xác định một cơ sở
tri thức và từ cơ sở tri thức mới này có thể suy diễn được giá trị xác suất cho các
câu trong X. Khi đó, ta thu được một ánh xạ I’ mới từ kết quả suy diễn.
Với mỗi I ∈ Λ, một cơ sở tri thức mới B’ = B ∪ {<Q, I(Q)> │Q ∈ X} được
lập ra theo quy tắc sau:
<Si, I 'i > ∈ B’ (i = 1, n ), với I 'i = Ii ∩ I(Q) nếu Q = Si.

18


<Q, I(Q)> ∈ B’, nếu Q ≠ Si.
Khi đó, khoảng xác suất mới của P suy diễn từ cơ sở tri thức mới B’ có dạng:
I’(Q) = F(Q, B’) với Q ∈ X, I’ là ảnh của ánh xạ I qua toán tử R, hay I’ = R(I).
Nhận xét: Bài toán lập luận xác suất được đưa về bài toán quy hoạch tuyến tính:
Tìm max (min) của một biểu thức tuyến tính trên miền lồi xác định bởi các bất đẳng
thức tuyến tính cho bởi cơ sở tri thức ban đầu.

1.4. Suy diễn xác suất trong
Như đã trình bày ở mục trên đây, giá trị xác suất ngoài [a, b] gán cho câu S
nhằm nắm bắt đánh giá chủ quan của một tác nhân nào đó về tính đúng đắn của
phán đoán S. Mục này nghiên cứu kiểu biểu diễn tri thức dưới dạng luật, nhằm nắm
bắt sự phụ thuộc trực tiếp giữa độ chắc chắn của một câu với độ chắc chắn của các
câu khác và ta gọi là độ chắc chắn trong.
Việc nghiên cứu độ chắc chắn trong đã được nhiều người trong cộng đồng trí
tuệ nhân tạo quan tâm (xem [2], [7], [8], [9]). Trong tác phẩm nổi tiếng [7], J. Pearl
đã chỉ ra rằng: “Một người ngần ngại khi đánh giá khả năng của hai biến cố nhưng
sẽ cảm thấy tin tưởng để phán đoán rằng hai biến cố này là có liên quan với nhau

hay không”.
Theo quan điểm của lập trình logic bởi Raymond Ng và Subrahmanian [9],
mỗi atom trong ngôn ngữ có dạng <X, [a, b]> và một ngữ nghĩa của lập trình logic
xác suất được xây dựng từ ngôn ngữ như vậy.
Ví dụ sau đây được đưa ra bởi Raymond Ng và Subrahmanian [9] cho thấy
được sự cần thiết của biểu diễn tri thức dưới dạng độ chắc chắn trong.
Ví dụ 1.4. Một công ty điện thoại đường dài, khi nhận yêu cầu nối liên lạc của
khách hàng, cố gắng tìm những đường tin cậy trong mạng các trung tâm tiếp vận.
Giả sử rằng độ tin cậy được hiểu là xác suất không có sai sót trong thời gian liên

19


lạc. Công ty có hai kiểu nối liên lạc trực tiếp giữa các trung tâm tiếp vận. Giả sử
những cuộc điều tra cung cấp một số thông tin sau đây:
(i) Kiểu nối A có độ tin cậy 90% ± 5%.
(ii) Kiểu nối B đáng tin cậy hơn, có độ tin cậy trên 90%.
(iii) Giả sử X, Y, Z là ba trung tâm, X và Z nối theo kiểu A trong khi Z và Y
được nối bởi đường với độ tin cậy ít nhất 85%. Khi đó đường từ X đến Y có độ tin
cậy 80% đến 95%.
(iv) Nếu X và Z được nối theo kiểu B và Y, Z được nối bởi đường với độ tin
cậy ít nhất 75% thì đường từ X đến Y có độ tin cậy ít nhất 85%. Trong những tình
huống trên, độ tin cậy của một phán đoán phụ thuộc trực tiếp vào những độ tin cậy
của những phán đoán khác. Sự phụ thuộc giữa các độ chắc chắn như vậy có thể biểu
diễn như sau:
<a(X, Y), [1, 1]> →
<b(X, Y), [1, 1]> →
<a(X, Z), [1, 1]> &
<b(X, Y), [1, 1]> & .
Việc biểu diễn sự phụ thuộc giữa các độ chắc chắn đã được quan tâm nghiên

cứu theo nhiều quan điểm khác nhau. Ví dụ như MYCIN, là một hệ lập luận trong y
học của Đại học Stanford, Hoa Kì, một hệ chuyên gia dựa trên luật. Đây là hệ đầu
tiên chú trọng đến việc xử lí thông tin không chắc chắn, sử dụng khái niệm
Certainty Factor (CF) để biểu thị độ chắc chắn của một phán đoán. CF(X) là hàm có
giá trị nằm trong khoảng [-1, 1]. Độ chắc chắn của một công thức khi đó được xác
định một cách duy nhất bởi một hàm của những độ chắc chắn của các công thức con
và những phép toán thích hợp. Chẳng hạn, độ chắc chắn của A ∧ B là minimum của
độ chắc chắn của A và B, một luật như thế có thể biểu diễn dưới dạng:
<A, a> ∧ <B, b> → <A ∧ B, min(a, b)>

20


Rõ ràng, ở dạng biểu diễn này, mối liên hệ giữa độ chắc chắn của một câu với
các độ chắc chắn của những câu khác được biểu diễn nhờ quan hệ giữa những phép
toán logic giữa các câu đó.
Đối với tri thức dạng nếu A thì B với độ chắc chắn m (còn gọi là luật sản xuất
m
hay luật sinh), có thể biểu diễn dưới dạng luật: A ⎯⎯→
B. Ở dạng luật này, nếu a

là độ chắc chắn của A thì độ chắc chắn của B sẽ là m × Max(0, a).
m
B được thể hiện
Dựa trên cách tiếp cận mạng Bayes của J. Pearl, luật A ⎯⎯→

dưới dạng xác suất có điều kiện:
P(B|A) = m.
Một cách thể hiện khác của dạng luật trên là sử dụng tập xác suất có điều kiện
với luật xác suất toàn phần. Ví dụ, giả sử: A → B với độ chắc chắn [l, u]; ¬A → B

với độ chắc chắn [l’, u’]; P(A) ∈ [s, t], P( ¬ A) ∈ [1-t, 1-s]. Áp dụng luật xác suất
toàn phần (hay xác suất đầy đủ) ta có:
P(B) = P(B|A)P(A) + P(B| ¬ A)P( ¬ A)
Người ta tính được:
P(B) ∈ [min(ls + l’(1-s), lt + l’(1-t)), Max(us + u’(1 - s), ut + u’(1 - t))]
Tương tự với cách tiếp cận khi xem xét luật như trên, trong [8] đã đề xuất hai
dạng luật: C-luật và F-luật. Trong khi C-luật biểu diễn sự phụ thuộc hằng giữa độ
chắc chắn của một câu với các độ chắc chắn của những câu khác, F-luật biểu diễn
sự phụ thuộc này dưới dạng hàm. Lập luận trong phần cơ sở tri thức với độ chắc
chắn trong này sẽ là một thủ tục lặp các C-luật và F-luật, đươc gọi là suy diễn xác
suất trong.

1.4.1. Biểu diễn tri thức với C-luật, F-luật
C-luật được biểu diễn như sau:
<S1, I1> ∧ … ∧ <Sn, In> → <S, I>,

21


với S1, …, Sn, S là những câu trong logic mệnh đề thông thường và I1, …, In, I là
những khoảng con đóng của khoảng đơn vị [0, 1].
F-luật được biểu diễn như sau:
<S1, I1> ∧ … ∧ <Sn, In> → <S, f(I1, …, In)>,
với S1, …, Sn, S là những câu mệnh đề; I1, …, In là những biến khoảng và f(I1, …,In)
là hàm của những biến khoảng I1, …, In.

1.4.2. Toán tử suy diễn trong với C-luật, F-luật
Trước tiên, chúng ta xem xét toán tử suy diễn với C-luật.
Xét cơ sở tri thức bao gồm các C-luật BC = {Jj | j = 1, …, M},


J j =< A j1 , I j1 > ∧...∧ < A jm j , I jm j >→< AC j , I C j >
Gọi X là tập các câu trong cơ sở tri thức BC. Đặt Λ là tập tất cả các ánh xạ từ X vào
C[0, 1], với C[0, 1] là tập tất cả các khoảng con đóng của khoảng [0, 1]. Mỗi ánh xạ
I ∈ Λ như vậy gán mỗi câu Q ∈ X một khoảng I(Q) ∈ C[0, 1].
Quan hệ thứ tự trên Λ được xác định như sau:
Với hai ánh xạ bất kì I1, I2 ∈ Λ, ta nói rằng I1

I2 khi và chỉ khi I1(Q) ⊆ I2(Q) với

mọi Q ∈ X.
Luật Jj bất kì gọi là thỏa mãn được bởi ánh xạ I ∈ Λ nếu I(Ajk) ⊆ Ijk, với mọi
k=1, …, mj.
Suy diễn trong cơ sở tri thức gồm các C-luật được xác định bởi toán tử suy
diễn trong TC: Λ → Λ như sau:
Với bất kì I ∈ Λ,
TC ( I )(Q) = I (Q) ∩ ( I I C j ) , với mọi Q ∈ X,
j∈EQ

22


trong đó, EQ = {j | AC j = Q và Jj thỏa mãn được bởi I}. Giả sử rằng khi EQ = φ thì

II

j∈EQ

Cj

= [0,1] , khi này, TC(I)(Q) = I(Q) với mọi Q ∈ X.


Đặt I’ = TC(I), I’ ∈ Λ. Áp dụng lặp lại toán tử suy diễn TC cho I’, sau n lần thu
n

n

được dãy {TC (I )}n≥0 . Khi đó, dãy {TC (I )}n≥0 được định nghĩa đệ quy như sau:
(i) TC0 ( I ) = I ;
(ii) TCn +1 ( I ) = TC (TCn ( I )), ∀ I ∈ Λ .
Dễ thấy rằng, TCn +1 ( I )

TCn (I ) , ∀ I ∈ Λ. Giả định TCn (I ) ≠ φ , ∀n ≥ 0 . Khi đó,

n

dãy {TC (I )(Q)}n≥0 là dãy hội tụ và sẽ hội tụ về I*(Q), với I*(Q) ⊆ C[0, 1]:
→∞
TCn ( I )(Q ) ⎯n⎯
⎯→ I ∗ (Q ) .

Mệnh đề 1.1 ([8]). Với bất kì ánh xạ I ∈ Λ, luôn tồn tại một số tự nhiên n sao cho
TCn +1 ( I ) = TCn ( I ) . Nói cách khác, suy diễn trong lớp các C-luật (hay quá trình lặp của

toán tử TC đối với I ∈ Λ) luôn dừng sau một số hữu hạn bước.

Tiếp theo, chúng ta xem xét toán tử suy diễn với F-luật.
Xét cơ sở tri thức bao gồm các F-luật BF = {rj | j = 1, m }. Mỗi phần tử rj là
một luật có dạng:

r j =< A j1 , I j1 > ∧...∧ < A jm j , I jm j >→< A jF , f j ( I j1 ,..., I j m ) >

j

Trong đó f j : (C[0,1])

mj

→ C[0,1] là một hàm khoảng từ tích Đề-các

C[0, 1] × … × C[0, 1] vào C[0, 1].
mj lần

Gọi X là tập các câu trong cơ sở tri thức BF. Đặt Λ là tập tất cả các ánh xạ từ X
vào C[0, 1], với C[0, 1] là tập tất cả các khoảng con đóng của khoảng [0, 1]. Mỗi
ánh xạ I ∈ Λ như vậy gán mỗi câu Q ∈ X một khoảng I(Q) ∈ C[0,1].

23


Ta kí hiệu:

f j ( I ) = f j ( I j1 ,..., I j m ) , (j = 1, M ), với I ∈ Λ sao cho:
j

I ( A ji ) = I ji , với mọi i = 1, m j .
Suy diễn trong cơ sở tri thức gồm các F-luật xác định bởi toán tử TF từ Λ → Λ
được định nghĩa như sau:
Với bất kì I ∈ Λ,
TF ( I )(Q) = I (Q) ∩ ( I f j ( I ) , với mọi Q ∈ X,
j∈EQ


trong đó, EQ = {j | A j = Q }. Giả sử rằng khi EQ = φ thì
F

If

j

( I ) = [0,1] .

j∈EQ

n
Tương tự như đối với toán tử suy diễn với C-luật, định nghĩa dãy {TF (I )}n≥0

một cách đệ quy như sau:
(i) T F0 ( I ) = I ;
(ii) TFn +1 ( I ) = TF (TFn ( I )), ∀ I ∈ Λ .
Dễ thấy rằng, TFn +1 ( I )

TFn (I ) , ∀ I ∈ Λ. Giả định TFn (I ) ≠ φ , ∀n ≥ 0 . Khi đó,

n

dãy {TF (I )(Q)}n≥0 là dãy hội tụ và sẽ hội tụ về I*(Q), với I*(Q) ⊆ C[0, 1].
→∞
TFn ( I )(Q ) ⎯n⎯
⎯→ I ∗ (Q ) .

Nhận xét:
¾ I*(Q) có thể là rỗng (I*(Q) = φ ).

¾ Suy diễn trong với F-luật không phải luôn dừng với mọi cơ sở tri thức
BF, nghĩa là, không phải bao giờ cũng tồn tại một số tự nhiên n:
T Fn + 1 ( I ) = T Fn ( I ), ∀ I ∈ Λ . Thật vậy, chẳng hạn xét cơ sở tri thức BF sau:

A[x, y] → A[ x, y ],
I(A) = [a, 1], 0 < a < 1.

24


×