Báo cáo nghiên cứu khoa học: "Một số phép toán trên hệ biểu diễn tri thức dựa theo triết lý tập thô.." pptx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (141.16 KB, 7 trang )

Đại học Vinh Tạp chí khoa học, tập XXXVII, số 1A-2008

57
Một số phép toán trên hệ biểu diễn tri thức
Dựa theo triết lý TậP THÔ

Cao Thanh Sơn
(a)
,
Phan Anh Phong
(a)
, Nguyễn Quang Khanh
(b)

Tóm tắt. Trong bài báo này, chúng tôi giới thiệu phơng pháp biểu diễn tri thức
của một nhóm tác nhân t về một tập các đối tợng, một số toán tử tri thức cùng với
các tính chất của chúng và xây dựng một số phép toán trên hệ tri thức biểu diễn theo
triết lý tập thô.

I. mở đầu
Lý thuyết tập thô lần đầu tiên đợc đề xuất bởi Giáo s ngời Ba Lan
Z.Pawlak vào đầu thập niên 1980 và nhanh chóng trở thành một cách tiếp cận nhằm
xử lý thông tin mơ hồ, thông tin không chắc chắn. Nó cung cấp công cụ để phân tích,
suy diễn trên dữ liệu không chính xác và phát hiện ra mối quan hệ giữa các đối
tợng, tri thức tiềm ẩn trong dữ liệu ([5, 6]).

Mục tiêu chính của biểu diễn tri thức trong máy tính là phục vụ cho việc thu
nhận tri thức vào máy tính, truy xuất chúng và thực hiện các phép suy luận dựa
trên những tri thức đã lu trữ. Hiện đã có nhiều phơng pháp biểu diễn tri thức
nh: sử dụng logic hình thức, luật dẫn xuất, mạng ngữ nghĩa, biểu diễn bằng frame,
bằng script ([1]), biểu diễn theo tiếp cận tập thô ([3]). Mỗi phơng pháp trên đều có
những u điểm, nhợc điểm riêng. Bài báo này, chúng tôi dựa theo cách biểu diễn tri
thức trong ([3]) để đa ra một số phép toán trên hệ tri thức.
Sau phần mở đầu, phần 2 trình bày các kiến thức cơ bản về lý thuyết tập thô.
Phần 3 giới thiệu sơ lợc phơng pháp biểu diễn tri thức theo lý thuyết tập thô và
một số tính chất của các toán tử tri thức I
t
, K
t
. Trong phần 4, chúng tôi xây dựng
một số phép toán mới, phép hợp, phép giao và phép so sánh trên hệ tri thức đợc
biểu diễn theo ([3]) và cuối cùng là kết luận của bài báo.
II. Lý thuyết tập thô
Cho U là một tập bất kỳ, R là quan hệ tơng đơng trên U. Khi đó U/R là
phân hoạch các lớp tơng đơng. Giả sử X U.
2.1. Định nghĩa ([4]). Định nghĩa xấp xỉ của tập X trong không gian U.
Xấp xỉ trên của X tơng ứng với R trong không gian U, ký hiệu X
R
(hoặc
R
X
) là
X
R
= {E
i

U/R: E
i
X }.
Xấp xỉ dới của X tơng ứng với R trong không gian U, ký hiệu X
R
(hoặc XR) là
X
R
= {E
i
U/R: E
i
X}.
Gọi BN(R, X) = X
R
X
R
là vùng biên của X ứng với R.
Gọi
R
X
= card(X
R
)/card(X
R
) là độ chính xác của xấp xỉ X ứng với R, với card(X) là số
phần tử trong X.

Nhận bài ngày 19/12/2007. Sửa chữa xong 07/3/2008.

C. T. Sơn, P. A. Phong, N. Q. Khanh Một số theo triết lý TậP THÔ, tr. 57-63

58
2.2. Định nghĩa ([5]). Định nghĩa tập thô
Tập X đợc gọi là thô tơng ứng với quan hệ R nếu BN(R, X) .
Tập X đợc gọi là rõ tơng ứng với quan hệ R nếu BN(R, X) = .
Nói cách khác:
Tập X đợc gọi là thô tơng ứng với quan hệ R nếu X
R
X
R
.
Tập X đợc gọi là rõ tơng ứng với quan hệ R nếu X
R
= X
R
.
Hoặc:
Tập X đợc gọi là thô tơng ứng với quan hệ R nếu 1<
R
X
.
Tập X đợc gọi là rõ tơng ứng với quan hệ R nếu 1=
R
X
.
2.3. Nhận xét. Khái niệm tập thô luôn gắn với phân hoạch của tập U. Cùng

một không gian U nếu thay đổi phân hoạch thì X có thể thô tơng ứng với phân
hoạch này nhng lại rõ tơng ứng với phân hoạch khác.
2.4. Ví dụ.

Giả sử quan hệ tơng đơng R phân hoạch U thành 24 lớp và X U đợc minh hoạ
theo hình Elips (xem hình 1).
Khi đó:
Xấp xỉ dới: X
R
= m n (2 hình tô đậm trong Elips).
Xấp xỉ trên: X
R
= hợp của các lớp a, b, c, d, e, f, g, h, i, k và X
R
, tức là:
X
R
= a b c d e f g h i k X
R
,

BN(R, X) = X
R
X
R
,

R
X
= card(X
R
)/card(X
R
) = 2/12 = 1/6.
Theo định nghĩa 2.2 thì X là tập thô tơng ứng với quan hệ R.
2.5. Định nghĩa ([3]). Hệ tin là cặp S = (U, A),
trong đó:
U là tập hữu hạn khác rỗng các đối tợng,
A là tập hữu hạn khác rỗng các thuộc tính sao cho với mỗi thuộc tính a A, a
có miền giá trị V
a
. Ký hiệu: a:U V
a
,

a A.
Hệ quyết định là hệ tin bất kỳ có dạng: S = (U, A {d}),
trong đó: A là tập thuộc tính điều kiện, d A là tập thuộc tính quyết định.
2.6. Định nghĩa ([3]). Cho hệ tin S = (U, A) và B A, tồn tại một quan hệ
tơng đơng (ký hiệu là ind
A

(B)) đợc xác định nh sau:
1 5 a b c 9
2 6 k m d

10
3 7 i n e

11
4 8 h g f 12
Hình 1
.
Hình minh họa tập xấp xỉ

Đại học Vinh Tạp chí khoa học, tập XXXVII, số 1A-2008

59
ind
A
(B) = {(x, y) U ì U: a B, a(x) = a(y)}
ind
A
(B) hoặc có thể ký hiệu ind(B) đợc gọi là quan hệ không phân biệt đợc,
nghĩa là nếu có hai đối tợng x và y mà (x, y) ind(B) thì x và y không thể phân biệt
đợc bởi các thuộc tính trong B. Ký hiệu [x]
B

là lớp tơng đơng theo quan hệ ind(B).
III. Biểu diễn tri thức theo triết lý tập thô
Tri thức của một ngời hay một nhóm ngời t (gọi là tác nhân t) về một tập
đối tợng U={o
1
,o
2
,,o
m
} là các thông tin mà t biết về U, t càng biết nhiều về U thì
càng có khả năng phân biệt các đối tợng trong U. Nếu lấy hai đối tợng bất kỳ o
i
, o
j

của U mà t không thể phân biệt đợc chúng (dù là một chi tiết nhỏ thuộc tính) thì t
coi nh có tri thức kém về U. Vậy có thể nói t biết tốt về U nếu t có thể phân loại chi
tiết về các đối tợng trong U.
Coi một phân hoạch của U là một tri thức của một tác nhân t nào đó trên tập
đối tợng U.
Tri thức của t về U (hay tri thức của t trên U), ký hiệu K
t
(U) là một phân
hoạch của U: K
t
(U) = {E
1
t
, E
2

t
, , E
m
t
}.
Hai phân hoạch khác nhau của U đợc coi là hai tri thức khác nhau của hai
tác nhân t và s phân biệt. Nh vậy K
t
(U) = {E
1
t
,E
2
t
, ,E
m
t
} và K
s
(U)={E
1
s
,E
2
s
,,E
m
s
}
là hai tri thức khác nhau của t và s.

Một tác nhân t không thể có hai tri thức khác nhau trên tập U.
Họ các phân hoạch của U là một hệ tri thức trên U. Ta có thể xây dựng các
phép toán khác nhau trên để nhận đợc các cấu trúc khác nhau.
Thông thờng, một cách tự nhiên để nhận biết về tập đối tợng U ta thờng xét
chúng trong một tập các tham số (thuộc tính) A = {A
1
, A
2
, , A
n
}. Nh vậy một tri thức
của tác nhân t về tập đối tợng U là hệ tin:
S
t
= (U, A
t
) dạng bảng:
U
A
1
A
2

A
n

o
1

.
.
.

o
m

Giao của o
i
và A
j
là giá trị cho biết thông tin của o
i
về thuộc tính A
j
.
Nh vậy, tri thức của t về U là K
t
(U) = U/ind(A
t
). Lu ý rằng cứ có hệ tin
S
t
=(U,A
t
) thì xác định đợc K
t

(U)=U/ind(A
t
) nên có thể nói S
t
=(U, A
t
) là hệ tri
thức của t về U.
3.1. Định nghĩa ([3]). Định nghĩa cơ sở tri thức.
Với mỗi B A
t
, họ các lớp tơng đơng của quan hệ ind(B) là một phân hoạch
của U. Phân hoạch đợc xác định bởi tập tất cả các thuộc tính A
t
, khi đó họ

C. T. Sơn, P. A. Phong, N. Q. Khanh Một số theo triết lý TậP THÔ, tr. 57-63

60
}][ , ,][ ,]{[
21 AtnAtAtt
ooo= đợc gọi là cơ sở tri thức của tác nhân t trên vũ trụ U xác
định bởi S
t
.
3.2. Định nghĩa ([3]). Định nghĩa tri thức, tri thức bộ phận.
X U thì tập I

t
(X) đợc định nghĩa nh sau:

Xo
At
t
A
t
oXI

=
][
][)(

I
t
(X) đợc gọi là tri thức bộ phận của tác nhân t về X xác định bởi S
t
. Theo lý
thuyết tập thô thì I
t
(X) là tập xấp xỉ dới của X. [6]
Gọi X là phần bù của tập X trong không gian nền U. I
t
(X) là tri thức bộ
phận của t về X xác định bởi S
t
. Khi đó tri thức của tác nhân t về X cho bởi S
t
, ký

hiệu K
t
(X) là: K
t
(X) = I
t
(X) I
t
(X)
3.3. Một số tính chất của toán tử tri thức I
t
và K
t

Giả sử s và t là các tác nhân, s t. S
s
và S
t
là các hệ biểu diễn tri thức tơng
ứng và X U, khi đó ta có:
(1). A
t
A
s
I
t
(X) I
s
(X)
(2). I

s
I
t
(X) I
s
(X) và I
s
I
t
(X) I
t
(X)
(3). I
s
I
t
(X) I
s
(X) I
t
(X)
(4). A
t
A
s
I
t
I
s
(X) = I

t
(X)
(5). A
t
A
s
K
t
(X) K
s
(X)
(6). K
t
(X) = K
t
(X)
(7). I
t
K
t
(X) = K
t
(X)
(8). K
t
K
t
(X) = U
(9). K
t

= U
(10). K
t
U = U
(11). K
t
I
t
(X) = U
(12). K
t
(X) = U I
t
(X) = X
IV. Các phép toán trên hệ tri thức
Sau đây, chúng tôi xây dựng một số phép toán trên các hệ tri thức: phép hợp,
phép giao và phép so sánh.
4.1. Phép hợp
Cho hai hệ tri thức S
t
và S
s
tơng ứng với các tác nhân t và s trên tập đối
tợng U = {o
1
,o
2
,,o
n
}, S

t
=(U,A
t
), S
s
= (U,A
s
). Nếu A
t
A
s
= B thì aB, oU,
a(o) có giá trị nh nhau trong S
t
và S
s
.
Phép hợp hai hệ tri thức S
t
và S
s
đợc ký hiệu S
t
S
s
là một hệ tri thức đợc
xác định nh sau: S
t
S
s

= (U, A
t
A
s
). Trong đó A
t
A
s
= {a: a A
t
hoặc a A
s
}.

Đại học Vinh Tạp chí khoa học, tập XXXVII, số 1A-2008

61
Kết quả của phép hợp giữa S
t
và S
s
đợc xem nh là tri thức kết nối của
chúng. Hơn nữa nó là một phân hoạch của U và có thể phân biệt tập đối tợng trong
U tốt hơn mỗi tác nhân.
4.2. Ví dụ. Cho 2 tác nhân t, s nhận U = {o
1
, o

2
, o
3
, o
4
, o
5
} nh sau:

U a b c

U c d e
o
1

1 2 3
o
1

3 0 2
o
2

0 1 3
o
2

3 0 2
o
3

0 1 3
o
3

3 1 0
o
4

2 1 2
o
4

2 4 1
S
t
=

o
5

1 3 2
S
s
=

o
5

2 4 1

Từ bảng trên, ta có:

t
= {{o
1
}, {o
2
, o
3
}, {o
4
}, {o
5
}} và
s
= {{o
1
, o
2
}, {o
3
}, {o
4
, o
5
}}
Khi đó, S
t
S
s

đợc mô tả nh sau:

U a b c d e
o
1

1 2 3 0 2
o
2

0 1 3 0 2
o
3

0 1 3 1 0
o
4

2 1 2 4 1
S
t
S
s
=
o
5

1 3 2 4 1
Cơ sở tri thức của S
t

S
s
là một phân hoạch = {{o
1
}, {o
2
}, {o
3
}, {o
4
}, {o
5
}}
Nh vậy, phép hợp hai tri thức S
t
S
s
của hai tác nhân t và s có thể nhận ra
các đối tợng trong U tốt hơn mỗi tác nhân.
Trờng hợp tổng quát:
S
1
S
2
S
m
= (U, A
1
A
2

A
n
)
4.3. Phép giao
Cho hai hệ tri thức S
t
và S
s
tơng ứng với các tác nhân t và s nh trong mục 4.1.
Phép giao hai tri thức S
t
và S
s
đợc ký hiệu S
t
S
s
là một hệ tri thức đợc xác định
nh sau: S
t
S
s
= (U, A
t
A
s
). Trong đó A
t
A
s

= {a: a A
t
và a A
s
}, A
t
A
s
.
Kết quả của phép giao ta đợc tri thức chung của S
t
và S
s
, là một phân hoạch của U.
4.4. Ví dụ. Cho 2 tác nhân t, s nhận U = {o
1
, o
2
, o
3
, o
4
, o
5
} nh ví dụ 4.2. Khi
đó, S
t
S
s
đợc mô tả nh sau:

U c
o
1

3
o
2

3
o
3

3
o
4

2
S
t
S
s
=
o
5

2

C. T. Sơn, P. A. Phong, N. Q. Khanh Một số theo triết lý TậP THÔ, tr. 57-63

62
Cơ sở tri thức của S
t
S
s
là một phân hoạch gồm 2 lớp = {[o
1
], [o
4
]}
4.5. Phép so sánh
s, t T, để so sánh tri thức của tác nhân t và s, chúng ta xây dựng phép
toán (mạnh hơn) trên tập cơ sở tri thức.
Giả sử
t
và
s
là hai cơ sở tri thức tơng ứng của hai hệ tin S
t
và S
s
, khi đó
phép toán

đợc xác định:

t

s
[x]
t
[y]
s
: [x]
t
[y]
s

4.6. Ví dụ. Cho hai tác nhân t, s ứng với hai hệ tri thức S
t
= (U, A
t
) và
S
s
=(U,A
s
), xác định trên không gian U = {o
1
, o
2
, o
3
, o
4

, o
5
} nh sau:

U a b c

U c d e
o
1

1 2 3
o
1

3 1 2
o
2

0 1 3
o
2

3 0 2
o
3

0 1 3
o
3

3 0 2
o
4

2 1 2
o
4

2 3 3
S
t
=

o
5

1 3 2
S
s
=

o
5

2 3 3
Dựa vào các bảng trên, ta có cơ sở tri thức của tác nhân t và s tơng ứng:

t
= {{o
1

}, {o
2
, o
3
}, {o
4
}, {o
5
}}

s
= {{o
1
}, {o
2
, o
3
}, {o
4
, o
5
}}
Từ
t
và
s
, chúng ta thấy [x]
t
[y]
s

: [x]
t
[y]
s
nên có thể kết luận rằng sự
phân loại các đối tợng trong U bởi tác nhân t tốt hơn sự phân loại các đối tợng
trong U bởi tác nhân s, hay chúng ta nói rằng tri thức của tác nhân t mạnh hơn tri
thức của tác nhân s.
V. Kết luận
Biểu diễn tri thức và khai phá dữ liệu là những lĩnh vực đã và đang đợc
nghiên cứu, ứng dụng nhiều trong tin học ([2, 7]). Từ những bảng dữ liệu lớn với dữ
liệu d thừa, không hoàn hảo, dữ liệu liên tục hay dữ liệu biểu diễn dới dạng ký hiệu,
lý thuyết tập thô cho phép biểu diễn chúng nhằm nắm bắt những đặc trng chủ yếu
của vấn đề và làm cho những thông tin đó trở nên dễ dàng thao tác. Việc đa ra các
phép toán trên hệ tri thức có thể tìm ra tập các thuộc tính nhỏ nhất nhằm loại bỏ
những thông tin d thừa, không cần thiết mà vẫn giữ đợc ý nghĩa. Sau đó, dựa vào
tập thuộc tính nhỏ nhất này ngời ta có thể tìm ra các quy luật chung nhất hoặc các
mẫu (patterns) để biểu diễn tri thức.

TàI LIệU THAM KHảO

[1] Bạch Hng Khang, Hoàng Kiếm, Trí tuệ nhân tạo - Các phơng pháp và ứng
dụng, Nhà xuất bản Khoa học Kỹ thuật, Hà Nội, 1989.

Đại học Vinh Tạp chí khoa học, tập XXXVII, số 1A-2008

63
[2] Nguyễn Bá Tờng, Nhập môn cơ sở dữ liệu phân tán, Nhà xuất bản Khoa học Kỹ
thuật, Hà Nội, 2005.
[3] M. Rauszer Cecylia, Knowledge Representation Systems for Groups of Agents, ICS
Research Report, 1992.
[4] R. Parikh, Proceeding of the Conference Theoretical Aspects of Reasoning about
Knowledge, Morgan Kaufmann, 1990.
[5] Z. Pawlak, Rough sets, International Journal of Computer and Information
Sciences, Vol. 11, 1982, pp. 341-346.
[6] Z. Pawlak, Rough Sets - The Theoretical Aspects of Reasoning about Data,
Kluwer, 1991.
[7] Weiru Liu, Reasonning about Knowledge using Rough sets, Springer-Verlag
London, Vol. 2143, 2001, pp. 385-397.

SUMMARY

Some operators on knowledge representation systems
based on rough set theory

This paper presents knowledge representation method for group of agents t
about a set of objects by rough set, introduces some knowledge operators and some
basic properties of those, constructs some operators based on knowledge system.

(a)
Khoa Công nghệ thông tin, Đại học Vinh.
(b)
Phòng Công nghệ thông tin, Cục V26 - Bộ công an.

Báo cáo nghiên cứu khoa học: "Một số phép toán trên hệ biểu diễn tri thức dựa theo triết lý tập thô.." pptx

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về