ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
BÀI THU HOẠCH
TOÁN
NGUYỄN HẢI TOÀN CH1301110
HUỲNH THANH VIỆT CH1301114
TRỊNH NAM VIỆT CH1301115
TP HCM, tháng 10 năm 2014
NHẬN XÉT CỦA GVHD
LÝ THUYẾT TẬP THÔ
&
ỨNG DỤNG
Lý thuyết tập thô và ứng dụng
2
Lý thuyết tập thô và ứng dụng
LỜI CẢM ƠN
Nhóm em xin chân thành cảm ơn thầy TS.Dương Tôn Đảm đã truyền đạt kiến
thức cũng như giới thiệu các tài liệu quí báu và tạo điều kiện thuận lợi để cho nhóm em
thực hiện xong bài thu hoạch này.
Nhóm học viên CH-08
3
Lý thuyết tập thô và ứng dụng
LỜI MỞ ĐẦU
Hiện nay, Lý thuyết tập thô cung cấp cho nhiều nhà nghiên cứu và phân tích dữ
liệu với nhiều kỹ thuật trong khai phá dữ liệu như là các khái niệm đặc trưng bằng cách
sử dụng một số dữ kiện. Nhiều nhà nghiên cứu đã sử dụng lý thuyết tập thô trong các ứng
dụng như phân biệt thuộc tính, giảm số chiều, khám phá tri thức, và phân tích dữ liệu thời
gian.
Lý thuyết tập thô đã chứng minh được tiềm năng lớn trong suy diễn, do đó.
Bài thu hoạch này, nhóm em thực hiện thuật toán tìm tập rút gọn của một bảng
quyết định từ đó chọn được các thuộc tính cần thiết đưa vào xây dựng cấu trúc cây quyết
định để chọn thuộc tính phân nhánh tối ưu, làm cho cây có chiều cao nhỏ nhất.
4
Lý thuyết tập thô và ứng dụng
MỤC LỤC
5
Lý thuyết tập thô và ứng dụng
Chương 1
CÁC
KHÁI
NIỆM
CƠ
BẢN
1.1 Hệ thống thông tin và tập thô
1.1.1
Hệ
thống
thông
tin
Một
tập
dữ
liệu
có
thể
biểu
diễn
dưới
dạng
một
bảng,
trên
đó
mỗi
hàng
biểu
diễn
thông
tin
ứng
với
một
đối
tượng,
mỗi
cột
biểu
diễn
một
thuộc
tính
có
thể
đo
được
của
mỗi
đối
tượng
(do
các
chuyên
gia
hay
người
sử
dụng
cung
cấp).
Bảng
này
được
gọi
là
một
hệ
thống
thông
tin.
Hình
thức
hơn,
hệ
thống
thông
tin
là
một
cặp
S
=
(U,
A),
U
là một
tập
hữu
hạn
khác
rỗng
các
đối
tượng
gọi
là
tập
vũ
trụ
hay
là
tập
phổ
dụng,
A
là
một
tập
hữu
hạn
khác
rỗng
các
thuộc
tính.
Với
mỗi
u ∈U
và
a∈A,
ta
ký
hiệu
u(a)
là
giá
trị
của
đối
tượng
u
tại
thuộc
tính
a.
Nếu
gọi
I
a
là
tập tất
cả
giá
trị
của
thuộc
tính
a,
thì
u(a)
∈
I
a
với
mọi
u∈U.
Bây
giờ,
nếu
B
=
{b
1
,
b
2
,
,b
k
}
⊆
A,
ta
ký
hiệu
bộ
các
giá
trị
u(b
i
)
bởi
u(B).
Như
vậy,
nếu
u
và
v
là
hai
đối
tượng,
thì
ta
sẽ
viết
u(B)
=
v(B)
nếu
u(b
i
)
=
v(b
i
),
với
mọi
i
=1,
2,
,
k.
1.1.2
Quan
hệ
không
phân
biệt
được
Xét
hệ
thống
thông
tin
S
=
(U,
A),
với
mỗi
tập
thuộc
tính
B
⊆
A
tạo
ra một
quan
hệ
hai
ngôi
trên
U,
ký
hiệu
IND(B)
IND(B)
=
{(u,v) ∈U
×U
|
u(a)
=
v(a),∀a ∈ B}
IND(B) được gọi là quan hệ B_không phân biệt được. Dễ kiểm chứng đây là một
quan hệ tương đương trên U. Với mọi đối tượng u U, lớp tương đương của u
trong quan hệ IND(B) được kí hiệu bởi [u]B. Tập thương xác định bởi quan hệ
IND(B) được ký hiệu U/IND(B) hay U/B, tức là U/IND(B) = U/B = {[u]B |
u U}
6
Lý thuyết tập thô và ứng dụng
Ví
dụ
1.1
Xét
hệ
thống
thông
tin
cho
ở
bảng
1.1
U
Đau
đầu
Đau
cơ
Nhiệt
độ
Cúm
x
1
Không Có Cao Có
x
2
Có Không Cao Có
x
3
Có Có Rất
cao Có
x
4
Không Có Bình
thường Không
x
5
Có Không Cao Không
x
6
Không Có Rất
cao Có
Bảng
1.1
Bảng
dữ
liệu
bệnh
cúm
Trong
đó:
U
=
{x
1
,
x
2
,
x
3
,
x
4
,
x
5
,
x
6
}.
A
=
{Đau
đầu,
Đau
cơ,
Nhiệt
độ,
Cúm}.
Trong
bảng,
các
bệnh
nhân
x
2
,
x
3
và
x
5
không
phân
biệt
được
đối
với
thuộc
tính
Đau
đầu,
bệnh
nhân
x
3
và
x
6
không
phân
biệt
được
đối
với
thuộc
tính
Đau
cơ,
Cúm
và
b
ệnh
nhân
x
2
,
x
5
không
phân
biệt
được
đối
với
thuộc
tính
Đau
đầu,
Đau
cơ
và
Nhiệt
độ.
Do
đó:
IND({Đau
đầu})
=
{{x
1
,
x
4
,
x
6
},{x
2
,
x
3
,
x
5
}}
IND({Đau
cơ})
=
{{x
1
,
x
3
,
x
4
,
x
6
},
{x
2
,
x
5
}},
IND({Nhiệt
độ})
=
{{x
1
,
x
2
,
x
5
},
{x
3
,
x
6
},
{x
4
}},
7
Lý thuyết tập thô và ứng dụng
IND({Cúm})
=
{{x
1
,
x
2
,
x
3
,
x
6
},
{x
4
,
x
5
}},
IND({Đau
đầu,
Đau
cơ})
=
{{x
1
,
x
4
,
x
6
},
{x
2
,
x
5
},
{x
3
}}.
Xét
hệ
thống
thông
tin
S
=
(U,
A),
một
quan
hệ
bộ
phận
p
xác
định
trên
họ
{U/B|
B
⊆
A}
đ
ược
định
nghĩa:
nếu
và
chỉ
nếu
∀P
∈U
/ P,∃Q
j
∈U
/ Q :
P
⊆
Q
j
.
Khi
đó
ta
nói
Q
là
thô hơn
P
hay
P
là
mịn
hơn
Q.
1.1.3
Tập
thô
Lý thuyết tập thô (Rough set) được đề xuất vào năm 1982 bởi Z.Pawlak. Lý
thuyết này xây dựng phương pháp luận liên quan đến sự phân loại và
phân tích không chắc chắn, thông tin và tri thức không đầy đủ và được coi là một
trong những phương pháp tiếp cận đầu tiên không dựa trên thống kê trong phân
tích dữ liệu.Khái niệm cơ bản của lý thuyết tập thô là xấp xỉ dưới và trên của một
tập, sự xấp xỉ của không gian là hình thức phân loại tri thức liên quan đến miền
quan tâm.
Tập con được tạo ra bởi xấp xỉ dưới mô tả bởi các đối tượng là những thành
phần chắc chắn của một tập, trong khi xấp xỉ trên được đặc trưng bởi các đối
tượng có khả năng thuộc tập quan tâm. Mỗi tập con xác định thông qua xấp xỉ
dưới và xấp xỉ trên được gọi là tập thô.
Gần đây, lý thuyết tập thô trở thành một công cụ đánh giá trong xử lý các vấn đề
khác nhau như trình bày tri thức không chắc chắn hoặc không chính xác, phân
tích tri thức, đánh giá chất lượng và tính khả dụng của thông tin đối với tính nhất
quán và sự có mặt các mẫu không theo thời gian, nhận dạng và đánh giá sự phụ
thuộc thời gian, suy luận dựa trên sự không chắc chắn và thiếu thông tin dữ liệu.
8
i i
Lý thuyết tập thô và ứng dụng
Trong
lý
thuyết
tập
thô,
để
biểu
diễn
một
tập
hợp
bằng
tri
thức
được
cho
xác
định
bởi
một
tập
thuộc
tính,
người
ta
định
nghĩa
hai
phép
xấp
xỉ:
Cho
một
hệ
thống
thông
tin
S
=
(U,
A),
với
mỗi
tập
con
X
⊆
U
và
B
⊆
A,
ký
hiệu R
=
IND(B),
ta
có
2
tập
con
sau:
(X), (X)lần lượt gọi là R-xấp xỉ dưới và R- xấp xỉ trên của tập X.
Tập (X) bao gồm tất cả các phần tử của U chắc chắn thuộc vào X.
Tập (X) bao gồm các phần tử của U có khả năng được phân loại vào những phần tử
thuộc X ứng với quan hệ R.
Từ
hai
tập
xấp
xỉ
người
ta
định
nghĩa
các
tập:
Ký
hiệu
tập
thương
của
IND(B)
trên
U
là
U/B,
các
xấp
xỉ
trên
và
dưới
của
X
có
thể
v
iết
lại:
Trong
trường
hợp
BN
B
(X)
≠
∅,
X
được
gọi
là
tập
thô,
ngược
lại
X
được
gọi
là
tập
rõ.
9
Lý thuyết tập thô và ứng dụng
Hình 1.1 Minh họa tập thô
Đối
với
một
hệ
thống
thông
tin
S
=
(U,
A),
B,
D
⊆
A,
ký
hiệu
R
=
IND(B),
người ta
gọi
B-miền
khẳng
định
dương
của
D
là
tập
được
xác
định
như
sau:
Rõ
ràng
POS
B
(D)
là
tập
tất
cả
các
đối
tượng
u
sao
cho
với
mọi
v∈U
mà u(B)
=
v(B)
ta
đều
có
u(D)
=
v(D) .
Nói
cách
khác,
POS
B
(D)
={u ∈U
|
u
B
⊆
u
D
}.
1.1.4
Các
tính
chất
của
xấp
xỉ
Định
lý
1.1.
[34]
Cho
một
hệ
thống
thông
tin
S
=
(U,
A),
∀X,
Y
⊆
U
và
B
⊆A,
đặt
R
=
IND(B).
Khi
đó:
10
Lý thuyết tập thô và ứng dụng
Tính
chất
(3L),
(4L)
và
(8L)
là
những
tính
chất
đặc
trưng
cho
phép
xấp
xỉ
dưới,
điều
đó
có
nghĩa
là
những
tính
chất
khác
của
phép
xấp
xỉ
dưới
có
thể
suy
dẫn
từ
ba
tính
chất
này.
Tương
tự,
(3H),
(4H)
và
(8H)
là
những
tính
chất
đặc
trưng
của
phép
xấp
xỉ
trên.
11
Lý thuyết tập thô và ứng dụng
1.1.5
Độ
chính
xác
của
xấp
xỉ
Cho
một
hệ
thống
thông
tin
S
=
(U,
A),
với
mỗi
tập
con
X
⊆
U
và
B
⊆
A,
đặt R
=
IND(B),
đại
lượng
đo
sự
chính
xác
của
tập
xấp
xỉ
X
đối
với
phân
hoạch
trên
B
là
giá
trị :
Trong
đó
card(X)
=
|X|
là
lực
lượng
(số
phần
tử)
của
tập
X.
Rõ
ràng
0
≤
α
R
(X )
≤1.
Nếu
α
R
(X )
=1,
ta
nói
X
là
chính
xác
đối
với
R,
còn
α
R
(X )
<1,
X được
gọi
là
thô
đối
với
R.
1.1.6
Bảng
quyết
định
Bảng
quyết
định
là
một
hệ
thống
thông
tin
có
dạng
T
=
(U,
A),
trong
đó
tập
thuộc
tính
A
được
chia
thành
hai
tập
thuộc
tính
rời
nhau
C
và
D,
C
được
gọi
là
tập
thuộc
tính
điều
kiện,
còn
D
là
tập
thuộc
tính
quyết
định.
Tức
là
T
=
(U,
C∪D),
với
C∩D
=
∅.
Trong
trường
hợp
không
sợ
bị
nhầm
lẫn
người
ta
còn
ký
hiệu
T
=
(U,C,
D).
Ví
dụ
1.2
Hệ
thống
thông
tin
S
=
(U,
A)
biểu
diễn
cơ
sở
tri
thức
về
bệnh
cúm
được
thể
hiện
trong
bảng
1.1
là
một
bảng
quyết
định
T
=
(U,
C∪D)
Trong
đó:
U
=
{x
1
,
x
2
,
x
3
,
x
4
,
x
5
,
x
6
}.
A
=
{Đau
đầu,
Đau
cơ,
Nhiệt
độ,
Cúm}.
Tập
thuộc
tính
điều
kiện
C
=
{Đau
đầu,
Đau
cơ,
Nhiệt
độ}
Tập
thuộc
tính
quyết
định
D
={Cúm}
U
Đau
đầu
Đau
cơ
Nhiệt
độ
Cúm
x
1
Không Có Cao Có
12
Lý thuyết tập thô và ứng dụng
x
2
Có Không Cao Có
x
3
Có Có Rất
cao Có
x
4
Không Có Bình
thường Không
x
5
Có Không Cao Không
x
6
Không Có Rất
cao Có
Bảng 1.2 Bảng quyết định
Cho
một
bảng
quyết
định
T
=
(U,
C∪D),
giả
sử
U/C
=
{X
1
,
X
2
, ,
X
m
}
và
U/D
=
{Y
1
,
Y
2
, ,
Y
n
}.
Một
lớp
X
i
∈U/C
được
gọi
là
nhất
quán
nếu
u(d)
=
v(d),
∀u,v∈X
i
,
∀d∈D,
lúc
này
cũng
có
thể
viết
u(D)
=
v(D)
=
X
i
(D);
một
lớp
Y∈U/D
được
gọi
là
nhất
quán
ngược
nếu
u(a)
=
v(a),
∀u,v∈Y,
∀a∈C
Một
bảng
quyết
định
T
=
(U,
C∪D)
là
nhất
quán
nếu
mọi
lớp
X
i
∈U/C
là
nhất
quán,
ngược
lại
T
được
gọi
là
không
nhất
quán.
Dễ
thấy
nếu
U/C
U/D
thì
T
=
(U,C∪D)
là
nhất
quán.
Tương
tự,
nếu
U/D U/C,
thì
T
là
nhất
quán
ngược.
Có
thể
thấy
bảng
quyết
định
là
nhất
quán
khi
và
chỉ
khi
POS
C
(D)
=
U.
Trong
trường
hợp
bảng
không
nhất
quán
thì
POS
C
(D)
chính
là
tập
con
cực
đại
của
U
sao
cho
phụ
thuộc
hàm
C
→
D
đúng.
1.1.7
Rút
gọn
và
nhân
Xét
một
bảng
quyết
định
T
=
(U,
C∪D).
Tập
thuộc
tính
R
⊆
C
được
gọi
là
một
rút
gọn
của
C
nếu
POS
R
(D)=POS
C
(D).
Nhân
của
tập
thuộc
tính
điều
kiện
C
ký
hiệu
CORE
(C)
được
định
nghĩa
CORE(C)
=
∩RED(C)
Ở
đây,
RED(C)
là
tập
hợp
tất
cả
rút
gọn
của
C.
13
Lý thuyết tập thô và ứng dụng
Ngoài
ra,
người
ta
cũng
định
nghĩa
rút
gọn
C-miền
khẳng
định
dương
của
D:
Nếu
B
⊆
C
thỏa:
1.POS
B
(D)=
POS
C
(D)
2.∀a ∈ B, POS
C
(D)
≠
POS
C
−
{a}
(D)
B
được
gọi
là
rút
gọn
C-miền
khẳng
định
dương
của
D.
1.1.8
Ma
trận
phân
biệt
được
và
hàm
phân
biệt
được
Xét
bảng
quyết
định
T
=
(U,
C∪D),
với
U
=
{u
1
,
u
2
,
,
u
n
}.
Ma
trận
phân
biệt
được
của
T
ký
hiệu
M(
T
)
=
(m
ij
)
n
×
n
là
một
ma
trận
đối
xứng,
trong
đó
mỗi
phần
tử
của nó
là
một
tập
thuộc
tính
được
xác
định
như
sau
:
Hàm
phân
biệt
được
f
Τ
là
một
hàm
boole,
được
xác
định
từ
ma
trận
phân
biệt
M(
T
)
như
sau
:
trong
đó,
mỗi
thuộc
tính
được
đặt
tương
ứng
một
biến
logic
cùng
tên
và
1.1.9
Luật
quyết
định
Cho
T
=
(U,
C∪D)
là
một
bảng
quyết
định,
giả
sử
U/C
=
{X
1
,
X
2
,
,
X
m
}
và
U/D
=
{Y
1
,
Y
2
,
,
Y
n
}.
Nếu
X
i
∩Y
j
≠∅,
ký
hiệu
des(X
i
),
des(Y
j
)
lần
lượt
là
các
mô
tả
của
các
lớp
tương
đương
ứng
với
X
i
,
Y
j
.
Một
luật
quyết
định xác
định
bởi
X
i
,
Y
j
có
dạng:
14
Lý thuyết tập thô và ứng dụng
Độ
đo
độ
chắc
chắn
và
độ
hỗ
trợ
của
luật
quyết
định
Z
ij
được
định
nghĩa
như
sau
:
Ở đây |.| là bản số hay lực lượng của một tập hợp. Rõ ràng giá trị của
µ
(Z
ij
),s(Z
ij
) luật
quyết
định
Z
ij
rơi vào đoạn .Để thuận tiện trong trình bày ký hiệu ta
thay bằng .
1.1.10
Phụ
thuộc
độ
k
Cho
hệ
thống
thông
tin
S
=
(U,
A),
X,
Y
⊆
A.
Chúng
ta
nói
rằng
tập
thuộc
tính
Y
phụ
thuộc
độ
k∈[0,1]
vào
tập
thuộc
tính
X,
ký
hiệu
,
với
k
được
xác
định
như
sau
:
Khi , chúng ta viết và được viết .
Dễ
thấy
rằng
phụ
thuộc
độ
k
là
sự
tổng
quát
hóa
của
phụ
thuộc
hàm
và là
phụ thuộc hàm đã biết trong CSDL quan hệ.
15
Lý thuyết tập thô và ứng dụng
Chương 2
PHỦ TẬP THÔ
Chương
này
nhóm em tìm hiểu
sự
mở
rộng
tập
thô
theo
hướng
thay
đổi
phân
hoạch
bởi
phủ.
Phương
pháp
tiếp
cận
là
khảo
sát
tính
chất
toán
học
của
các
phép
xấp
xỉ
ứng
với
ba
loại
phủ
do
W.
Zhu
và
F.Y
Wang
đề
xuất
[37,
38,
40]
và
các
phép
xấp
xỉ
dựa
vào
phủ
được
tiếp
cận
bằng
công
cụ
toán
học
là
không
gian
topo
của
một
số
tác
giả
khác
[6,
18,
39,
44]
để
chỉ
ra
mối
quan
hệ
giữa
các
phép
xấp
xỉ.
Cuối
chương,
bài thu
hoạch
sẽ trình bày
thuật
toán
rút
gọn
tập
thuộc
tính
dựa
vào
họ
phủ
tập
thô
FC_Reduct
và
ứng
dụng.
Trong
các
bài
báo
công
bố
kết
quả
nghiên
cứu
của
mình
[37,
38],
W.
Zhu
và
F.YWang
đã
đưa
ra
hệ
tiên
đề
cho
phép
xấp
xỉ
phủ
dưới
và
khẳng
định
tính
mở
của
bài
toán
tìm
tính
chất
đặc
trưng
của
các
phép
xấp
xỉ
phủ
trên
(loại
1,
2,
3).
Kế
thừa,
phát
triển
những
kết
quả
này,
luận
án
đóng
góp
một
số
điều
kiện
để
hai
phủ
sinh
cùng
xác
định
một
phép
xấp
xỉ
phủ
loại
2.
Tính
chất
ánh
xạ
đóng
của
các
phép
xấp
xỉ
phủ
loại
1,
2,
3
cũng
được
khảo
sát
nhằm
có
thể
sử
dụng
các
kết
quả
ứng
dụng
của
ánh
xạ
đóng
vào
các
tập
cơ
sở
dữ
liệu.
16
Lý thuyết tập thô và ứng dụng
2.1 Tính chất của xấp xỉ phủ loại 1, 2, 3
2.1.1
Xấp
xỉ
phủ
tập
thô
loại
1
a.
Sự
phụ
thuộc
xấp
xỉ
dưới
và
xấp
xỉ
trên
loại
1
W.
Zhu
và
F.Y.
Wang
[38]
đã
chỉ
ra
mối
quan
hệ
giữa
xấp
xỉ
phủ
dưới
và
xấp
xỉ
phủ
trên
loại
1
thông
qua
các
định
lý
Định
lý
2.1
[38]
Cho
C
1
và
C
2
là
hai
phủ
của
U,
C
1
và
C
2
sinh
ra
cùng
phép
xấp
xỉ
phủ
dưới
(loại
1,
2,
3)
nếu
và
chỉ
nếu
reduct(
C
1
)
=
reduct(
C
2
).
Định
lý
2.2
[38]
Cho
C
1
và
C
2
là
hai
phủ
của
U,
C
1
và
C
2
sinh
ra
cùng
phép
xấp
xỉ
phủ
trên
loại
1
nếu
và
chỉ
nếu
reduct(
C
1
)
=
reduct(
C
2
).
Định
lý
2.3
[38]
Cho
C
1
,
C
2
là
hai
phủ
của
U,
C
1
và
C
2
sinh
ra
cùng
phép
xấp
xỉ
phủ
dưới
loại
1
khi
và
chỉ
khi
chúng
cùng
sinh
ra
xấp
xỉ
phủ
trên
loại
1.
b.
Tiên
đề
cho
phép
xấp
xỉ
phủ
dưới
Định
lý
2.4
[37,
40]
Cho
U
là
một
tập
khác
rỗng.
Nếu
tồn
tại
1
phép
toán
L:
17
Lý thuyết tập thô và ứng dụng
thì
tồn
tại
một
phủ
C
của
U
mà
phép
xấp
xỉ
phủ
dưới
CL
được
sinh
bởi
C
là
L.
Hơn
thế,
bốn
tính
chất
trên
của
phép
xấp
xỉ
phủ
dưới
là
độc
lập.
((1L)-(7L)
là
ký
hiệu
thứ
tự
các
tính
chất
của
phép
xấp
xỉ
phủ
dưới
được
viết
ở
1.1.4).
c.
Tiên
đề
cho
phép
xấp
xỉ
phủ
trên
loại
1
Các
tính
chất
(1L)
đến
(9H)
trong
1.1.4
là
cơ
bản
và
đầy
đủ
cho
các
phép
xấp
xỉ
dưới,
phép
xấp
xỉ
trên
trong
tập
thô
cổ
điển.
Định
lý
2.4
chỉ
ra
rằng
các
tính
chất
(1L),
(2L),
(3L),
(7L)
cũng
là
đầy
đủ
đối
với
các
phép
toán
xấp
xỉ
phủ
dưới.
Tuy
nhiên,
các
tính
chất
(1H),
(2H),
(3H)
và
(5H)
chưa
đủ
để
đặc
trưng
cho
các
phép
xấp
xỉ
trên
loại
1.
Điều
này
có
thể
thấy
được
qua
ví
dụ
Ví
dụ
2.1
[38,
40]
Một
phép
toán
H
:
P
(U)
P
(U)
thỏa
các
tính
chất
(1H),(2H),
(3H)
và
(5H)
nhưng
không
tồn
tại
một
phủ
C
của
U
mà
H
là
một
phép
xấp
xỉ
phủ trên
loại
1
sinh
ra
bởi
C
.
Cho
U
=
{a,
b,
c}.
Định
nghĩa
H
:
P
(U)
P
(U)
như
sau
Hiển
nhiên
H
thỏa
các
tính
chất
(1H),
(2H),
(3H)
và
(5H),
nhưng
không
tồn
tại
phủ
C
nào
của
U
mà
H
là
phép
xấp
xỉ
phủ
trên
loại
1
sinh
ra
bởi
C
.
Thật
vậy,
nếu
có
thì
phủ
C
phải
có
2
phần
tử
{a}
và
{b}.
Trong
trường
hợp
này,
FH({a,b})
=
{a,b}
≠{a,b,c}=
H
({a,b}).
Do
đó
H
không
là
phép
xấp
xỉ
phủ trên
loại
1
sinh
ra
bởi
C
.
Bài
toán
tìm
hệ
tiên
đề
cho
xấp
xỉ
phủ
trên
loại
1
vẫn
còn
là
bài
toán
mở.
18
Lý thuyết tập thô và ứng dụng
2.1.2
Xấp
xỉ
phủ
tập
thô
loại
2
Tương
tự
như
xấp
xỉ
phủ
tập
thô
loại
1,
các
tính
chất
quan
trọng
của
xấp
xỉ
phủ
tập
thô
loại
2
được
công
bố
trong
[37,
38,
40].
Định
nghĩa
xấp
xỉ
phủ
dưới
tập
thô
loại
2
có
cùng
định
nghĩa
với
xấp
xỉ
phủ
dưới
tập
thô
loại
1,
sự khác
biệt
là
ở
xấp
xỉ
phủ
trên.Mối
quan
hệ
giữa
xấp
xỉ
phủ
dưới
và
xấp
xỉ
phủ
trên
tập
thô
loại
2
Khái
niệm
rút
gọn
phủ
tỏ
ra
không
hữu
dụng
trong
mối
quan
hệ
giữa
xấp
xỉ
phủ
dưới và
xấp
xỉ
phủ
trên
loại
2.
19
Lý thuyết tập thô và ứng dụng
2.1.3
Xấp
xỉ
phủ
tập
thô
loại
3
20
Lý thuyết tập thô và ứng dụng
a.
Sự
phụ
thuộc
xấp
xỉ
phủ
dưới
và
xấp
xỉ
phủ
trên
loại
3
Định
lý
2.6
[38,
40]
Cho
C
là
phủ
của
U
thì
C
và
reduct(
C
)
sinh
ra
cùng
các
phép
xấp
xỉ
phủ
dưới
và
xấp
xỉ
phủ
trên
loại
3.
Định
lý
2.7
[38,
40]
Cho
C
1
,
C
2
là
hai
phủ
của
U,
nếu
reduct
(
C
1
)
=
reduct(
C
2
),
thì
C
1
và
C
2
sinh
ra
cùng
xấp
xỉ
phủ
trên
loại
3.
Chú
ý
2.1:
Điều
ngược
lại
định
lý
trên
là
không
đúng,
ta
có
phản
ví
dụ
Phản
ví
dụ
2.3
Cho
U
=
{a,
b,
c},
K
1
=
{a,
b},
K
2
=
{b,
c},
K
3
=
{a,
c}, K
4
={a, b,
c},
C
1
=
{K
1
,
K
2
,
K
3
}
and
C
2
=
{K
4
}.
Nếu
X
=
∅
thì
xấp
xỉ
phủ
trên
loại
3
sinh
ra
bởi
hai
phủ
C
1
và
C
2
đều
là
X
#
=
{a
,b,
c},
nhưng
reduct(
C
1
)
=
C
1
≠
reduct(
C
2
)
=
C
2
.
Định
lý
2.8
[38,
40]
Cho
C
1
,
C
2
là
các
phủ
của
U,
nếu
C
1
và
C
2
sinh
ra
cùng
xấp
xỉ
phủ
dưới
thì
chúng
cũng
sinh
ra
cùng
xấp
xỉ
phủ
trên
loại
3.
b.
Tiên
đề
cho
các
phép
xấp
xỉ
phủ
trên
loại
3
Cũng
giống
như
phép
phủ
xấp
xỉ
trên
loại
1
và
loại
2.
Phép
phủ
xấp
xỉ
trên
loại
3
chưa
thể
tiên
đề
hóa
do
nhiều
tính
chất
đặc
trưng
của
phép
phủ
xấp
xỉ
trên
không
thỏa.
Phản
ví
dụ
2.4
[40]
Một
phép
toán
thỏa
(1H),
(2H),
(3H),
(4H),
và
(7H)
nhưng
không
là
xấp
xỉ
phủ
trên
loại
3.
Cho
U
=
{a,
b,
c}.
Định
nghĩa
H
:
H
:
P
(U)
P
(U)
như
sau:
H
(∅)
=
∅,
H
({a})
=
{a,
b},
H
({b})
=
{b,
c},
H
({c})
=
{c},
H
({a,
b})
=
U,
H
({b,
c})
=
{b,
c},
H
({a,
c})
=
U,
H
(U)
=
U.
Hiển
nhiên
H
thỏa
(1H),
(2H),
(3H)
21
Lý thuyết tập thô và ứng dụng
2.2 Mối quan hệ giữa ba loại phủ tập thô
2.3 Một số tính chất về xấp xỉ phủ loại 2
Định
lý
2.13
Cho
C
1
,
C
2
là
các
phủ
của
U,
C
1
và
C
2
cùng
xác
định
xấp
xỉ
phủdưới
và
xấp
xỉ
phủ
trên
loại
2
nếu
chúng
thỏa
các
điều
kiện
sau:
1.
reduct(
C
1
)
=
reduct(
C
2
)
2.
C
1
và
C
2
là
các
phủ
nửa
thu
gọn
Hệ
quả
2.1
Cho
C
1
,
C
2
là
các
phủ
của
U,
C
1
và
C
2
sinh
ra
cùng
xấp
xỉ
dưới
và
xấp
xỉ
trên
phủ
loại
2,
nếu
chúng
thỏa
các
điều
kiện
sau
1.
reduct(
C
1
)
=
reduct(
C
2
)
2.
C
1
và
C
2
là
các
phủ
tựa
điểm
Chứng
minh:
Kết
quả
được
suy
dẫn
trực
tiếp
từ
định
lý
2.12
và
2.13.
Mệnh
đề
2.1
Cho
C
là
một
phủ
của
U,
C
và
reduct(
C
)
chưa
chắc
sinh
ra
cùng
xấp
xỉ
trên
loại
2
(ngay
cả
khi
reduct(
C
)
là
một
phân
hoạch).
Chứng
minh
Tính
chất
trên
có
thể
thấy
qua
phản
ví
dụ
sau
P
hản
ví
dụ
2.5
Cho
U
=
{a,
b,
c},
K
1
=
{a},
K
2
= {b},
K
3
=
{c},
K
4
=
{a, b, c},
C
=
{K
1
,
K
2
,
K
3
,
K
4
}.
Ta
có
reduct(
C
)
=
{K
1
,K
2
,K
3
}.
Nếu
X
=
{c},
thì
X
C
={a,b,c} ≠
X
22
Lý thuyết tập thô và ứng dụng
reduct(
C
)
=
K
3
2.4 Tính chất ánh xạ đóng của ba phép xấp xỉ trên dựa vào phủ
2.4.1
Tính
chất
ánh
xạ
đóng
của
ba
phép
xấp
xỉ
phủ
trên
ứng
với
phủ
đơn
vị
Mệnh
đề
2.2
Cho
C
là
một
phủ
của
U,
nếu
C
là
(phủ)
đơn
vị
thì
FH
sinh
bởi
C
thỏa
tính
chất:
∀X,Y
⊆
U,
X
⊆
Y
⇒
FH(X)
⊆
FH(Y) (tính
đồng
biến)
và
TH
sinh
bởi
C
thỏa:
TH(TH(X))
=
TH(X) (tính
lũy
đẳng)
Chứng
minh
Từ
bảng
tổng
kết
2.1,
nếu
C
là
(phủ)
đơn
vị
thì
FH
=
TH.
Do
TH
thỏa
tính
đồng
biến,
FH
thỏa
tính
lũy
đẳng
(bảng
2.2),
nên
khi
C
là
(phủ)
đơn
vị
FH
thỏa
tính
đơn
điệu
và
TH
thỏa
tính
lũy
đẳng.
Tuy
nhiên,
SH
chưa
chắc
thỏa
tính
lũy
đẳng
nếu
C
là
(phủ)
đơn
vị.
Phản
ví
dụ
2.6
Cho
U
=
{a,
b,
c,
d},
K
1
=
{a,
b},
K
2
=
{a,
d,
c},
K
3
=
{a, b, d},
C
=
{K
1
,
K
2
,
K
3
}.
C
là
một
phủ
đơn
vị
của
U.
Với
X
=
{c},
chúng
ta
có
SH(X)
=
∪
{K
|
K∈
C
,
K∩X
≠
∅
}
=
{a,
d,
c}
≠
SH(SH(X))
=
{a,
b,
c,
d}.
2.4.2
Tính
chất
ánh
xạ
đóng
của
ba
phép
xấp
xỉ
phủ
trên
ứng
với
phủ
tựa
điểm
Mệnh
đề
2.3
Cho
C
là
một
phủ
của
U.
Nếu
C
là
phủ
tựa
điểm
thì
FH
sinh
bởi
C
thỏa
tính
chất:
∀
X,Y
⊆
U,
X
⊆
Y
⇒
FH(X)
⊆
FH(Y)
(tính
đồng
biến)
23
Lý thuyết tập thô và ứng dụng
Chứng
minh
Từ
định
nghĩa
của
phủ
tựa
điểm
và
FH.
Nếu
C
là
một
phủ
tựa
điểm
chúng
ta
có
FH(X)
=
∪{Md(x)|
x
∈X}.
Dễ
dàng
thấy
rằng
24
Lý thuyết tập thô và ứng dụng
2.5 Mối quan hệ giữa các phép xấp xỉ phủ dựa vào không gian topo
Nhiều
tác
giả
trên
cơ
sở
lý
thuyết
không
gian
topo
đã
đề
xuất
các
phép
xấp
xỉ
dựa
vào
phủ.
Trong
phần
này,
luận
án
trình
bày
một
số
điều
kiện
để
các
phép
xấp
xỉ
dựa
vào
phủ
do
Y.Yao,
W.
Zhu,
và
A.M
.
Kozae
và
cộng
sự
đề
xuất
là
đồng
nhất.
2.5.1
Quan
hệ
hai
ngôi
và
không
gian
topo
a.
Không
gian
topo
được
xây
dựng
từ
một
quan
hệ
hai
ngôi
Giả
sử
R
là
một
quan
hệ
hai
ngôi
tùy
ý
xác
định
trên
U,
cặp
(U,
R)
được
gọi
là
một
không
gian
xấp
xỉ
xác
định
bởi
quan
hệ
hai
ngôi
R.
Ứng
với
R,
có
thể
định
nghĩa
láng
giềng
trái,
phải
của
một
phần
tử
x
thuộc
U
lần
lượt
như
sau
l
R
(x)
=
{y
|
y∈U,
yRx}
và
r
R
(x)
=
{y
|
y∈U,
xRy}
Xây
dựng
topo
τ
1
sử
dụng
R-láng
giềng
phải
(tương
tự,
topo
τ
2
sử
dụng
R-
láng
giềng
trái),
chúng
ta
xem
họ
S
1
=
{r
R
(x)
|
x
∈
U}
là
một
tiền
cơ
sở
của
topo
τ
1
và
ký
hiệu
S
x
=
{G
∈
S
1
|
x
∈G}.
Topo
τ
1
đượcgọi
là
cảm
sinh
từ
quan
hệ
hai
ngôi
R.
b.
Không
gian
topo
được
xây
dựng
từ
một
họ
phủ
Một
hệ
thống
thông
tin
S
=
(U,
A),
U
là
một
tập
hữu
hạn
khác
rỗng
các
đối
tượng,
A
là
một
tập
hữu
hạn
khác
rỗng
các
thuộc
tính.
Với
mỗi
thuộc
tính
a∈A
xác
định
một
quan
hệ
hai
ngôi
R
a
trên
UxU
như
sau
∀u,v
∈
U,
u
R
a
v
khi
và
chỉ
khi
u(a)∩v(a)
≠
∅
Với
định
nghĩa
này,
R
a
xác
định
một
phủ
C
a
của
U
là
một
topo
cảm
sinh
từ
quan
25