TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
BÁO CÁO NGHIÊN CỨU KHOA HỌC
Tên đề tài:
XÁC ĐỊNH QUAN HỆ MỜ BẰNG MẠNG NƠRON
NHÂN TẠO
Giáo viên hướng dẫn : T.S Nguyễn Tân Ân
Sinh viên thực hiện : Nguyễn Thị Thuý Chinh.
Lớp : C-K54-CNTT.
Hà Nội 4/2008
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
2
PHẦN MỞ ĐẦU
1. Tên đề tài
Xác định quan hệ mờ bằng mạng nơron nhân tạo.
2. Lý do chọn đề tài
Từ 20 năm nay, lý thuyết tập mờ và mạng nơron nhân tạo đã phát triển rất
nhanh và đa dạng. Công nghệ mờ và công nghệ mạng nơron đã cung cấp
những công nghệ mới cho các ngành công nghiệp làm ra nhiều sản phẩm
thông minh, đáp ứng nhu cầu thị trường cần có những bộ điều khiển linh hoạt
hơn. Hệ mờ và mạng nơron được kết hợp với nhau để cùng phát huy những ưu
điểm của chúng. Một trong những dạng kết hợp đó là mạng nơron mờ, nhờ có
nó mà chúng ta đã giải quyết được rất nhiều bài toán khó mà với thuật giải
thông thì không thực hiện được hoặc nếu có thì cũng rất phức tạp và mất nhiều
thời gian.
Với bài toán xác định quan hệ giữa không gian vào và không gian ra dựa
trên các cặp phần tử vào ra đã biết. Cụ thể cho không gian vào
X
, không gian
ra
Y
và các cặp phần tử vào ra
( )
,
x y
đã biết , tức là cho một phần tử
x X
Î
thì
có một phần tử ra tương ứng
y Y
Î
. Yêu cầu bài toán đặt ra là xác định quan
hệ
R
giữa
X
và
Y
. Một trong những phương pháp thường được sử dụng để
giải quyết bài toán trên đó là phương pháp bình phương bé nhất. Để giảm độ
phức tạp và thời gian tính toán trong báo cào này tôi sử dụng một phương
pháp mới đó là dùng mạng nơron nhân tạo. Và quan hệ giữa không gian vào
và ra xác định được không phải là quan hệ bình thường mà là quan hệ mờ.
Bài nghiên cứu gồm những phần sau:
I. Tổng quan lý thuyết tập mờ và quan hệ mờ
Giới thiệu về khái niệm tập mờ, các phép toán trên tập mờ, quan hệ mờ.
II. Giới thiệu về mạng nơron nhân tạo.
Giới thiệu cấu trúc của một nơron, định nghĩa và phân loại mạng nơron,
các thủ học mạng nơron, thuật toán lan truyền ngược.
Báo cáo nghiên cứu khoa học
Sinh viên: Nguyễn Thị Thuý Chinh K54C - CNTT
3
III. Bi toỏn xỏc nh quan h m bng mng nron nhõn to
nh x bi toỏn xỏc nh quan h m lờn mng nron nhõn to, a ra
cỏch hun luyn mng. Cui cựng l demo thut toỏn xỏc nh quan h m
bng mng nron nhõn to.
I. Tng quan lý thuyt tp m v quan h m
1.1 Khỏi nim tp m
Tp m c xem l s m rng trc tip ca tp kinh in. Bõy gi ta
xột khỏi nim hm thuc ca tp kinh in.
nh ngha 1.1
Cho mt tp hp
A
. nh x
{
}
: 0,1
Um đ c nh ngha nh sau:
( )
1 nếu
0 nếu
A
x A
x
x A
m
ỡ
ẻ
ù
ù
=
ớ
ù
ẽ
ù
ợ
(1.1)
c gi l hm thuc ca tp
A
. Tp
A
l tp kinh in,
U
l khụng gian
nn. Nh vy hm thuc ca tp c in ch nhn hai giỏ tr l 0 hoc 1. Giỏ
tr 1 ca hm thuc
( )
A
x
m cũn c gi l giỏ tr ỳng, ngc li 0 l giỏ tr
sai ca
( )
A
x
m . Mt tp
U
luụn cú
( )
1
U
xm
=
, vi mi
x
c gi l khụng gian nn (tp nn).
Mt tp
A
cú dng
{ }
thoả mãn một số tính chất nào đó
A x U x= ẻ
thỡ c gi l cú tp nn
U
, hay c nh ngha trờn tp nn
U
. Vớ d tp
{ }
9 12
A x x= ẻ < <Ơ
cú tp nn l tp cỏc s t nhiờn
Ơ
.
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
4
Hàm thuộc
( )
A
x
m
định nghĩa trên tập
A
, trong khái niệm kinh điển chỉ
có hai giá trị là 1 nếu
x A
Î
hoặc 0 nếu
x A
Ï
. Hình 1.1 mô tả hàm thuộc của
hàm
( )
A
x
m
, trong đó tập
A
được định nghĩa như sau:
{ }
2 6
A x x= Î < <¡
. (1.2)
Hình 1.1. Hàm thuộc
( )
A
x
m của tập kinh điển
A
.
Cách biểu diễn hàm phụ thuộc như vậy không phù hợp với những tập
được mô tả “mờ” như tập
B
gồm các số thực dương nhỏ hơn nhiều so với 6
{ }
6
B x x= Î ¡ =
, (1.3)
có tập nền là
¡
, hoặc tập
C
gồm các số thực gần bằng 3 cũng có tập nền
¡
{ }
3
C x x
= Î »
¡
(1.4)
Tập
B
,
C
như vậy được gọi là các tập mờ.
Lý do là với những định nghĩa “mờ” như vậy chưa đủ để xác định được
một số chẳng hạn như
4,5
x
=
có thuộc
B
hoặc
2,5
x
=
có thuộc
C
hay
không. Nên chúng ta không thể dùng hàm thuộc của tập cổ điển chỉ có hai giá
trị 1 và 0 để định nghĩa tập
B
và
C
trong trường hợp này.
Vì vậy người ta nghĩ rằng: tại sao lại không mở rộng miền giá trị cho
hàm thuộc của tập cổ điển, tức là hàm thuộc sẽ có nhiều hơn hai giá trị. Khi
đó thay vì việc trả lời câu hỏi
4,5
x
=
có thuộc
B
hay không, ngưòi ta sẽ trả
lời câu hỏi là: vậy thì
4,5
x
=
thuộc
B
bao nhiêu phần trăm? Giả sử rằng có
2
x
6
0
)(x
A
1
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
5
câu trả lời thì lúc này hàm thuộc
( )
B
x
m tại điểm
4,5
x
=
phải có một giá trị
trong đoạn
[
]
0,1
, tức là
( )
0 1
B
xm
£ £
(1.5)
Nói cách khác hàm
( )
B
x
m không còn là hàm hai giá trị như đối với tập
kinh điển nữa mà là một ánh xạ (hình 1.2)
[
]
: 0,1
B
Um ® , (1.6)
trong đó
U
là tập nền của tập “mờ”.
Hình 1.2 a, Hàm phụ thuộc của tập “mờ”
B
b, Hàm phụ thuộc của tập “mờ”
C
Định nghĩa 1.2
Tập mờ
F
xác định trên tập kinh điển
U
là một tập mà mỗi phần tử của
nó là một cặp các giá trị
( )
(
)
,
F
x x
m
trong đó
x U
Î
và
F
m
là một ánh xạ
[
]
: 0,1
F
Um ® . (1.7)
Ánh xạ
F
m
được gọi là hàm thuộc (hàm phụ thuộc hay hàm thành viên )
của tập mờ
F
. Tập kinh điển
U
được gọi là tập nền (hay tập vũ trụ) của tập
mờ
F
.
Ví dụ một tập mờ
F
của các số tự nhiên nhỏ hơn 6 với hàm phụ thuộc
( )
F
x
m có dạng như hình 1.2a định nghĩa trên nền
U
sẽ chứa các phần tử sau
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
6
( )( )( )( )
{ }
1, 1 , 2, 1 , 3, 0,8 , 4, 0,07
F =
.
Số tự nhiên 1 và 2 có độ phụ thuộc
( ) ( )
1 2 1
F F
m m
= =
,
các số tự nhiên 3 và 4 có độ phụ thuộc nhỏ hơn 1
( )
3 0,8
F
m = và
( )
4 0,07
F
m = ,
Những số tự nhiên không được liệt kê đều có độ phụ thuộc bằng 0.
1.2 Các phép toán về tập mờ
Giống như định nghĩa về tập mờ các phép toán trên tập mờ cũng sẽ được
định nghĩa thông qua các hàm thuộc. Nói cách khác, khái niệm xây dựng
những phép toán trên tập mờ là việc xác định các hàm thuộc cho phép hợp,
giao , bù từ những tập mờ. Một nguyên tắc cơ bản trong việc xây dựng các
phép toán trên tập mờ là không được mâu thuẫn với những phép toán đã có
trong lý thuyết tập hợp kinh điển.
1.2.1 Phép hợp
Cho hai tập hợp mờ
A
và
B
có cùng không gian nền
U
với hai hàm
thuộc tương ứng là
( )
A
x
m và
( )
B
x
m . Hợp của
A
và
B
là một tập mờ cũng
xác định trên
U
, kí hiệu là
A B
È
có hàm thuộc
( )
A B
x
m
È
thoả mãn:
i.
( )
A B
x
m
È
chỉ phụ thuộc vào
( )
A
x
m và
( )
B
x
m .
ii.
( )
0
B
xm
=
với
x
"
Þ
( )
A B
x
m
È
=
( )
A
x
m
.
iii. Tính giao hoán, tức là
( ) (
)
A B B A
x x
m m
È È
= .
iv. Tính kết hợp, tức là
( ) ( )
( ) ( )A B C A B C
x x
m m
È È È È
= .
v. Là hàm không giảm:
( ) ( )
1 2
A A
x x
m m£
Þ
( ) ( )
1 2
A B A B
x x
m m
È È
£ .
Để tính hàm thuộc
( )
A B
x
m
È
có nhiều cách khác nhau, sau đây là một
công thức được dùng trong báo cáo này:
( ) ( ) ( )
{ }
max ,
A B A B
x x x
m m m
È
=
(Luật lấy max) (1.8)
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
7
Hình 1.3. Hàm thuộc của hai tập mờ có cùng không gian nền
a) Hàm thuộc của hai tập mờ
A
và
B
b) Hợp của hai tập mờ
A
và
B
theo luật max.
Một cách tổng quát thì bất cứ một ánh xạ dạng
( ) [
]
: 0,1
A B
x Um
È
®
nếu thoả mãn 5 tiêu chuẩn đã nêu trong định nghĩa hợp hai tập mờ đều được
xem như là hợp của hai tập mờ
A
và
B
có chung một không gian nền
U
.
Công thức trên cũng được mở rộng để áp dụng cho việc xác định hợp của
hai tập mờ không cùng không gian nền, bằng cách đưa cả hai tập mờ về chung
một không gian nền là tích của hai tập nền đã cho.
Ví dụ cho tập mờ
A
xác định trên không gian nền
M
và tập mờ
B
xác
định trên không gian nền
N
. Do hai tập nền
M
và
N
độc lập với nhau nên
hàm thuộc
( )
A
x
m ,
x M
Î
của tập mờ
A
sẽ không phụ thuộc vào
N
và ngược
lại
( )
B
x
m ,
y N
Î
của tập
B
cũng sẽ không phụ thuộc vào
M
. Điều đó thể
hiện ở chỗ trên không gian nền mới là tập tích
M N
´
hàm
( )
A
x
m phải là một
mặt “cong” dọc theo trục
y
và
( )
B
x
m là một mặt “cong” dọc theo trục
x
(hình 1.4). Tập mờ
A
như vậy được định nghĩa trên hai không gian nền
M
và
x
( )
A
x
x
a)
( )
B
x
x
b)
( )
A
x
( )
B
x
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
8
M N
´
. Để phân biệt được chúng, sau đây kí hiệu
A
sẽ được dùng để chỉ tập
mờ
A
trên không gian nền
M N
´
. Đối với các tập mờ khác cũng được kí
hiệu tương tự. Với kí hiệu đó thì
( ) ( )
,
A A
x y x
m m= với mọi
y N
Î
và
( ) ( )
,
B B
x y x
m m=
với mọi
x M
Î
.
a.
Hình 1.4. Phép hợp hai tập mờ không cùng nền
a. Hàm thuộc của hai tập mờ
A
và
B
b. Đưa hai tập mờ về chung một nền
M N
´
c. Hợp hai tập mờ trên nền
M N
´
( )
A
x
x
( )
B
x
y
x
( , )
A
x y
y
M×N
b.
( , )
B
x y
M×N
x
y
M×N
x
( , )
A B
x y
y
c.
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
9
Sau khi đã đưa được hai tập mờ
A
và
B
về chung một không gian nền là
M N
´
thành
A
và
B
thì hàm thuộc
( )
,
A B
x y
m
È
của tập mờ
A B
È
được xác
định theo công thức (1.8).
Hợp hai tập mờ theo luật max
Cho tập mờ
A
xác định trên không gian nền
M
và tập mờ
B
xác định
trên không gian nền
N
, có hàm thuộc lần lượt là
( )
A
x
m ,
( )
B
x
m . Hợp của hai
tập mờ
A
và
B
theo luật max là một tập mờ xác định trên không gian nền
M N
´
với hàm thuộc
( ) ( ) ( )
{
}
, max , , ,
A B A B
x y x y x y
m m m
È
=
. (1.9)
trong đó
( ) ( )
,
A A
x y x
m m= với mọi
y N
Î
và
( ) ( )
,
B B
x y x
m m= với mọi
x M
Î
.
Một cách tổng quát, do hàm thuộc
( )
,
A B
x y
m
È
của hợp hai tập mờ
A
,
B
không cùng không gian nền chỉ phụ thuộc vào
( ) [
]
0,1
A
xm Î và
( ) [
]
0,1
B
xm Î
nên ta có thể xem
( )
,
A B
x y
m
È
là hàm của hai biến
A
m
,
B
m
được định nghĩa như
sau
( ) ( ) [ ] [
]
2
, , : 0,1 0,1
A B A B
x ym m m m
È
= ® (1.10)
Ta đi đến định nghĩa về hàm thuộc
( )
,
A B
m m m
của hợp hai tập mờ không
cùng không gian nền:
Định nghĩa 1.3
Hàm thuộc của hợp giữa hai tập mờ
A
với
( )
A
x
m định nghĩa trên không
gian nền
M
và
B
với
( )
B
x
m định nghĩa trên không gian nền
N
là một hàm
hai biến
( ) [ ] [
]
2
, : 0,1 0,1
A B
m m m ®
xác định trên nền
M N
´
thoả mãn:
a)
0
B
m
= Þ
( )
,
A B A
m m m m
= .
Báo cáo nghiên cứu khoa học
Sinh viên: Nguyễn Thị Thuý Chinh K54C - CNTT
10
b)
( ) ( )
, ,
A B B A
m m m m m m
= , tc l cú tớnh giao hoỏn.
c)
( )
( )
( )
(
)
, , , ,
A B C A B C
m m m m m m m m m m
=
, tc l cú tớnh kt hp.
d)
( ) ( )
, , , ,
A B C D A C B D
m m m m m m m m m m
Ê " Ê Ê , tc l cú tớnh khụng
gim.
Mt hm hai bin
( ) [ ] [
]
2
, : 0,1 0,1
A B
m m m đ tho món cỏc iu kin ca
nh ngha trờn cũn c gi l hm t-i chun (t-conorm).
1.2.2 Phộp giao
Cho hai tp hp m
A
v
B
cú cựng khụng gian nn
U
vi hai hm
thuc tng ng l
( )
A
x
m v
( )
B
x
m . Giao ca
A
v
B
l mt tp m cng
xỏc nh trờn
U
, kớ hiu l
A B
I
cú hm thuc
( )
A B
x
m
I
tho món:
i.
( )
A B
x
m
I
ch ph thuc vo
( )
A
x
m v
( )
B
x
m .
ii.
( )
1
B
xm
=
vi
x
"
ị
( )
A B
x
m
I
=
( )
A
x
m
.
iii. Tớnh giao hoỏn, tc l
( ) ( )
A B B A
x x
m m=
I I
.
iv. Tớnh kt hp, tc l
( ) ( )
( ) ( )A B C A B C
x x
m m=
I I I I
.
v. Nu
1 2
A A
thỡ
1 2
A B A B
ầ ầ
hay
( )
A B
x
m
ẩ
cú tớnh cht khụng
gim, tc l
( ) ( )
1 2
A A
x x
m mÊ
ị
( ) ( )
1 2
A B A B
x x
m m
ầ ầ
Ê .
Tng t nh ó trỡnh by v phộp hp hai tp m, cú nhiu cụng thc
khỏc nhau tớnh hm thuc
( )
A B
x
m
I
ca giao hai tp m v bt c mt ỏnh
x
( ) [
]
: 0,1
A B
x Um đ
I
no tho món 5 tiờu chun ó nờu trong nh ngha trờn u c xem nh l
hm thuc ca giao hai tp m
A
v
B
cú chung mt khụng gian nn
U
. Sau
õy l mt trong nhng cụng thc tớnh hm thuc
( )
A B
x
m
I
ca phộp giao
gm:
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
11
( ) ( ) ( )
{ }
min ,
A B A B
x x x
m m m=
I
(Luật min) (1.11)
Công thức trên cũng áp dụng được cho hợp hai tập mờ không cùng không
gian nền bằng cách đưa cả hai tập mờ về chung một không gian nền là tích của
hai không gian nền đã cho.
Hình 1.5. Phép giao của hai tập mờ
a) Hàm thuộc của hai tập mờ
A
và
B
.
b) Phép giao hai tập mờ cùng không gian nền theo luật min.
c) Phép giao hai tập mờ cùng không gian nền theo luật tích đại số.
d) Phép giao hai tập mờ không cùng khôn gian nền
Giao của hai tập mờ theo luật min
Giao của hai tập mờ
A
với hàm thuộc
( )
A
x
m định nghĩa trên không gian
nền
M
và
B
với hàm thuộc
( )
B
x
m định nghĩa trên không gian nền
N
là một
tập mờ xác định trên không gian nền
M N
´
có hàm thuộc
x
( )
B
x
x
a)
( )
A
x
( )
B
x
x
b)
( )
A
x
M×N
y
( , )
A B
x y
x
d)
c)
( )
B
x
( )
A
x
Báo cáo nghiên cứu khoa học
Sinh viên: Nguyễn Thị Thuý Chinh K54C - CNTT
12
( ) ( ) ( )
{ }
( ) ( )
{
}
, min , min , , ,
A B A B A B
x y x y x y x y
m m m m m
ầ
= =
. (1.12)
Trong ú
( ) ( )
,
A A
x y x
m m= vi mi
y N
ẻ
v
( ) ( )
,
B B
x y x
m m=
vi mi
x M
ẻ
.
Vi vớ d v tp m
A
,
B
cú hm c tớnh nh trong hỡnh 1.5a thỡ tp
giao ca chỳng trờn tp nn chung
M N
s cú hm thuc mụ t nh trong
hỡnh 1.5d.
Trong vớ d trờn ta thy hm thuc
( )
,
A B
x y
m
ầ
ca giao hai tp m
A
,
B
khụng cựng khụng gian nn ch ph thuc vo
( ) [
]
0,1
A
xm ẻ v
( ) [
]
0,1
B
xm ẻ .
Do ú khụng mt tớnh tng quỏt nu ta xem
( )
,
A B
x y
m
ầ
l hm ca hai bin
A
m
,
B
m
c nh ngha nh sau
( ) ( ) [ ] [
]
2
, , : 0,1 0,1
A B A B
x ym m m m
ầ
= đ (1.13)
Ta i n nh ngha v hm thuc
( )
,
A B
m m m
ca hp hai tp m khụng
cựng khụng gian nn nh sau:
nh ngha 1.4
Hm thuc ca hp gia hai tp m
A
vi
( )
A
x
m nh ngha trờn khụng
gian nn
M
v
B
vi
( )
B
x
m nh ngha trờn khụng gian nn
N
l mt hm
hai bin
( ) [ ] [
]
2
, : 0,1 0,1
A B
m m m đ xỏc nh trờn nn
M N
tho món:
e)
1
B
m
= ị
( )
,
A B A
m m m m
= .
f)
( ) ( )
, ,
A B B A
m m m m m m
= , tc l cú tớnh giao hoỏn.
g)
( )
( )
( )
(
)
, , , ,
A B C A B C
m m m m m m m m m m
=
, tc l cú tớnh kt hp.
h)
( ) ( )
, , , ,
A B C D A C B D
m m m m m m m m m m
Ê " Ê Ê , tc l cú tớnh khụng gim.
Báo cáo nghiên cứu khoa học
Sinh viên: Nguyễn Thị Thuý Chinh K54C - CNTT
13
Mt hm hai bin
( ) [ ] [
]
2
, : 0,1 0,1
A B
m m m đ tho món cỏc iu kin ca
nh ngha trờn cũn c gi l hm t- chun (t-norm).
1.2.3 Phộp bự
Cho tp m
A
trờn khụng gian nn
U
. Phộp bự ca
A
l mt tp m
cng xỏc nh trờn khụng gian nn
U
, kớ hiu l
c
A
, nú cú hm thuc tho
món:
i.
( )
c
A
x
m ch ph thuc vo
( )
A
x
m .
ii. Nu
x A
ẻ
thỡ
c
x A
ẽ
, hay
( )
1
A
xm
=
ị
( )
0
c
A
xm
=
iii. Nu
x A
ẽ
thỡ
c
x A
ẻ
, hay
( )
0
A
xm
=
ị
( )
1
c
A
xm
=
iv.Nu
A B
thỡ
c c
A B
ấ , tc l
( ) ( )
1 2
A A
x x
m mÊ
ị
( ) ( )
1 2
A B A B
x x
m m
ẩ ẩ
.
Do hm thuc
( )
c
A
x
m ca
c
A
ch ph thuc vo
( )
A
x
m nờn ta cú th xem
( )
c
A
x
m nh l mt hm ca
( )
A
x
m trong
[
]
0,1
. T ú a ra nh ngha tng
quỏt hn v phộp bự m nh sau:
nh ngha 1.5
Tp bự ca tp m
A
xỏc nh trờn khụng gian nn
U
l mt tp m
c
A
cng xỏc nh trờn khụng gian nn
U
vi hm thuc
[ ] [
]
( ): 0,1 0,1
A
m m đ
tho món
i.
(1) 0
m
=
v
(0) 1
m
=
ii,
( ) ( )
A B A B
m m m m m m
Ê ị , tc l hm khụng tng.
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
14
Hình 1.6: Tập bù mạnh
c
A
của tập mờ
A
.
a. Hàm thuộc của tập mờ
A
.
b. Hàm thuộc của tập mờ
c
A
.
1.3. Quan hệ mờ
Định nghĩa 1.6
Cho
X
,
Y
là hai không gian nền.
R
gọi là một quan hệ mờ trên
X
´
Y
nếu
R
là một tập mờ trên
X
´
Y
, tức là có một hàm thuộc
[
]
: 0,1
R
X Ym ´ ® ,
ở đây
( ) ( )
, ,
R
x y R x y
m = là độ thuộc của
( )
,
x y
vào quan hệ
R
.
- Tính bắc cầu
Định nghĩa: Quan hệ mờ R trên
X
´
X
gọi là:
a) Min-chuyển tiếp nếu
( ) ( )
{ }
( )
min , , , , , ,
R x y R y z R x z x y z X
£ " Î
b) Bắc cầu yếu nếu
, ,
x y z X
" Î
có
( ) ( )
, ,
R x y R y x
> và
( ) ( )
, ,
R y z R z y
> thì
( ) ( )
, ,
R x z R z x
> .
c) bắc cầu tham số nếu có một số
0 1
q
< <
sao cho:
Nếu
( ) ( )
, ,
R x y R y x
q> > và
( ) ( )
, ,
R y z R z y
q> > thì
( ) (
)
, ,
R x z R z x
q> >
* Phương trình quan hệ mờ
Phương trình quan hệ mờ lần đầu tiên nghiên cứu bởi GS.Sanchez năm
1976, đóng vai trò quan trọng trong các lĩnh vực phân tích các hệ mờ, thiết kế
a) b)
( )
A
x
x
1
( )
c
A
x
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
15
các bộ điều khiển mờ, quá trình lấy quyết định và nhận dạng mờ.Dạng đơn
giản nhất có thể diễn đạt như sau:
Cho một hệ mờ biểu diễn dưới dạng một quan hệ mờ nhị nguyên
R
trên
không gian tích
X
´
Y
. Đầu vào (input) của hệ là một tập mờ
A
cho trên
không gian nền input
X
. Tác động của đầu vào
A
với hệ
R
sẽ là phép hợp
thành
A R
o
sẽ cho ở đầu ra (output) một tập mờ trên không gian nền
Y
, kí
hiệu là
B
. Khi ấy ta có
A R B
=
o
.
II. Giới thiệu về mạng nơron nhân tạo
Mạng nơron hay mạng nơron nhân tạo là sự tái tạo bằng kỹ thuật những
chức năng của hệ thần kinh con người. Trong quá trình tái tạo không phải tất
cả các chức năng của bộ não con người có đều được tái tạo, mà chỉ có những
chức năng cần thiết. Bên cạnh đó còn có những chức năng mới được tạo ra
nhằm giải quyết một bài toán điều khiển đã định hướng trước. Trước khi tìm
hiểu về mạng nơron chúng ta giới thiệu sơ lược về mạng nơron sinh học.
2.1. Mạng nơron sinh học
Não người là tổ chức vật chất cấp cao, có cấu tạo vô cùng phức tạp, dày
đặc các mối liên kết giữa các nơron nhưng xử lý thông tin rất linh hoạt trong
môi trường bất định.
Hình 2.1. Mô hình mạng nơron sinh học
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
16
Trong bộ não người có khoảng
11 12
10 - 10
tế bào thần kinh được gọi là
các nơron và mỗi nơron có thể liên kết với
14
10
nơron khác thông qua các
khớp nối thần kinh (synapse). Dưới con mắt của những người làm tin học cấu
tạo của mỗi nơron gồm các thành phần cơ bản sau:
- Thân nơron được giới hạn trong một màng membran và trong cùng là
nhân. Từ thân nơron còn có rất nhiều đường rẽ nhánh tạm gọi là rễ.
- “Bus” liên kết nơron này với các nơron khác được gọi là axon, trên
axon có các đường rẽ nhánh. Nơron còn có thể liên kết với các nơron khác qua
các rễ. Chính vì cách liên kết đa dạng như vậy nên mạng nơron có độ liên kết
rất cao.
Các rễ của noron được chia làm hai loại: loại nhận thông tin từ các
nơron khác qua axon, mà ta sẽ gọi là rễ đầu vào và loại đưa thông tin qua
axon tới các nơron khác, gọi là rễ đầu ra. Một nơron có thể có nhiều rễ đầu
vào, nhưng chỉ có một rễ đầu ra. Bởi vậy nếu coi nơron như một khâu điều
khiển thì nó chính là khâu có nhiều đầu vào, một đầu ra. Một nơron sẽ ở trạng
thái kích thích khi tại đầu vào xuất hiện một tín hiệu tác động vượt quá
ngưỡng cân bằng của nơron.
Một tính chất rất cơ bản của mạng nơron sinh học là các đáp ứng theo
kích thích có khả năng thay đổi theo thời gian. Các đáp ứng có thể tăng lên,
giảm đi hoặc hoàn toàn biến mất. Qua các nhánh axon liên kết tế bào nơron
này với các nơron khác, sự thay đổi trạng thái của một nơron cũng dẫn theo sự
thay đổi trạng thái của những nơron khác và do đó là sự thay đổi của toàn bộ
mạng nơron. Việc thay đổi trạng thái của mạng nơron có thể thực hiện qua
một quá trình “dạy” hoặc do khả năng “học” tự nhiên.
Cấu trúc của mạng nơron luôn luôn phát triển và thay đổi để thích nghi
dần với môi trường, làm cho cấu trúc bộ não ngày càng trở nên phức tạp sau
mỗi lần học. Một số cấu trúc của nơron được xác định trước, một số sau này
mới được hình thành và một số thì bị huỷ bỏ qua quá trình chọn lọc tự nhiên,
học và thích nghi.
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
17
Các nhà khoa học đã và đang xây dựng và phát triển các mô hình xử lý
thông tin mô phỏng hoạt dộng của bộ não người. Đó chính là mô hình mạng
nơron nhân tạo.
2.2. Mạng nơron nhân tạo
2.2.1 Mô hình nơron nhân tạo
Một nơron nhân tạo phản ánh các tính chất cơ bản của nơron sinh
học. Mỗi nơron nhân tạo là một đơn vị xử lí thông tin làm cơ sở cho hoạt
động của một mạng nơron. Nó có chức năng nhận tín hiệu vào, tổng hợp và
xử lý các tín hiệu vào để tính tín hiệu ra. Dưới đây là một mô hình của một
nơron nhân tạo.
Hình 2.2. Mô hình một nơron nhân tạo
Trong đó:
-
i
x
với
1,2, ,
i n
=
: các tín hiệu đầu vào.
-
ij
w
với
1,2, ,
i n
=
: các trọng số tương ứng với đầu vào.
-
j
q
: ngưỡng kích hoạt của nơron
j
.
-
net
: tín hiệu tổng hợp đầu vào.
-
( )
f net
: Hàm kích hoạt.
-
j
y
: tín hiệu ra của nơron
j
.
å
M
1
x
2
x
n
x
j
y
1
j
w
nj
w
2
j
w
j
q
net
j
( )
f net
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
18
Đầu vào của nơron nhân tạo gồm n tín hiệu
i
x
với
1,2, ,
i n
=
. Mỗi tín
hiệu đầu vào tương ứng với một trọng số
ij
w
với
1,2, ,
i n
=
, nó thể hiện mức
độ ảnh hưởng của tín hiệu
i
x
đến nơron
j
.
Một nơron có thể có nhiều đầu vào nhưng chỉ có một tín hiệu đầu ra.
Tín hiệu đầu vào của một nơron có thể là dữ liệu từ bên ngoài mạng, hoặc đầu
ra của một nơron khác, hoặc là đầu ra của chính nó.
Nhằm tăng khả năng thích nghi của mạng nơron trong quá trình học,
người ta sử dụng gán thêm một tham số (Bias) cho mỗi nơron nhân tạo. Tham
số đó còn gọi là trọng số của nơron, ta kí hiệu trọng số của nơron thứ
j
là
j
q
.
Mỗi một nơron trong một mạng kết hợp các giá trị đưa vào nó thông qua
các liên kết với nơron khác, sinh ra một giá trị gọi là
net
. Hàm thực hiện
nhiệm vụ này gọi là hàm kết hợp (combination function), được định nghĩa bởi
một luật lan truyền cụ thể. Trong phần lớn các mạng nơron, chúng ta giả sử
rằng mỗi một nơron cung cấp một bộ cộng như là đầu vào cho đơn vị mà nó
liên kết. Để tính tổng hợp tín hiệu đầu vào
net
, ta giả định
net
là hàm của các
tín hiệu
i
x
và các trọng số
ij
w
.
1 1 2 2
1
n
j j n nj i ij
i
net x w x w x w x w
=
= + + + =
å
. (2.1)
Có nhiều cách để tính tổng tín hiệu vào của nơron, trên dây là cách khá
đơn giản và hữu ích khi chúng ta xây dựng một mạng có nhiều nơron.
Trường hợp
0
ij
w
>
, nơron được coi là đang ở trạng thái kích thích.
Tương tự, nếu như
0
ij
w
<
, nơron ở trạng thái kiềm chế.
Sau khi tổng hợp được tín hiệu đầu vào
net
, sử dụng hàm kích hoạt
f
biến đổi
net
để thu được tín hiệu đầu ra
out
.
( )
j j
y out f net
= = (2.2)
Tóm lại có thể xem nơron là một hàm phi tuyến nhiều đầu vào, một đầu ra.
Hàm kích hoạt phải thoả mãn các điều kiện sau:
- Tín hiệu đầu ra phải không âm với mọi giá trị của
net
.
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
19
- Hàm
f
phải liên tục và bị chặn trong khoảng
[
]
0,1
.
Hàm kích hoạt hay còn được gọi là hàm nén vì chúng nén tín hiệu đầu ra
vào một khoảng nhỏ. Hàm kích hoạt hay được sử dụng là:
1) Hàm đồng nhất (Linear function, Identity function)
( )
f x x
=
(2.3)
Nếu coi các đầu vào là một đơn vị thì chúng ta sẽ sử dụng hàm này. Đôi
khi một hằng số được nhân với
net
để tạo ra một hàm đồng nhất.
Hình 2.3. Hàm đồng nhất
2) Hàm bước nhị phân (Binary step function, Hard limit function)
Hàm này còn được gọi là hàm ngưỡng (Threshold function hay
Heaviside function). Đầu ra của hàm này chỉ giới hạn trong hai giá trị:
( )
1, nÕu x
0, nÕu x<
f x
q
q
ì
³
ï
ï
=
í
ï
ï
î
(2.4)
Dạng hàm này được sử dụng trong các mạng chỉ có một lớp. Trong hình
vẽ sau,
q
được chọn bằng 1.
Hình 2.4. Hàm bước nhị phân
-1 0 1 2 3 4 x
-1
f(x)
0
1
1
-1 1
f(x)
1
x
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
20
3) Hàm sigmoid (Sigmoid function (logsig))
( )
1
1
x
f x
e
-
=
+
(2.5)
Hàm này đặc biệt thuận lợi khi sử dụng cho các mạng được huấn luyện
(trained) bởi thuật toán lan truyền ngược (back-propagation), bởi vì nó dễ lấy
đạo hàm, do đó có thể giảm đáng kể tính toán trong quá trình huấn luyện. Hàm
này được ứng dụng cho các chương trình ứng dụng mà các đẩu ra mong muốn
rơi vào khoảng [0,1].
4) Hàm sigmoid lưỡng cực (Bipolar sigmoid function (tansig))
( )
1
1
x
x
e
f x
e
-
-
-
=
+
(2.6)
Hàm này có các thuộc tính tương tự của hàm sigmoid. Nó làm việc tốt đối
với các ứng dụng có đầu ra yêu cầu trong khoảng [-1,1].
2.2.2 Định nghĩa và phân loại mạng nơron nhân tạo.
2.2.2.1 Định nghĩa
Mạng nơron nhân tạo là sự mô phỏng hoạt động của bộ não con người.
Nó là sự liên giữa các nơron độc lập với nhau. Không có một định nghĩa tổng
quát về mạng nơron, song phần lớn những người làm việc trong lĩnh vực
mạng nơron đều có thể đồng ý với định nghĩa sau: “Mạng nơron là một hệ
thống bao gồm rất nhiều phần tử xử lý đơn giản hoạt động song song. Tính
năng của hệ thống này phụ thuộc vào cấu trúc của hệ thống, cường độ liên kết
giữa các phần tử và quá trình xử lý bên trong các phần tử. Hệ thống này có thể
học số liệu và có khả năng tổng quát hoá từ các số liệu được học”.
Trong định nghĩa trên, các phần tử xử lý được nhắc đến chính là các
nơron.
2.2.2.2 Phân loại
Liên kết các đầu vào và ra của nhiều nơron với nhau ta được một mạng
nơron. Nguyên lý cấu tạo của một mạng nơron bao gồm một hoặc nhiều lớp.
Mỗi lớp bao gồm nhiều nơron có cùng một chức năng trong mạng.
Báo cáo nghiên cứu khoa học
Sinh viên: Nguyễn Thị Thuý Chinh K54C - CNTT
21
Mng nron nhõn to cú th c ch to bng nhiu cỏch khỏc nhau vỡ
vy trong thc t tn ti rt nhiu kiu mng nron nhõn to. Da vo s lp
hay s liờn kt gia cỏc lp trong mng m ngi ta phõn mng nron nhõn
to thnh cỏc nhúm khỏc nhau.
* Phõn loi theo s lp
Phõn loi theo s lp thỡ mng nron nhõn to gm cú hai nhúm: mng
mt lp v mng nhiu lp.
- Mng mt lp
Mng mt lp cu thnh t mt lp mng, nú va l lp vo va l lp
trung gian v cng l lp ra. Mt lp mng bao gm mt nhúm cỏc nron
c t chc theo mt cỏch sao cho tt c chỳng u nhn cựng mt vộc t
u vo x lý cựng thi im. Vic sn sinh ra
net
u vo, bin i thnh
tớn hiu u ra
out
xut hin cựng mt lỳc trong tt c cỏc nron.
Hỡnh 2.5. Mụ hỡnh mng mt lp.
- Mng nhiu lp
Mng nhiu lp c cu thnh t nhiu lp liờn kt vi nhau, bao gm
mt lp vo, lp n v mt lp ra. Trong ú, lp nhn tớn hiu u vo c
gi l lp vo. Cỏc tớn hiu u ra ca mng c sn sinh bi lp ra ca
mng. Cỏc lp nm gia lp vo v lp ra c gi l lp n. Lp n l thnh
phn ni ti ca mng, nú khụng cú bt k tip xỳc no vi mụi trng bờn
ngoi. S lng lp n cú th dao ng t 0 n mt vi lp. Tuy nhiờn thc
t cho thy ch cn mt lp n l mng ó gii quyt c mt lp cỏc
bi toỏn phc tp no.
1
x
2
x
n
x
1
y
2
y
m
y
M
M
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
22
Hình 2.6. Mô hình mạng 3 lớp truyền thẳng.
* Phân loại theo sự liên kết giữa các lớp
Sự liên kết trong mạng nơron tuỳ thuộc vào nguyên lý tương tác giữa
đầu ra của từng nơron riêng biệt với nơron khác và tạo ra cấu trúc mạng
nơron. Về nguyên tắc sẽ có rất nhiều kiểu liên kết giữa các nơron, nhưng chỉ
có một số cấu trúc hay gặp trong ứng dụng sau:
- Mạng truyền thẳng (Feedforward neural networks)
Dòng dữ liệu đầu vào từ các nơron đầu vào đến các nơron đầu ra chỉ
được truyền thẳng. Việc xử lý dữ liệu có thể mở rộng ra nhiều lớp, nhưng
không có các liên kết ngược. Tức là, không có các liên kết từ các đơn vị đầu ra
tới các đơn vị đầu vào trong cùng một lớp hay các lớp trước đó.
Nếu mô hình hoá mạng truyền thẳng bằng một đồ thị, thì nó là một đồ
thị có hướng hữu hạn không chu trình. Trong đó, mỗi nơron là một nút, các
liên liên kết giữa các nơron là các cung của đồ thị. Hình 2.6 là một minh họa
về mạng truyền thẳng nhiều lớp.
- Mạng hồi quy (mạng nối ngược) (Recurrent neural network)
Khác với mạng truyền thẳng, mạng hồi quy có chứa các liên kết ngược.
Mô hình hoá mạng hồi quy bằng một đồ thị thì nó là một đồ thị có hướng hữu
hạn có chu trình. Hình 2.7 minh họa cho một mạng hồi quy.
M
n
x
M
m
y
M
M
2
y
1
y
M
1
x
2
x
lớp
vào
lớp
ẩn
lớp
ra
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
23
Hình 2.7. Mô hình mạng nơron nhiều lớp hồi quy
2.3. Thủ tục học của mạng nơron nhân tạo
Mạng nơron khi mới hình thành chưa có tri thức, để có thể giải quyết một
bài toán cụ thể nào đó thì phải cho mạng nơron học. Mạng nơron học thông
qua quá trình huấn luyện mạng bằng một tập dữ liệu (training data). Tiến trình
điều chỉnh các trọng số để mạng “nhận biết ” được mối quan hệ giữa đầu vào
và đích mong muốn được gọi là học (learning) hay huấn luyện (training) . Rất
nhiều thuật toán học đã được phát minh để tìm ra tập trọng số tối ưu làm giải
pháp cho bài toán.
Các nhân tố quyết định tới khả năng của một mạng nơron gồm: cấu trúc
của mạng (số lớp, số nơron trên một lớp, và cách mà các lớp được liên kết với
nhau) và các trọng số của các liên kết bên trong mạng. Dựa vào điều này,
người ta phân các thuật toán học của mạng nơron thành hai nhóm chính: học
cấu trúc và học tham số.
2.3.1 Học tham số
Học tham số quan tâm đến chiến lược hiệu chỉnh các trọng số của các
nơron trong mạng.
Giả sử có
n
nơron, mỗi nơron có
m
trọng số. Chúng ta có thể kết hợp
được lại tạo thành ma trận dạng sau:
M
n
x
M
m
y
M
M
2
y
1
y
M
1
x
2
x
Báo cáo nghiên cứu khoa học
Sinh viên: Nguyễn Thị Thuý Chinh K54C - CNTT
24
11 12 1
21 22 2
1 2
n
n
m m mn
w w w
w w w
W
w w w
ộ ự
ờ ỳ
ờ ỳ
ờ ỳ
=
ờ ỳ
ờ ỳ
ờ ỳ
ở ỷ
K
K
M M K M
K
(2.7)
Trong ú,
ij
w
l trng s liờn kt t nron
i
n nron
j
.
Cỏc th hc tham s nhm tỡm kim ma trn trng sú
W
sao cho mng
cú kh nng a ra cỏc d bỏo sỏt vi thc t. Cỏc th hc cú tham s cú th
c chia thnh ba lp nh hn: hc cú ch o (hc cú thy), hc tng cng,
hc khụng ch o (hc khụng cú thy hay hc t t chc).
- Hc cú ch o
Hỡnh 2.8. S hc cú ch o
Mi ln vộc t tớn hiu vo
X
c cp cho mng, ta cng cp luụn cho
mng vộc t u ra mong mun
Y
. Mng phi sn sinh ra tớn hiu u ra
out
sao cho nú gn vi
Y
nht. C th, nu ta cp mt tp ngu nhiờn
( )
,
i i
M X Y
=
. Khi vộc t
i
X
i vo mng, vộc t u ra
i
Y
cng c cung cp.
(Hỡnh 2.8) lch tớn hiu gia u ra
i
out
v vộc t u ra
i
Y
s c b sn
sinh sai s thu nhn v sn sinh ra tớn hiu sai s. Tớn hiu sai s ny s i vo
mng v mng s hiu chnh cỏc trng s ca mỡnh sao cho tớn hiu u ra
i
out
s gn vi vộc t u ra mong mun
i
Y
.
Nu tớn hiu ra
out
=
Y
thỡ lỳc ú mng nron ó bóo ho, ta núi th tc
hc ca mng ó hi t.
- Hc tng cng
Mng nron
Sn sinh
sai s
Vộc t vo Tớn hiu ra out
B¸o c¸o nghiªn cøu khoa häc
Sinh viªn: NguyÔn ThÞ Thuý Chinh – K54C - CNTT
25
Hình 2.9. Sơ đồ học tăng cường.
Học tăng cường cũng là một dạng của học có chỉ đạo vì mạng nơron vẫn
nhận tín hiệu ngoài môi trường. Tuy nhiên, tín hiệu ngoài môi trường chỉ là
những tín hiệu mang tính phê phán, chứ không phải là các chỉ dẫn cụ thể như
trong học có chỉ đạo. Nghĩa là, tín hiệu tăng cường chỉ có thể nói cho mạng
biết tín hiệu vừa sản sinh là đúng hay sai, chứ không chỉ cho mạng biết tín
hiệu đúng phải như thế nào. Tín hiệu tăng cường được xử lý bởi bộ xử lý tín
hiệu tăng cường (Hình 2.9), nhằm mục đích giúp mạng hiệu chỉnh các trọng
số với hi vọng nhận được tín hiệu tăng cường tốt hơn trong tương lai. Các thủ
tục học tăng cường thường được biết đến như các thủ tục học với nhà phê bình
chứ không phải là học với thầy như các thủ tục học có chỉ đạo.
- Học không chỉ đạo
Hình 2.10. Sơ đồ học không chỉ đạo.
Trong thủ tục này, không có thông tin nào từ ngoài môi trường chỉ ra tín
hiệu đầu ra
out
phải như thế nào hoặc đúng hay sai. Mạng nơron phải tự
khám phá các đặc điểm, các mối quan hệ đang quan tâm như: dạng đưòng nét,
có chuẩn – có bình thường hay không, các hệ số tương quan, tính cân xứng,
Mạng nơron
Véc tơ vào Tín hiệu ra out
Mạng nơron
Sản sinh tín hiệu
tăng cường
Véc tơ vào Tín hiệu ra out
Tín hiệu
tăng cường