Mạng nơron nhân tạo

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.7 MB, 78 trang )

MỤC LỤC
LỜI NÓI ĐẦU ..............................................................................................................3
CHƯƠNG I...................................................................................................................5
TỔNG QUAN VỀ LOGIC MỜ VÀ MẠNG NƠRON NHÂN TẠO ..............................5
1.1 LOGIC MỜ .........................................................................................................5
1.1.1 Quá trình phát triển .......................................................................................5
1.1.2 Khái niệm về tập mờ .....................................................................................5
1.1.3 Các phép toán trên tập mờ.............................................................................6
1.1.4 Biến ngôn ngữ.............................................................................................10
1.1.5 Luật mờ if – then.........................................................................................11
1.1.6 Suy diễn mờ................................................................................................12
1.1.7 Giải mờ.......................................................................................................13
1.2 Mạng Nơron Nhân Tạo ......................................................................................17
1.2.1 Mạng Nơron Nhân Tạo Và Một Số Khái Niệm ...........................................17
1.2.1.1 Mô hình Nơron sinh học.......................................................................17
1.2.1.2 Mô hình mạng Nơron nhân tạo .............................................................18
1.2.1.3 Mạng Nơron nhân tạo...........................................................................20
1.2.2 Phương pháp học của mạng nơron nhân tạo ................................................23
1.2.2.1 Định nghĩa học.....................................................................................23
1.2.2.2 Tiến trình học.......................................................................................24
CHƯƠNG II................................................................................................................28
HỆ SUY DIỄN MỜ VÀ ANFIS ..................................................................................28
2.1 Hệ suy diễn mờ (fuzzy inference system)...........................................................28
2.1.1 Hệ suy diễn mờ Mamdani ...........................................................................30
2.1.2 Hệ suy diễn mờ Tsukamoto.........................................................................31
2.1.3 Hệ suy diễn mờ Takagi-Sugeno...................................................................32
2.2 Mạng thích nghi.................................................................................................34
2.2.1 Kiến trúc mạng thích nghi và luật học cơ sở ................................................34
2.2.2 Luật học lai - Học gián tiếp (Off - line learning)..........................................37
2.2.3 Luật học lai - học trực tiếp (On - Line learning) ..........................................39
2.3 Mạng ANFIS (Adaptive Network based Fuzzy Inference System) .....................40

2.3.1 Kiến trúc hệ suy diễn mờ dựa trên mạng thích nghi .....................................40
2.3.2 Thuật toán học lai (Hybrid Learning Algorithm) .........................................43

1

2.3.3 Xác định tham số học thích nghi .................................................................45
CHƯƠNG III ..............................................................................................................47
BÀI TOÁN PHÂN LỚP DỮ LIỆU VÀ ỨNG DỤNG .................................................47
3.1 Phân lớp dữ liệu.................................................................................................47
3.1.1 Phân lớp bằng phương pháp quy nạp cây quyết định ...................................48
3.1.2 Phương pháp phân lớp Bayesian .................................................................50
3.1.3 Phân lớp bằng mạng lan truyền ngược.........................................................52
3.2 Bài Toán Ứng Dụng...........................................................................................53
3.2.1 Giới Thiệu Về ANFIS Editor ......................................................................53
3.2.1.1 Mô hình học và suy diễn Mờ thông qua ANFIS....................................54
3.2.1.2 Xác nhận dữ liệu huấn luyện ................................................................55
3.2.2 Sử dụng bộ soạn thảo ANFIS GUI ..............................................................57
3.2.3 Nhận Xét.....................................................................................................65
KẾT LUẬN.................................................................................................................68
TÀI LIỆU THAM KHẢO ...........................................................................................69
PHỤ LỤC ...................................................................................................................70

2

LỜI NÓI ĐẦU
Trong giai đoạn hiện nay, con người đã đạt được nhiều thành tựu khoa học
rực rỡ. Một trong những thành tựu đó là sự phát triển không ngừng của nghành
khoa học máy tính. Nó đã tạo ra được rất nhiều ứng dụng hữu ích cho nhân loại.

Tuy nhiên, như chúng ta đã biết tri thức của loài người cho đến nay hết sức
là phong phú và đa dạng. Nó bao gồm những hiểu biết của chúng ta về thế giới vĩ
mô như nguyên tử, hạt nhân…, cho đến những hiểu biết về trái đất, về thiên hà và
những nghành khoa học, kỹ thuật khác nhau. Mặt khác, ngày nay công nghệ
thông tin đã có ảnh hưởng rất lớn trên mọi lĩnh vực của đời sống con người. Nó
phục vụ con người từ việc giải trí, kinh doanh, thông tin liên lạc... cho đến những
việc phức tạp trong khoa học kỹ thuật. Thế nhưng có một điều, mặc dù máy tính
hiện nay tuy có rất nhiều ưu việt về trí “thông minh”, nhưng so với con người
chúng ta thì nó vẫn còn thua xa. Hơn nữa do nhu cầu ngày càng cao trong việc
giải quyết những vấn đề phức tạp và do bản chất của con người không muốn
bằng lòng với hiện tại mà muốn vươn tới những gì hoàn thiện hơn. Chính vì
những điều trên mà thuật ngữ “mạng nơron” hay “mạng nơron nhân tạo” được ra
đời. Các thuật ngữ trên nói tới một một nghành kỹ thuật mới mà nó đòi hỏi kiến
thức từ nhiều nghành khoa học khác nhau toán học, vật lý học, sinh học, tâm lý
học và thần kinh học…tất cả chỉ nhằm tạo ra những chiếc máy tính hoạt động
giống như bộ não của chúng ta.
Nhiều hơn thế, trong cuộc sống thường ngày chúng ta gặp nhiều những sản
phẩm tích hợp những hệ thống thông minh như máy giặt, điều hòa nhiệt độ, bình
nóng lạnh…Hệ thống thông minh đó được xậy dựng dựa trên logic mờ (fuzzy
logic) hay hệ suy mờ (fuzzy inferent system).
Trong những ví dụ nêu trên thì logic mờ và mạng nơron được nghiên cứu và
ứng dụng một cách độc lập với nhau. Sau một thời gian tìm hiểu và ngiên cứu,
các nhà khoa học nhận thấy rằng trong logic mờ có những khuyết điểm mà mạng
nơron nhân tạo có thể khắc phục được, và ngược lại. Chính điều này đã giúp
chúng ta có suy nghĩ là kết hợp mạng nơron và logic mờ với nhau, và qua đó tạo
ra được nhiều sản phẩm có ứng dụng quan trọng trong cuộc sống như ứng dụng

3

trong thị trường chứng khoán, ứng dụng trong y học, ứng dụng trong dự báo thời
tiết…
Đồ án này được thực hiện với mục đích đi tìm hiểu những khái niệm về
mạng nơron nhân tạo và logic mờ, và đồng thời tìm hiểu về sự kết hợp giữa
chúng với nhau cụ thể là xậy dựng hệ suy diễn mờ dựa trên cơ sở mạng thích
nghi, qua đó đưa ra một ứng dụng trong bài toán phân lớp dữ liệu. Đó là một
trong những bài toán đang được ứng dụng trong nhiều lĩnh vực trong cuộc sống
hiện nay. Với tấm lòng biết ơn sâu sắc, em xin chân thành cảm ơn cô giáo
Nguyễn Thị Tuyển là người đã trực tiếp tận tình hướng dẫn em hoàn thành đồ án
này.
Do trình độ hiểu biết còn hạn chế, thời gian chuẩn bị không nhiều, đồ án
này còn nhiều sai sót và chưa thật đầy đủ, em rất mong nhận được sự góp ý của
thầy, cô và các bạn.
Thái Nguyên 06/2009

4

CHƯƠNG I
TỔNG QUAN VỀ LOGIC MỜ VÀ MẠNG NƠRON NHÂN TẠO
1.1 LOGIC MỜ
1.1.1 Quá trình phát triển
Từ năm 1965 đã ra đời một lý thuyết mới đó là lý thuyết tập mờ (Fuzzy set
theory) do giáo sư Lofti A. Zadeh ở trường đại học Califonia - Mỹ đưa ra. Từ khi
lý thuyết đó ra đời nó được phát triển mạnh mẽ qua các công trình khoa học của
các nhà khoa học như: năm 1972 GS Terano và Asai thiết lập ra cơ sở nghiên cứu
hệ thống điều khiển mờ ở Nhật, năm 1980 hãng Smith Co. bắt đầu nghiên cứu
điều khiển mờ cho lò hơi…Những năm đầu thập kỷ 90 cho đến nay hệ thống điều
khiển mờ (Fuzzy system) được các nhà khoa học, các kỹ sư và sinh viên trong
mọi lĩnh vực khoa học kỹ thuật đặc biệt quan tâm và ứng dụng trong sản xuất và

đời sống. Tập mờ và logic mờ đã dựa trên các thông tin “không đầy đủ” về đối
tượng để điều khiển đầy đủ về đối tượng một cách chính xác.

1.1.2 Khái niệm về tập mờ
a. Khái niệm về tập hợp
Tập hợp có thể coi là sự xếp đặt chung lại các vật, các đối tượng có cùng
chung một tính chất. Các vật, các đối tượng đó được gọi là phần tử của tập hợp.
Cho một tập hợp A. Một phần tử x thuộc tập A được ký hiệu x  A , ngược
lại ký hiệu x  A để chỉ x không thuộc A. Một tập hợp không có phần tử nào
được gọi là tập rỗng, được ký hiệu  .
b. Khái niệm về tập mờ
Cơ sở của logic mờ là việc ánh xạ từ các biến x đầu vào thuộc tập A thành
các biến y đầu ra thuộc tập B.
Nói cách khác, giá trị x = a không được xác định rõ là có thuộc hay không
thuộc tập B, và khái niệm mờ được đưa ra để làm nền tảng cho logic mờ và điều
khiển mờ sau này.
Trước tiên ta xem xét sự khác nhau giữa tập mờ và tập kinh điển thông qua
khái niệm hàm liên thuộc. Hàm liên thuộc  A của tập hợp kinh điển chỉ có hai

5

giá trị chính xác là 0 với 1, do vậy nếu ta đã biết tập hợp A thì cũng xác định
được hàm liên thuộc  A (x) của nó và ngược lại. Trong logic mờ, vấn đề này lại
khác, hàm liên thuộc của tập mờ không chỉ nhận hai giá trị 0, 1 mà là toàn bộ các
giá trị từ 0 tới 1 tức là 0   B ( x)  1 . Như vậy, ở logic mờ không có sự suy luận
thuận ngược như với tập hợp kinh điển. Vì vậy trong định nghĩa tập mờ phải nêu
thêm về hàm liên thuộc này do vai trò của nó là làm rõ ra chính tập mờ đó.
Định nghĩa tập mờ: Tập mờ A được xác định trên tập kinh điển M là một
tập mà mỗi phần tử của nó là một cặp các giá trị A  x,  A ( x) trong đó x  M ,

0   A ( x)  1 .

Ánh xạ  A : M  0,1 được gọi là hàm liên thuộc của tập mờ A.
Tập kinh điển M được gọi là cơ sở của tập mờ A.

1.1.3 Các phép toán trên tập mờ
Tương tự như các tập kinh điển, các phép toán cơ bản trên tập mờ là phép
hợp, phép giao và phép phủ định cũng được định nghĩa thông qua hàm liên thuộc.
a. Phép hợp hai tập mờ
Phép hợp hay toán tử logic OR thông thường cần thỏa mãn các tiên đề sau:
 v(P1 or P2) chỉ phụ thuộc vào v(P1) và v(P2)
 Nếu v(P 1)=0 thì v(P1 or P2) = v(P2) với mọi mệnh đề P 2
 Giao hoán: v(P1 or P2) = v(P2 or P1)
 Nếu v(P 1)  v(P2) thì v(P1 or P3)  v(P2 or P3) với bất kỳ P3 nào
 Kết hợp: v(P1 or (P2 or P3)) = v(P1 or P2 ) or P3)
Phép toán kết hợp tập mờ được xác định khái quát bằng một ánh xạ nhị
phân S.

 AB  S  A ( x),  B ( x)

(1.1)

Phép hợp của hai tập mờ được thể hiện trên hình (1.1)

6

Hình 1.1: Phép hợp của hai tập mờ

Những toán hạng kết hợp mờ này thường được coi như những toán hạng

không tiêu chuẩn T (hoặc tiêu chuẩn S), chúng phải thỏa mãn những yêu cầu cơ
bản sau:
Toán hạng không tiêu chuẩn T (hoặc tiêu chuẩn S) là một ánh xạ bậc hai
S(.) thỏa mãn:
 Đường biên: S(1,1) = 1; S(a,0) = S(0,a) = a
 Đơn điệu:

S(a,b)  S(c,d) nếu a  c và b  d

 Giao hoán: S(a,b) = S(b,a)
 Kết hợp:

S(a, S(b,c)) = S(S(a,b),c)

Trên cơ sở đó, người ta thường sử dụng một số phép toán thỏa mãn chuẩn S
như sau:
 Max (Zadeh 1965): S(x,y) = max(x,y)
 Dạng tích:

S(x,y) = x + y – xy

 Chuẩn Lukasiewicz: T(x,y) = min{x + y, 1}
 Min nilpotent:

max( x, y ) x  y  1
S ( x, y )  
x  y 1
1

 S chuẩn yếu nhất:

max( x, y )
Z ( x, y )  
1

min( x, y )  0
min( x, y )  0

b. Phép giao của hai tập mờ
Phép giao cũng là một trong những phép toán cơ bản nhất. Nó cũng là cơ sở
để định nghĩa phép giao của hai tập mờ. Chúng ta cần xem xét các tiên đề sau:

7

 v(P1 or P2) chỉ phụ thuộc vào v(P1) và v(P2)
 Nếu v(P 1)=0 thì v(P1 and P2) = v(P2) với mọi mệnh đề P2
 Giao hoán: v(P1 and P2) = v(P2 and P1)
 Nếu v(P 1)  v(P2) thì v(P1 and P3)  v(P2 and P3) với bất kỳ P3 nào
 Kết hợp: v(P1 and (P2 and P3)) = v(P1 and P2 ) and P3)
Điểm giao nhau của hai tập mờ A và B được xác định tổng quát bởi một ánh
xạ nhị phân T, tập hợp của hai hàm liên thuộc được biểu diễn như sau:

 AB  T  A ( x),  B ( x)

(1.2)

Hình 1.2 biểu diễn phép giao của hai tập mờ

Hình 1.2: Phép giao của hai tập mờ

Điểm giao nhau của những phép toán mờ thường được coi như những phép
toán tiêu chuẩn T (tiêu chuẩn tam giác), ta có những yêu cầu cơ bản sau:
Toán hạng chuẩn T là một ánh xạ bậc hai T(.) thỏa mãn:
 Đường biên: T(0,0) = 0; S(a,1) = S(1,a) = a
 Đơn điệu:

T(a,b)  T(c,d) nếu a  c và b  d

 Giao hoán: T(a,b) = T(b,a)
 Kết hợp:

T(a, T(b,c)) = T(T(a,b),c

Yêu cầu đầu tiên tác động một cách khái quát tới những tập xoắn. Yêu cầu
thứ hai làm giảm những giá trị liên thuộc trong A hoặc B, không thể đưa ra kết
quả làm tăng giá trị liên thuộc ở điểm giao A, B. Yêu cầu thứ ba chỉ ra rằng thứ
tự của toán hạng bên trong tập mờ là không khác nhau. Cuối cung, yêu cầu thứ tư

8

cho phép chúng ta đưa ra điểm giao nhau của bất kỳ phần tử nào của tập ở bên
trong thứ tự của từng cặp.
Trên cơ sở đó, người ta thường sử dụng một số phép toán giao thỏa mãn
chuẩn T-norm như sau:
 Max (Zadeh 1965): T(x,y) = min(x,y)
 Dạng tích:

T(x,y) = xy

 Chuẩn Lukasiewicz: T(x,y) = max{x + y – 1, 0}
 Min nilpotent:

min( x, y) x  y  1
T ( x, y )  
x  y 1
0

 S chuẩn yếu nhất:

min( x, y )
Z ( x, y )  
0

max( x, y )  1
max( x, y)  1

c. Phép phủ định
Phủ định (Negation) là một trong các phép toán logic cơ bản. Để suy rộng
chúng ta cần tới toán tử N gọi là toán tử phủ định mờ. Toán tử này thỏa mãn điều
kiện sau: Hàm N: [0, 1]  [0, 1] không tăng được gọi là hàm phủ định mờ. Toán
tử này thỏa mãn điều kiện sau:
 Điều kiện biên: N(0) = 1 và N(1) = 0
 Đơn điệu:

N(A)  N(B) nếu A  B

Chúng ta có một số tiên đề:
Hàm phủ định N(A) là phủ định chặt nếu nó là hàm liên tục và giảm chặt.

Hàm phủ định là mạnh nếu nó chặt và thỏa mãn N(N(A))=A
Trên cơ sở đó, người ta thường sử dụng một số phép toán phủ định như sau:
 Zadeh:

N(x) = 1 – x

 Sugeno:

N S ( x) 

 Yager:

N

W

1 x
1  sx

( x)  (1  x

9

W 1/ W

)

d. Phép bù của một tập mờ
Bù của một tập mờ A có cơ sở M và hàm liên thuộc  A (x) là một tập mờ Ac

xác đinh trên cùng cơ sở M với hàm liên thuộc:

 AC ( x)  1   A ( x )

(1.3)

Phép bù của tập mờ được thể hiện trên (hình 1.3)

Hình 1.3: Phép bù của tập mờ

ngữ của các biến điều khiển như: vận tốc, nhiệt độ, vị trí…biến ngôn ngữ
cũng có các giá trị ngôn ngữ như: rất chậm, chậm, trung bình, nhanh, rất
nhanh…âm, zero, dương…
Giả sử các biến ngôn ngữ tốc độ được mô tả bằng tập mờ

1.1.4 Biến ngôn ngữ
Một biến ngôn ngữ được đặc trưng bởi tập 5 yếu tố (x, T(x), X, G, M) trong
đó x là tên của biến; T(x) là tập hơp các thuật ngữ của x, nó là các giá trị ngôn
ngữ hay thuật ngữ ngôn ngữ; X là không gian nền; G là luật cú pháp tạo ra các
thuật ngữ trong T(x); và M là luật ngữ nghĩa liên kết mỗi giá trị ngôn ngữ A với
nghĩa M(A) của nó, M(A) xác định một tập mờ trên X.

10

Biến ngôn ngữ là cách thể hiện bằng ngôn

Hình 1.4: Mô tả giá trị ngôn ngữ bằng tập mờ

Biến ngôn ngữ cần thiết trước tiên là cho quá trình mờ hóa (Fuzzifiezs) các

giá trị rõ của đầu vào. Tức là từ giá trị rõ của đầu vào xác định nó thuộc bao
nhiêu phần trăm của các biến ngôn ngữ.

1.1.5 Luật mờ if – then
Một luật nếu - thì (if - then) mờ (còn gọi là luật mờ, luật kéo theo mờ hoặc
câu điều kiện mờ) thường có dạng:
Nếu x là A thì y là B
Trong đó A, B là các giá trị ngôn ngữ được xác định bởi các tập mờ trong
không gian nền X và Y. Thông thường “x là A” được gọi là tiên đề hay giả
thuyết, còn “y là B” được gọi là kết quả hay kết luận. Các ví dụ của luật nếu - thì
mờ rộng khắp trong các diễn giải ngôn ngữ hàng ngày như:
Nếu xe đang chạy chậm thì tăng ga lên
Nếu quả cà chua màu đỏ thì nó chín
Nếu đường trơn thì việc lái xe rất nguy hiểm
Luật nếu - thì mờ thường được viết tắt dưới dạng A  B miêu tả quan hệ
giữa hai biến x và y, điều này cho thấy rằng luật nếu – thì mờ xác định một quan
hệ hai ngôi R trên không gian tích X  Y.
Nói chung có hai cách diễn dịch luật mờ A => B. Nếu ta diễn dịch A => B
là A kết hợp với B thì:
R  A  B  A B 



A

( x)*  B ( y )dxdy

X Y

11

(1.4)

Trong đó * là phép toán T-norm
Ngược lại, nếu A => B được diễn dịch là A kéo theo B thì phương trình có
thể được viết dưới 4 công thức khác nhau như sau:
R  A B  A  B
R  A  B  A  ( A  B)
R  A  B  (A  B )  B

 r ( x, y)  supc \  A ( x)* c   B ( y ) and 0  c 1

Mặc dù 4 công thức trên có hình thức khác nhau nhưng chúng đều trở về
các dạng quen thuộc R  A B  A  B khi A và B là hai giá trị logic. Dựa trên
hai cách diễn dịch và các phép toán T-chuẩn và S chuẩn, một số phương pháp
hiệu quả được thành lập để tính toán quan hệ mờ R = A  B. Tất cả các phương
pháp này đều sử dụng phép kéo theo.
Phép kéo theo (Implication) là một hàm số I: [0, 1]2  [0, 1] thỏa mãn các
điều kiện sau:
 Nếu x  y thì I ( x, y )  I ( z , y ) với mọi y  0,1
 Nếu y  u thì I ( x, y )  I ( x, u ) với mọi x  0,1
 I(0, x) = 1 với x  0,1
 I(x,1) = 1 với x  0,1
 I(1,0) = 0
Với ba phép toán T chuẩn, S chuẩn và phép phủ định N, ta có thể xây
dựn hai dạng của phép kéo theo như sau:
 Dạng kéo theo thứ nhất:

IS1(x,y) = S(n(x),y)

 Dạng kéo theo thứ hai:

IS2 = S(T(x,y),n(x))

1.1.6 Suy diễn mờ
Suy diễn mờ, còn được gọi là suy diễn xấp xỉ là một thuật toán suy luận
nhằm thu được kết luận từ một tập các luật nếu - thì mờ được coi như chân lý.
Luật cơ bản của phép suy luận truyền thông với hai giá trị logic là modus ponens,

12

từ luật này ta có thể suy luận ra mệnh đề B từ mệnh đề A và phép kéo theo R = A
 B. Có thể minh họa luật modus ponens:

Giả thiết 1 (sự kiện): x là A
Giả thiết 2 (luật):

Nếu x là A thì y là B

Suy diễn (kết luận): y là B
Tuy nhiên, trong suy diễn của con người, luật modus ponens được sử dụng
theo cách thức xấp xỉ điều này được minh họa như sau:
Giả thiết 1 (sự kiện): x là A’
Giả thiết 2 (luật):

Nếu x là A thì y là B

Suy diễn (kết luận):

y là B’

Trong đó A’ gần với A và B’ gần với B. Khi A, B, A’, B’ là các tập mờ trên
các không gian nền tương ứng thì thuật toán trên được gọi là suy luận xấp xỉ hay
suy diễn mờ. Sử dụng luật hợp thành mờ đã nêu ở trên ta có thể thành lập thuật
toán suy diễn mờ như sau:
Gọi A, A’ và B là các tập mờ trên không gian X, X và Y. Giả thiết phép kéo
theo mờ A  B được diễn giải như một quan hệ mờ trên không gian XxY thì tập
mờ B suy ra từ “x là A” và luật mờ “nếu x là A thì y là B” được xác định bởi:
 B ( y )  max min[  A ( x),  B ( x, y )]   x [  A ( x) B ( x, y )]

(1.5)

hay tương đương:
B'  A'R  A' ( A  B)

(1.6)

Các trường hợp có thể có của phép suy diễn mờ bao gồm:
- Suy diễn một luật với một tiên đề
- Suy diễn một luật với nhiều tiên đề
- Suy diễn nhiều luật với nhiều tiên đề

1.1.7 Giải mờ
Giải mờ là quá trình xác định một giá trị rõ y’ nào đó có thể chấp nhận được
từ hàm liên thuộc của giá trị mờ B’. Có hai phương pháp giải mờ chính đó là
phương pháp cực đại và phương pháp điểm trọng tâm.

13

a. Phương pháp cực đại
Tư tưởng chính của phương pháp giải mờ điểm cực đại là tìm trong tập mờ
có hàm thuộc  R ( y ) một phần tử rõ yo với độ phụ thuộc lớn nhất (có xác suất
thuộc tập mờ lớn nhất trong số những phần tử còn lại), tức là:
y0  arg max  R ( y )
y

(1.7)

Tuy nhiên, do việc tìm y0 theo (2.7) có thể đưa đến vô số nghiệm, nên ta
phải đưa thêm những yêu cầu cho phép chọn trong số các nghiệm đó một giá trị
y0 cụ thể chấp nhận được. Như vậy, việc giải mờ theo phương pháp điểm cực đại
sẽ gồm hai bước:
- Xác định miền chứa giá trị rõ y0. Giá trị rõ y0 là giá trị mà tại đó hàm
thuộc đạt giá trị cực đại (bằng độ thỏa mãn đầu vào H), tức là miền
G  y  Y |  R ( y )  H 

(1.8)

- Xác định y0 có thể chấp nhận được từ G.
Trong ví dụ ở hình 2.5 thì G là khoảng [y1, y2] của tập nền R.

Hình 1.5: Giải mờ bằng phương pháp cực đại
Trong trường hợp có vô số nghiệm của (2.7) thì để tìm y0 ta có hai cách:
1, Xác định điểm trung bình:
y0 

y1  y 2

2

(1.9)

Nếu các hàm thuộc đều có dạng tam giác hoặc hình thang thì điểm y0 xác
định theo phương pháp này sẽ không bị quá nhạy cảm với sự thay đổi của giá trị
rõ đầu vào x0 do đó rất thích hợp với các bài toán có nhiễu biên độ nhỏ tại đầu
vào.

14

2, Xác định điểm cận trái hoặc phải:
y1  inf( y )

hoặc

y2  sup( y )

yG

(1.10)

yG

Theo phương pháp giải mờ này và nếu các hàm thuộc đều có dạng tam giác
hoặc hình thang thì điểm y0 sẽ phụ thuộc tuyến tính (trong một lân cận) vào giá
trị rõ x0 tại đầu vào.

b. Phương pháp điểm trọng tâm

Phương pháp điểm trọng tâm sẽ cho ra y0 là hoành độ của điểm trọng tâm
miền được bao bởi trục hoành và đường  R ( y ) (hình 1.6)

 y
y0 

R

( y)dy

S

  R ( y )dy

(1.11)

S

Với S  sup p R ( y )  y |  R ( y )  0 là miền xác định của tập mờ R.
Đây là phương pháp ưa được sử dụng nhất. Nó cho phép ta xác định giá trị
y0 với sự tham gia của tất cả các tập mờ đầu ra của luật điều khiển một cách bình
đẳng và chính xác. Tuy nhiên phương pháp này lại không để ý được tới độ thỏa
mãn của mệnh đề điều khiển cũng như thời gian tính lâu. Ngoài ra một trong
những nhược điểm cơ bản của phương pháp điểm trọng tâm là có thể giá trị y0
xác định được lại có độ thuộc nhỏ nhất, thậm chí bằng 0 (hình 1.6 bên phải là
một ví dụ minh họa).

Hình 1.6: Giải mờ bằng phương pháp điểm trọng tâm
Phương pháp điểm trọng tâm trong một số trường hợp đặc biệt có dạng biến
thể là trường hợp luật hợp thành SUM – MIN và một biến thể thành phương pháp

độ cao.

15

Phương pháp điểm trọng tâm cho thiết bị hợp thành SUM – MIN
Giả sử có q luật điều khiển. Như vậy, mỗi giá trị mờ đầu ra của bộ điều
khiển sẽ là tổng của q giá trị đầu ra của từng luật hợp thành (tổng hợp theo SUM).
Ký hiệu các giá trị mờ đầu ra của luật điều khiển thứ k là  R ( y ) với k = 1, 2,…q
k

Thì với quy tắc SUM – MIN thì hàm liên thuộc đầu ra sẽ là:
q

 R ( y )    Rk ( y )

(1.12)

k 1

Thay (1.12) vào (1.11) sau đó đổi chỗ của tổng và tích phân cho nhau(hoàn
toàn có nghĩa vì tổng và tích phân đều hội tụ) thì công thức tính y0 sẽ được đơn
giản như sau:
 q

 Rk ( y ) dy
S  y 
k 1
 
y0 

q
   Rk ( y )dy
S k 1

q




( y )dy 
k 1  S

q


   R ( y)dy 

k


k 1  S


   y

Rk

q

M

k

k 1
q

(1.13)

A

k

k 1

Trong đó
M k   y Rk ( y )dy

và

S

Ak   y Rk ( y )dy ,

k = 1, 2,…q

S

Phương pháp độ cao
Đặc biệt hơn nữa ở phương pháp điểm trọng tâm, là nếu các hàm thuộc của
tập mờ đầu ra lại có dạng singleton với

1 nêu y  y k
 Bk ( y)  
0 nêu y  yk

Thì do
 H nêu y  y k
 Rk ( y )   k
0 nêu y  yk

Ta sẽ có
q

y
y0 

k

Hk

k 1
q

H

(1.14)
k

k 1

16

Công thức (1.14) có tên gọi là công thức tính xấp xỉ y0 theo phương pháp độ
cao và nó cũng thường được sử dụng không chỉ riêng khi tính giá trị luật hợp
thành theo quy tắc SUM – MIN, mà còn cả những quy tắc khác như: Max – Min,
Sum – Prod, Max – Prod…

1.2 Mạng Nơron Nhân Tạo
1.2.1 Mạng Nơron Nhân Tạo Và Một Số Khái Niệm
Mạng nơron nhân tạo là mô phỏng xử lý thông tin, được nghiên cứu ra từ hệ
thống thần kinh của sinh vật, giống như bộ não để xử lý thông tin. Nó bao gồm
số lượng lớn các mối gắn kết cấp cao để xử lý các yếu tố làm việc trong mối liên
hệ giải quyết vấn đề rõ ràng. Mạng nơron nhân tạo giống như con người, được
học bởi kinh nghiệm, lưu những kinh nghiệm hiểu biết và sử dụng trong những
tình huống phù hợp. Để có cái nhìn tổng quát về mạng nơron nhân tạo, trước hết
chúng ta tìm hiểu qua về mạng nơron sinh học.

1.2.1.1 Mô hình Nơron sinh học
Các nơron sinh học có nhiều dạng khác nhau như dạng hình tháp ở đại não,
dạng tổ ong ở tiểu não, dạng rễ cây ở cột sống. Tuy nhiên, chúng có cấu trúc và
nguyên lý hoạt động chung. Từ mô hình chung nhất, người ta có thể mô tả chúng
như một nơron chuẩn gồm 4 phần cơ bản:

Hình 1.7: Mô hình nơron sinh học

17

+ Các nhánh và rễ: là các bộ phận nhận thông tin. Các đầu nhạy hay các đầu
ra của các nơron khác bám vào rễ hoặc nhánh của một nơron.

+ Thân thần kinh (Soma) chứa các nhân và cơ quan tổng hợp prôtêin. Các
iôn vào được tổng hợp và biến đổi. Khi nồng độ các iôn đạt đến một giá trị nhất
định, xẩy ra quá trình phát xung (hay kích thích). Xung đó được phát ở các đầu ra
của nơron. Dây dẫn đầu ra xung được gọi là thần kinh (axon).
+ Dây thần kinh (axon): là đầu ra. Đó là phương tiện truyền dẫn tín hiệu.
Dây thần kinh được cấu tạo gồm các đốt và có thể dài từ vài micro mét đến vài
mét tùy từng kết cấu cụ thể. Đầu ra này có thể truyền tín hiệu đến các nơron khác.
+ Khớp thần kinh (synape): là bộ phận tiếp xúc của các đầu ra nơron với rễ,
nhánh của các nơron khác. Chúng có cấu trúc màng đặc biệt để tiếp nhận các tín
hiệu.

1.2.1.2 Mô hình mạng Nơron nhân tạo
Từ những cơ sở nghiên cứu về nơron sinh học, chúng ta có thể xây dựng mô
hình nơron nhân tạo theo ngôn ngữ và ký hiệu chung nhất như (hình 1.8). Mô
hình một nơron nhân tạo được xây dựng từ ba thành phần chính: tổng các liên kết
đầu vào, động học tuyến tính, phi tuyến không động học.

Hình 1.8: Mô hình mạng Noron nhân tạo

18

+ Bộ tổng liên kết: Bộ tổng liên kết đầu vào phần tử nơron có thể mô tả như
sau:
m

V ( t )  WY ( t ) 



bxu

x

(t )  I

(1.15)

k 1

Trong đó:
V(t) là tổng tất cả các đầu vào mô tả toàn bộ thế năng tác động ở thân
nơron.
ux (t) là các đầu vào ngoài mô tả tín hiệu vào từ các khớp nơron ngoài tới
nơron hiện tại, m là số đầu vào, k= 1,…,m;
Y(t) là đầu ra nơron (còn dung làm đầu vào phản hồi, đầu vào cho nơron
khác) mô tả tín hiệu ra.
b x là trọng liên kết các đầu vào ngoài, là hệ số mô tả mức độ liên kết giữa
các đầu vào ngoài với nơron hiện tại.
W là trọng liên kết các đầu vào trong, là hệ số mô tả mức độ liên kết giữa
nơron trong mạng nơron, liên kết phản hồi, tự liên kết.
I là ngưỡng, xác định ngưỡng kích thích hay ức chế (hằng số).
+ Phần động học tuyến tính: Đầu vào của phần động học tuyến tính là đầu
ra của bộ tổng liên kết v(t). Đầu ra của nó u(t) là tìn hiệu dạng tương tự. Có nhiều
hàm để mô tả phần động học tuyến tính. Dùng toán tử Laplace mô tả hàm truyền
của phần động học tuyến tính ta được dạng:

X

( s ) 

H

( s ). V ( s )

(1.16)

Trong miền thời gian phương trình (1.2) có thể viết:


X (t ) 

 h (t

 t ' ) v ( t ' ) dt

(1.17)



+ Phần phi tuyến: Phần phi tuyền là phần sử dụng hàm g(.) cho đầu ra y với
đầu vào x(t):

y  g ( x ( t ))

19

(1.18)

1.2.1.3 Mạng Nơron nhân tạo
Cũng như nơron sinh học, các nơron nhân tạo có thể liên kết với nhau để tạo
thành mạng. Có nhiều cách để kết hợp nơron thành mạng, mỗi cách kết hợp sẽ
tạo thành một lớp mạng khác nhau. Với mạng nơron nhân tạo, chúng ta có ba lớp
kiến trúc cơ bản sau:

a. Các mạng tiến (feedforward) đơn mức
Trong một mạng nơron phân mức, các nơron được tổ chức dưới dạng các
mức. Với dạng đơn giản nhất của mạng phân mức, chúng ta có một mức đầu vào
gồm các nút nguồn chiếu trực tiếp tới mức đầu ra gồm các nơron. Như vậy, mạng
thực sự không có chu trình. Được minh họa như (hình 1.9) trong trường hợp ba
nút với cả mức đầu ra và đâu vào. Một mạng như vậy được gọi là một mạng đơn
mức.

Mức đầu vào
gồm các nút
nguồn

Mức đầu ra
gồm các
nơron

Hình 1.9: Mạng tiến với một mức Nơron

b. Các mạng tiến (feedforward) đa mức
Lớp thứ hai của một mạng nơron tiến được phân biệt bởi sự có mặt của một
hay nhiều mức ẩn, mà các nút tính toán của chúng được gọi là các nơron ẩn hay
đơn vị ẩn(thuật ngữ ẩn ở đây mang ý nghĩa không tiếp xúc với môi trường). Chức
năng của các nơron ẩn là can thiệp vào giữa đầu vào và đầu ra của mạng một
cách hữu hiệu. Bằng việc thêm một vài mức ẩn, mạng có khả năng rút ra được

20

các thống kê bậc cao của tín hiệu đầu vào. Khả năng các nơron ẩn rút ra được các
thống kê bậc cao đặc biệt có giá trị khi mức đầu vào có kích thước lớn.
Các nút nguồn trong mức đầu vào của mạng cung cấp các phần tử của các
vectơ đầu vào, chúng tạo nên những tín hiệu đầu vào cho các nơron (các nút tính
toán ) trong mức thứ hai (mức ẩn thứ nhất). Các tín hiệu đầu ra của mức thứ hai
được sử dụng như các đầu vào cho mức thứ ba, và cứ như vậy phần còn lại của
mạng. Về cơ bản, các nơron trong mỗi mức của mạng có các đầu vào của chúng
là các tín hiệu đầu ra của chỉ mức đứng liền trước nó (điều này có thể khác trong
thực tế cài đặt). Tập hợp các tín hiệu đầu ra của các nơron trong mức đầu ra của
mạng tạo nên đáp ứng toàn cục của mạng đối với các vectơ đầu vào được cung
cấp bởi các nút nguồn của mức đầu vào. Đồ thị trong (hình 1.10) minh họa cấu
trúc của một mạng nơron tiến đa mức cho trường hợp một mức ẩn.
Mạng nơron trong (hình 1.10) được gọi là kết nối đầy đủ với ý nghĩa là tất
cả các nút trong mỗi mức của mạng được nối với tất cả các nút trong mức tiếp
sau. Nếu một số kết nối synapse không tồn tại trong mạng, chúng ta nói rằng
mạng là kết nối không đầy đủ.

Mức đầu vào gồm
các nút nguồn

Mức ẩn gồm các
nơron ẩn

Mức đầu ra gồm
các nơron đầu ra

Hình 1.10: Mạng tiến kết nối đầy đủ với một mức ẩn và một mức đầu ra

21

c. Các mạng hồi quy (recurrent network)
Một mạng nơron hồi quy được phân biệt với các mạng nơron không hồi quy
ở chỗ là nó có ít nhất một vòng lặp phản hồi. Ví dụ, một mạng nơron hồi quy có
thể bao gồm một mức đơn các nơron với mỗi nơron đưa tín hiệu đầu ra của nó
quay trở lại các đầu vào của tất cả các nơron khác, như được minh họa trong
(hình 1.11). Trong cấu trúc được mô tả trong hình này, không có một vòng lặp tự
phản hồi nào trong mạng; tự phản hồi là trường hợp đầu ra của một nơron được
phản hồi lại chính đầu vào của nơron đó. Mạng hồi quy trong (hình 1.11) cũng
không có các nơron ẩn. Trong (hình 1.12), chúng ta minh họa một lớp mạng hồi
quy nữa với các nơron ẩn. Các kết nối phản hồi được vẽ trong (hình 1.12) được
bắt nguồn từ các nơron ẩn cũng như từ các nơron đầu ra.

z-1

z-1

z-1

Các
toán tử
đơn vị
trễ

Hình 1.11: Mạng hồi quy không có nơron ẩn và không có vòng lặp tự phản
hồi

Sự có mặt của vòng lặp phản hồi, trong cả cấu trúc hồi quy của (hình1.11)
và (hình 1.12), có một ảnh hưởng sâu sắc tới khả năng học của mạng và đến tính
năng của nó. Hơn nữa, các vòng lặp phản hồi bao hàm việc sử dụng các nhánh
đặc biệt gồm các phần tử đơn vị trễ (ký hiệu là z-1), thể hiện một hành vi phi

22

tuyến động theo thời gian (cùng với giả sử rằng mạng nơron bao gồm các đơn vị
phi tuyến).

z-1
Đầu
ra

z-1

z-1
Các toán tử
đơn vị trễ

Đầu
vào

Hình 1.12: Mạng hồi quy có các nơron ẩn

1.2.2 Phương pháp học của mạng nơron nhân tạo
1.2.2.1 Định nghĩa học
Học là một quá trình mà nhờ nó các tham số tự do của một mạng nơron
được điều chỉnh lại cho phù hợp thông qua một quá trình kích thích bởi môi

trường.
Định nghĩa này bao hàm những ý nghĩa quan trọng sau:
 Mạng nơron được kích thích bởi một môi trường.
 Mạng nơron trải qua những sự thay đổi về các tham số tự do của nó
như là kết quả của sự kích thích này.
 Mạng nơron đáp ứng lại theo một cách hoàn toàn với môi trường do
sự thay đổi về cấu trúc bên trong của nó.
Một tập hợp các quy tắc được xác định cho lời giải của bài toán học được
gọi là thuật toán học. Không có một thuật toán học duy nhất cho việc thiết kế các
mạng nơron, mà chúng ta có một “bộ công cụ” bao gồm nhiều thuật toán học rất

23

đa dạng, mỗi thuật toán đều có những ưu điểm riêng. Nói chung, các thuật toán
học khác nhau chủ yếu trong cách thức điều chỉnh trọng số synapse của một
nơron.

1.2.2.2 Tiến trình học
Tiến trình học là tiến trình quan trọng của con người, nhờ học mà bộ não
ngày càng tích lũy những kinh nghiệm để thích nghi với môi trường và xử lý tình
huống tốt hơn. Mạng nơron xây dựng lại cấu trúc của bộ não thì cần phải có khả
năng nhận biết dữ liệu thông qua tiến trình học, với các thông số tự do của mạng
có thể thay đổi liên tục bởi những thay đổi của môi trường và mạng nơron ghi
nhớ giá trị đó.
Trong quá trình học, giá trị đầu vào được đưa vào mạng theo dòng chảy
trong mạng tạo thành giá trị ở đầu ra.
Tiếp đến là quá trình so sánh giá trị tạo ra bởi mạng nơron với giá trị ra
mong muốn. Nếu hai giá trị này giống nhau thì không thay đổi gì cả. Tuy nhiên,
nếu có một sai lệch giữa hai giá trị này vượt quá giá trị sai số mong muốn thì đi

ngược mạng từ đầu ra về đầu vào để thay đổi một số kết nối.

Hình 1.13: Tiến trình học

Đây là một quá trình lặp liên tục và có thể không dừng khi không tìm các
giá trị w sao cho đầu ra tạo bởi mạng nơron bằng đúng đầu ra mong muốn. Do đó
trong thực tế người ta phải thiết lập tiêu chuẩn dựa trên một giá trị sai số nào đó
của hai giá trị này, hay dựa trên một số lần lặp xác định.

24

Vậy học là quá trình xác định cấu trúc hoặc tham số của mạng nơron, như
vậy ta có:
- Học tham số: Các thủ tục học này nhằm tìm kiếm ma trận trọng số sao
cho mạng có khả khăng đưa ra dự báo sát với thực tế. Dạng chung của luật học
tham số có thể được mô tả như sau:
Wij  rx j , i  1, N , j  1, M ,

(1.19)

Trong đó:
Wij là sự thay đổi trọng số liên kết từ nơ-ron j đến nơ-ron i.

xj là tín hiệu vào của nơ-ron thứ j.
 là tốc độ học , nằm trong khoảng (0,1).
r là hằng số học.
Vẫn đề đặt ra ỏ đây là tín hiệu học r được sinh ra như thế nào để hiệu
chỉnh trọng số của mạng.
Có thể chia thủ tục học tham số ra thành ba lớp nhỏ hơn: Học có chỉ đạo,

học tăng cường và học không chỉ đạo. Việc xác định r phụ thuộc vào từng kiểu
học .
+ Học có tín hiệu chỉ đạo: là quá trình mạng học dựa vào sai số giữa đầu
ra thực và đầu ra mong muốn để làm cơ sở cho việc hiệu chỉnh trọng số. Sai số
này chính là trọng số r. Luật học điển hình của nhóm này chính là luật học Delta
của Widrow (1962) nêu ra đầu tiên dùng để xấp xỉ trọng của Adaline dựa trên
nguyên tắc giảm gradient.
Trong nhóm luật học này cũng cần phải kể đến luật học Perceptron của
Rosenblatt (1958). Về cơ bản luật học này thay đổi các giá trị trọng trong thời
gian học còn luật Perceptron thì thêm hoặc bỏ trọng tùy theo giá trị số là dương
hay âm.
Một loạt các luật học khác cũng được dựa trên tư tưởng này. Luật oja là
cải tiến và nâng cấp của luật Delta. Luật truyền ngược là mỏ rộng của luật Delta
cho mạng nhiều lớp. Đối với mạng truyền thẳng thường sử dụng luật truyền
ngược để chỉnh trọng với tín hiệu chỉ đạo từ bên ngoài và người ta gọi mạng này
là mạng truyền ngược.

25

Mạng nơron nhân tạo

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về