Tải bản đầy đủ (.pdf) (70 trang)

Hệ lai mờ nơ ron và ứng dụng trong dự báo

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.38 MB, 70 trang )

i

LỜI CAM ĐOAN

Tôi xin cam đoan:
Những nội dung trong luận văn này là do tôi thực hiện dưới sự hướng dẫn của
thầy. Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng và trung thực
về tên tác giả, tên công trình, thời gian và địa điểm công bố.
Tôi xin chịu hoàn toàn trách nhiệm về sự trung thực của luận văn và với mọi
sao chép không hợp lệ, hay gian trá.
Tác giả luận văn


ii

LỜI CẢM ƠN

Trước hết em xin gửi lời cảm ơn chân thành các thầy cô của trường Đại học
Công nghệ thông tin và truyền thông – Đại học Thái Nguyên, các thầy cô của Viện
Công nghệ thông tin – Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã tận tình
giảng dạy cũng như t ạo mọi điều kiện cho em học tập và nghiên cứu trong thời gian
vừa qua.
Em xin gửi lời cám ơn tới thầy giáo TS Phạm Thanh Hà, người đã tận tình
hướng dẫn, động viên và giúp đỡ em thực hiện luận văn ngay từ những bước đầu
tiên đến khi hoàn thành.
Tôi xin cảm ơn các đồng nghiệp và người thân đã động viên, giúp đỡ tôi trong
quá trình nghiên cứu và thực hiện luận văn này.
Do thời gian có hạn và vốn kiến thức còn hạn chế, chắc chắn luận văn không
thể tránh khỏi những thiếu sót. Em rất mong nhận được những ý kiến đóng góp của
thầy cô và các bạn để luận văn này được hoàn thiện hơn.
Xin trân trọng cảm ơn!


Thái Nguyên, tháng 4 năm 2016


iii

Mục lục
LỜI CAM ĐOAN.....................................................................................................i
DANH MỤC HÌNH VẼ ..........................................................................................4
MỞ ĐẦU.................................................................................................................5
1. Đặt vấn đề ........................................................................................................5
2. Đối tượng và phạm vi nghiên cứu ....................................................................6
3. Hướng nghiên cứu của đề tài ...........................................................................6
4. Phương pháp nghiên cứu .................................................................................6
5. Ý nghĩa khoa học của đề tài .............................................................................6
CHƯƠNG 1 ............................................................................................................7
LOGIC MỜ VÀ MẠNG NƠ RON ..........................................................................7
1.1. Logic mờ .......................................................................................................7
1.1.1. Biến ngôn ngữ .......................................................................................7
1.1.2 Mệnh đề mờ ............................................................................................8
1.1.3. Các mệnh đề hợp thành ........................................................................10
1.1.4. Kéo theo mờ (Luật if – then mờ) ..........................................................11
1.1.5. Lược đồ lập luận xấp xỉ ........................................................................13
1.2. Mạng nơron truyền thẳng và giải thuật huấn luyện .....................................19
1.2.1. Cấu trúc và mô hình của mạng nơron ...................................................19
1.2.2. Phân loại cấu trúc mạng nơ ron ............................................................23
1.2.3. Các luật học..........................................................................................25
1.2.4. Mạng nơ ron truyền thẳng ....................................................................26
Chương 2...............................................................................................................35
HỆ LAI MỜ - NƠRON .........................................................................................35
2.1. Sự kết hợp giữa logic mờ và mạng nơron ...................................................35

2.1.1. Khái niệm.............................................................................................35
2.1.2. Cấu trúc chung của hệ mờ - nơron........................................................36
2.2. Biểu diễn luật If-Then theo cấu trúc mạng nơron........................................38
2.3. Nơron mờ ....................................................................................................39
2.4. Huấn luyện mạng nơron mờ .......................................................................41
2.5. Phân loại kết hợp mạng nơ ron và logic mờ ................................................42
2.5.1. Neuro-Fuzzy Systems (NFS)................................................................42
2.5.2. Fuzzy Neural Network (FNN)..............................................................48
Chương 3...............................................................................................................50
XÂY DỰNG HỆ MỜ - NƠ RON..........................................................................50
DỰ B ÁO TĂNG TRƯỞNG PHƯƠNG TIỆN GIAO THÔNG ĐƯỜNG BỘ .......50
3.1. Sự ra đời của một mô hình dự báo ..............................................................50
3.2. Sử dụng công cụ Anfis trong Matlab để thiết kế hệ mờ - nơron..................51
3.2.1. Kiến trúc và hoạt động của ANFIS.......................................................51
3.2.2. Công cụ Anfis trong Matlab để thiết kế hệ mờ - nơron ........................52
3.3. Dữ liệu thống kê và dự báo .........................................................................58
KẾT LUẬN ...........................................................................................................69
TÀI LIỆU THAM KHẢO .....................................................................................70


4

DANH MỤC HÌNH VẼ
STT

Tên hình vẽ

Trang

1


Hình 1.1. Hàm thuộc của tập mờ “nhiệt độ cao”

8

2

Hình 1.2. Các tập mờ “Chậm”, “Nhanh”, Trung bình”

8

3

Hình 1.3. Tập mờ “tuổi trẻ”

10

4

Hình 1.4. Một mạng nơ ro n đơn giản gồm hai nơ ron.

19

5

Hình 1.5. Mô hình của một nơ ron

20

6


Hình 1.6. Cấu trúc của một nơ ron

21

7

Hình 1.7. Các hàm kích hoạt: (a) hàm bước nhẩy; (b) hàm dấu; (c)
hàm dốc; (d) hàm sigmoid đơn cực; (e) hàm sigmoid lưỡng cực

23

8

Hình 1.10. Mạ ng nơ ron nhiều lớp

24

9

Hình 1.13. Mạng perceptron đơn

27

10

Hình 1.15. Mạng truyền thẳng ba lớp lan truyền ngược sai số

30


11

Hình 2.1. Mô hình hệ mờ - nơron
Hình 2.2. Cấu trúc chung của hệ mờ-nơron
Hình 2.7. Cấu trúc của một mạng NFS thường gặp

36

52

15

Hình 3.2. Kiến trúc Anfis
Hình 3.4. Biểu đồ số người chết vì tai nạn giao thông đường bộ

16

Hình 3.5. Kiến trúc hệ mờ dự báo tăng trưởng phương tiện ô tô

62

17

Hình 3.6. Dữ liệu huấn luyện cho hệ mờ nơ ron

62

18

Hình 3.7. Kiến trúc hệ mờ nơ ron


63

19

Hình 3.8. Kết quả hồi tưởng dữ liệu mẫu của hệ thống

63

20

Hình 3.9. Mối quan hệ giữa đầu vào và đầu ra.

64

21

Hình 3.10. Giao diện dự báo của hệ thống

64

22

Hình 3.11. Kiến trúc hệ mờ dự báo tăng trưởng phương tiện xe máy.

65

23

Hình 3.12. Dữ liệu huấn luyện cho hệ mờ nơ ron


66

24

Hình 3.15. Mối quan hệ giữa đầu vào và đầu ra

67

25

Hình 3.16. Giao diện dự báo của hệ thống

68

12
13
14

37
43

60


5

MỞ ĐẦU
1. Đặt vấn đề
Lý thuyết tập mờ và logic mờ là cơ sở toán học cho việc nghiên cứu, phát triển

các phương pháp lập luận khác nhau, được gọi là phương pháp lập luận xấp xỉ
(approximate reasoning method), để mô phỏng cách thức con người lập luận. Trên
thực tế lý thuyết tập mờ và logic mờ là công cụ hữu hiệu giúp chúng ta giải quyết
nhiều bài toán có thông tin mờ không đầy đủ .
Mạng nơ ron bao gồm các nơ ron được liên kết với nhau bằng các trọng số
theo một cấu trúc xác định. Mạng nơ ron có thể được huấn luyện để thực hiện các
nhiệm vụ khác nhau. Quá trình huấn luyện sẽ thiết lập bộ trọng số cho các liên kết
giữa các nơ ron trong mạng .
Mạng nơ ron nhân tạo được chia ra làm nhiều loại, trong đó người ta quan tâm
nhiều đến cấu trúc mạng nơ ron và giải thuật huấn luyện, về cấu trúc có thể chia ra
các loại mạng như mạng nơ ron một lớp, nhiều lớp, mạng nơ ron hồi quy, mạng nơ
ron truyền thẳng.
Trong những năm gần đây xu hướng kết hợp mạng nơ ron nhân tạo với logic
mờ đang được quan tâm, với sự kết hợp này người ta hi vọng khai thác và tích hợp
được những khả năng tiềm tàng của 2 lĩnh vực.
Hệ mờ nơ ron là một sự kết hợp giữa logic mờ và và khả năng học của mạng
nơ ron. Một trong những sự kết hợp đó mà hệ mờ nơ ron thích nghi (ANFIS Adaptive neuro fuzzy inference system). Hệ thống này có khả năng tối ưu hóa hệ
mờ dựa trên các mẫu có sẵn .
Bài toán dự báo là một trong những vấn đề được giới chuyên môn quan tâm.
Việc dự báo thông thường được tiến hành dựa trên các số liệu thống kê và kinh
nghiệm của chuyên gia [2].
Chúng ta biết rằng kinh nghiệm của chuyên gia có thể được xác định thông
qua các luật mờ, dữ liệu thống kê có thể được dùng để huấn luyện mạng nơ ron.
Việc kết hợp 2 khả năng này sẽ tạo ra một hệ thống có thể dự báo chính xác
Và đó cũng là lý do đ ể luận văn chọn đề tài: Hệ lai mờ - nơ ron và ứng dụng
trong dự báo


6


2. Đối tượng và phạm vi nghiên cứu
- Các khái niệm cơ bản liên quan đến tập mờ, logic mờ, hệ mờ.
- Các khái niệm cơ bản liên quan đến mạng nơ ron.
- Nghiên cứu bài toán dự báo một số chỉ tiêu kinh tế xã hội.
- Xây dựng hệ mờ - nơ ron hỗ trợ dự báo một số chỉ tiêu kinh tế xã hội.
3. Hướng ng hiên cứu của đề tài
- Nghiên cứu lý thuyết tập mờ, logic mờ, hệ mờ.
- Nghiên cứu mạng nơ ron, hệ mờ - nơ ron.
- Xây dựng hệ mờ - nơ ron hỗ trợ dự báo một số chỉ tiêu kinh tế xã hội.
4. Phương pháp nghiên cứu
- Nghiên cứu lý thuyết kết hợp với cài đặt thực nghiệm.
5. Ý nghĩa khoa học của đề tài
Hệ thống được các kiến thức về tập mờ, logic mờ, mạng nơ ron, các lĩnh
vựng ứng dụng.
Cài đặt thử nghiệm giải quyết bài toán thực tế: Xây dựng Hệ mờ - nơ ron hỗ
trợ dự báo một số chỉ tiêu kinh tế xã hội.


7

CHƯƠNG 1
LOGIC MỜ VÀ MẠNG NƠ RON
1.1. Logic mờ
1.1.1. Biến ngôn ngữ
Xét một biến nhận giá trị trong một miền giá trị nào đó, chẳng hạn “nhiệt độ”
có thể nhận giá trị số là 1  C, 2  C,… là các giá trị chính xác. Khi đó với một giá trị
cụ thể gán vào biến sẽ giúp chúng ta xác định được tính chất, quy mô của biến.
Ngoài ra chúng ta còn biết được những thông tin khác liên quan đến biến đó.
Ví dụ chúng ta hiểu là không nên chạm tay trần vào vật có “nhiệt độ” là 80  C trở
lên. Nhưng trong thực tế thì chúng ta thường nói “không nên chạm vào vật có nhiệt

độ cao” chứ ít khi nói “không nên chạm vào vật có nhiệt độ là 80  C trở lên”.
Thực tế là lời khuyên đầu thì có ích hơn bởi vì nếu nhận đư ợc lời khuyên sau
thì ta dễ bị ngộ nhận là có thể chạm tay vào vật có nhiệt độ là 79  C trong khi đó vật
có nhiệt độ 80  C trở lên thì không.
Nhưng vấn đề đặt ra là nếu nghe theo lời khuyên đầu thì ta có thể xác địn h rõ
là nhiệt độ bằng bao nhiêu thì có thể chạm tay vào? Câu trả lời là tuỳ vào ý kiến của
từng người. Với nhiệt độ là 60  C thì có người cho là cao trong khi người khác thì
không.
Tuy các ý kiến là khác nhau nhưng có một điều chắc chắ n là khi giá trị của
biến nhiệt độ càng tăng thì càng dễ dàng được chấp nhận là “cao”. Như vậy nếu xét
hàm  cao nhận biến nhiệt độ và trả về tỷ lệ ý kiến đồng ý là “cao” thì  cao sẽ là
hàm thuộc của tập mờ “nhiệt độ cao ” trên vũ trụ “nhiệt độ” .
Biến nhiệt độ có thể nhận giá trị “cao” là một giá trị của ngôn ngữ tự nhiên
nên nó được gọi là một biến ngôn ngữ (linguistic variable).


8

1
0.9

cao

Nhiệt độ
50

80

100


120

Hình 1.1. Hàm thuộc của tập mờ “nhiệt độ cao”
Khái niệm biến ngôn ngữ đã được Zadeh đ ưa ra năm 1973 như sau:
Một biến ngôn ngữ được xác định bởi bộ (x, T, U, M) trong đó: x là tên biến,
T là tập các từ là các giá trị ngôn ngữ tự nhiên mà x có thể nhận, U là miền các giá
trị vật lý mà x có thể nhận, M là luật ngữ nghĩa, ứng mỗi từ trong T v ới một tập mờ
A trong U.
Ví dụ: x là “tốc độ”, T = {chậm, trung bình, nhanh} và các từ “chậm”, “trung
bình”, “nhanh” được xác định bởi các tập mờ trong hình 1. 2.
Từ định nghĩa trên, chúng ta có thể nói rằng biến ngôn ngữ là biến có thể
nhận giá trị là các tập mờ trên một miền nào đó.

Chậm

Trung bình

Nhanh

1

30

50

70

120

Hình 1.2. Các tập mờ “Chậm”, “Nhanh”, Trung bình”

1.1.2 Mệnh đề mờ
Trong logic cổ điển (logic vị từ cấp một), một mệnh đề phân tử P(x) là một
phát biểu có dạng: x là P.

(1.1)


9

trong đó x là ký hiệu một đối tượng nằ m trong một tập các đối tượng nào đó
(hay nói cách khác, x là một giá trị trên miền U), còn P là một tính chất nào đó của
các đối tượng trong miền U. Chẳng hạn, các mệnh đề.
“n là số nguyên tố”, “x là người Ấn độ”
Trong các mệnh đề (1. 13) của logic kinh đ iển, tính chất P cho phép ta xác định
một tập con rõ A của U sao cho x ∈ A nếu và chỉ nếu x thoả mãn tính chất P. Chẳng
hạn, tính chất “là số nguyên tố” xác định một tập con rõ của tập tất cả các số
nguyên, đó là tập tất cả các số nguyên tố.
Nếu chúng ta kí hiệu Truth(P(x)) là giá trị chân lý của mệnh đề thì :
Truth(P(x)) =A(x)

(1.2)

trong đó, A(x) là hàm đặc trưng của tập rõ A, tập A được xác định bởi một
tính chất P.
Một mệnh đề mờ phân tử cũng có dạng tương tự như (1. 13), chỉ có điều ở đây
P không phải là một tính chất chính xác, mà là một tính chất không rõ ràng, mờ.
Chẳng hạn, các mệnh đề “tốc độ là nhanh”, “áp suất là cao” “nhiệt độ là thấp”,…là
các mệnh đề mờ. Chúng ta có định nghĩa sau.
Một mệnh đề mờ phân tử có dạng : x là t


(1.3)

Trong đó, x là biến ngôn ngữ, còn t là một giá trị ngôn ngữ của x.
Theo định nghĩa biến ngôn ngữ, từ t trong (1.3) được xác định bởi một tập mờ
A trên vũ trụ U. Do đó, chúng ta còn có thể định nghĩa mệnh đề mờ phân tử là phát
biểu có dạng : x là A

(1.4)

Trong đó, x là biến ngôn ngữ, còn A là một tập mờ trên miền U các giá trị vật
lý của x.
Chúng ta ký hiệu P(x) là mệnh đề mờ (1. 3), hoặc (1. 4). Giá trị chân lý
Truth(P(x)) của nó được xác định như sau:
Truth(P(x)) = A(x)

(1.5)

Điều đó có nghĩa là giá trị chân lý của mệnh đề mờ P(x) = “x là A” là mức độ
thuộc của x vào tập mờ A.


10

Ví dụ: Giả sử P(x) là mệnh đề mờ “tuổi là trẻ”. Giả sử tập mờ A = “tuổi trẻ”
được cho trong hình 2.3 và µA(45) = 0,73. Khi đó mệnh đề mờ “tuổi 45 là trẻ” có
giá trị chân l ý là 0,73.

1

Trẻ


Trung niên

Già

tuổi
30

45

70

Hình 1.3. Tập mờ “tuổi trẻ”
1.1.3. Các mệnh đề hợp thành
Cũng như trong logic kinh điển, từ các mệnh đề mờ phân tử, bằng cách sử
dụng các kết nối logic: ∧ (and), ∨ (or),  (not) chúng ta sẽ tạo ra các mệnh đề mờ
hợp thành .
Giả sử mệnh đề rõ P(x) được minh hoạ như tập con rõ A trong vũ trụ U, (cần
lưu ý rằng, điều đó có nghĩa là Truth( P(x)) = 1 ⇔ x ∈ A), và mệnh đề rõ Q(y) được
minh hoạ như tập con rõ B trong V. Từ bảng chân lý của các phép toán ∧ (and), ∨
(or),  (not) trong logic cổ điển chúng ta suy ra:
+ Mệnh đề P(x) được minh hoạ như tập rõ A .
+ Mệnh đề P(x)∧Q(y) được minh hoạ như quan hệ rõ A × B trên U × V.
+ Mệnh đề P(x)∨Q(y) được minh hoạ như quan hệ rõ ( A × V)∪(U × B).
Chuyển sang logic mờ, giả sử rằng P(x) là mệnh đề mờ được minh hoạ như
tập mờ A trên U và Q(y) là mệnh đề được minh hoạ như tập mờ B trên V. Tổng quát
hoá từ các mệnh đề rõ, chúng ta xác định như sau:
+ Mệnh đề mờ P(x) được minh hoạ như phủ định mờ A của tập mờ A:

 A ( x) = C (  A ( x))


(1.6)

Trong đó, C là hàm phần bù. Khi C là hàm phần bù chuẩn ta có :


11

 A ( x) = 1 −  A ( x)

(1.7)

+ Mệnh đề P(x) ∧ Q(y) được minh hoạ như quan hệ mờ A ∧ B, trong đó A ∧ B
được xác định là tích đề các mờ của A và B. Từ định nghĩa tích đề các mờ, ta có:

 A∧B ( x, y) = T ( A ( x),  B ( y))

(1.8)

Trong đó, T là một T – norm nào đó. Với T là phép lấy min, ta có :

 A∧ B ( x, y ) = min( A ( x),  B ( y ))

(1.9)

+Mệnh đề P(x)∨Q(y) được minh hoạ như quan hệ mờ A ∨ B, trong đó A ∨ B
được xác định là tích đề các mờ của A và B. Từ định nghĩa tích đề các mờ, ta có:

 A∨B ( x, y) = S ( A ( x), B ( y))


(1.10)

Trong đó, S là một S – norm nào đó. Với S là phép lấy max, ta có :

 A∨B (x, y) = max( A (x), B ( y))

(1.11)

1.1.4. Kéo theo mờ (Luật if – then mờ)
Trước hết, chúng ta xét phép kéo theo trong logic cổ điển. Giả sử P(x) và Q(y)
là các mệnh đề được minh hoạ như các tập rõ A và B trên U và V tương ứng.
Từ bảng chân lý của phép kéo theo trong logic cổ điển, chúng ta suy ra rằng,
mệnh đề P(x) ⇒ Q(y) được minh hoạ như quan hệ rõ trên U × V:

hoặc

R = ( A × V ) ∪ (U × B)

(1.12)

R = ( A × V ) ∪ ( A × B)

(1.13)

Trong logic mờ, một kéo theo mờ có dạng .
<Mệnh đề mờ> ⇒ <Mệnh đề mờ>

(1.14)

Hay

if <Mệnh đề mờ> then <Mệnh đề mờ>

(1.15)

Dạng này được gọi là luật if – then mờ. Chẳng hạn các phát biểu sau là các
luật if – then mờ:
if “nhiệt độ cao” then “áp suất lớn”
if “tốc độ nhanh” then “ma sát lớn”


12

Một vấn đề đặt ra là chúng ta cần hiểu ngữ nghĩa của (1.14) như thế nào? Xét
một kéo theo mờ sau đây.
P(x) ⇒ Q(y)

(1.16)

Trong đó, P(x) là mệnh đề mờ được minh hoạ như tập mờ A trên U và Q(y) là
mệnh đề mờ được minh hoạ như tập mờ B trên V.
Chúng ta có thể hiểu được kéo theo mờ (1.16) như là một quan hệ mờ R trên U
× V được xác dịnh bởi (1.12) hoặc (1.13) nhưng các phép toán đó là các phép toán
trên tập mờ .
Từ định nghĩa của các phép toán lấy phần bù mờ, tích đề các mờ và hợp mờ,
chúng ta có:

R(x, y) = S(C(A(x)), B(y)) hoặc

(1.17)


R(x, y) = S(C(A(x)), T(A(x), B(y)))

(1.18)

Với C là hàm phần bù, S là toán tử S – norm, T là toán tử T – norm
Kéo theo mờ (1.14) được minh hoạ như quan hệ mờ R với hàm thuộc xác định
bởi (1.17) hoặc (1.18), ứng với mỗi cách lựa chọn các hàm C, S, T chúng ta nhận
được một quan hệ mờ R minh hoạ cho kéo theo mờ .
Rõ ràng kéo theo mờ (1.15) đượ c minh hoạ bởi rất nhiều các quan hệ mờ khác
nhau, sau đây là một số kéo theo mờ quan trọng:
Kéo theo Dienes – Rescher
Trong (1.17), nếu thay S bởi phép toán lấy max và C bởi hàm phần bù chuẩn,
chúng ta nhận được quan hệ mờ R với hàm thuộc:

R(x, y) = max(1-A(x), B(y))

(1.19)

Kéo theo Lukasiewicz
Nếu sử dụng phép hợp Yager với w = 1 thay cho S và C là phần bù chuẩn thì
từ (1.18) chúng nao nhận được quan hệ mờ R với hàm thuộc:
µR(x, y) = min(1, 1 - µA(x) + µB(y))
Kéo theo Zadeh

(1.20)


13

Trong (1.18), nếu sử dụng S là max, T là min và C là hàm phần bù chuẩn,

chúng ta nhận được quan hệ mờ R với hàm thuộc .

R(x, y) = max(1-A(x), min(A(x), B(y)))

(1.21)

Trên đây chúng ta hiểu kéo theo mờ P(x) ⇒ Q(y) như quan hệ mờ R được xác
định bởi (1.17), (1.18) . Cách hiểu như thế là sự tổng quát hoá trực tiếp ngữ nghĩa
của kéo theo cổ điển.
Tuy nhiên, chúng ta cũng có thể hiểu: Kéo theo mờ P(x) ⇒ Q(y) chỉ có giá trị
chân lý lớn khi cả P(x) và Q(y) đều có giá trị chân lý lớn, tức là chúng ta có thể
minh hoạ kéo theo mờ (1.14) như là quan hệ mờ R được xác định là tích đề các mờ
của A và B.
R=A×B

(1.22)

Từ đó chúng ta xác định được hàm thuộc của quan hệ mờ R

R(x, y)=T(A(x), B(y))

(1.23)

với T là toán tử T – norm
Kéo theo Mamdani
Trong (1.23), nếu sử dụng T là phép toán lấy min hoặc tích đại số, ta có:

hoặc

R(x, y)=min(A(x), B(y))


(1.24)

R(x, y)=A(x)B(y)

(1.25)

Kéo theo mờ (1.14) được hiểu như một quan hệ mờ R với hàm thuộc được xác
định bởi (1.12) hoặc (1.13) được gọi là kéo t heo Mamdani. Kéo theo Mamdani
được sử dụng rộng rãi nhất trong các hệ mờ.
1.1.5. Lược đồ lập luận xấp xỉ
Xét lược đồ lập luận (a) được biểu thị như sau với A, A’, B và B’ là các tập mờ
tương ứng trên các không gian tham chiếu U của X và V của Y,
Tiền đề 1: Nếu X là A thì Y là B
Tiền đề 2:
Kết luận:

X là A’

.
Y là B’

(a)


14

Tiền đề 1 biểu thị mối quan hệ giữa hai đại lượng X và Y, với X nhận giá trị
trong U và Y nhận giá trị trong V. Lược đồ lập luận (a) được gọi là luật modus
ponens tổng quát (generalized modus ponens). Nó khác quy luật modus ponens kinh

điển ở chỗ sự kiện “X là A’” trong Tiền đề 2 không trùng với sự kiện trong phần
“nếu” hay tiền tố của Tiền đề 1.
Như chúng ta biết, ngữ nghĩa của mệnh đề nếu-thì có thể được biểu thị bằng
một quan hệ mờ R trên U × V. Nó được xác định dựa trên tập mờ A trên U và tập
mờ B trên V và dựa trên ngữ nghĩa của phép kép theo mờ.
R = Impl(A, B) = A

*



B Khi đó: B’ = A’ o R

Trong đó o là phép hợp thành max-min (max-min composition). Và phương pháp
lập luận xấp xỉ này được gọi là phương pháp suy luận hợp thành.
Nếu ta thay phép min ∧ bằng một phép t-norm T nào đó, ta có quy tắc suy luận
hợp thành max-T được ký hiệu là oT, cụ thể ta có:

B’(v’) = ∨u’ U T(A’(u’), R(u’, v’)), ∀v’ ∈ V
T

và B’ = A’  R
Phương pháp suy luận hợp thành cũng có th ể ứng dụng cho Luật modus
tollens tổng quát có dạng lược đồ lập luận sau:
Tiền đề 1: Nếu X là A thì Y là B
Tiền đề 2:
Kết luận:

Y là B’


(b)

X là A’

Lưu ý rằng nói chung B’ ≠ B. Khác với quan hệ hàm số, quan hệ mờ R có tính
đối xứng giữa hai biến X và Y, cho nên sử dụng phép hợp thành trên các quan hệ
mờ, việc suy luận ra A’ có thể được tính theo công thức sau với B’ là vectơ cột:
A’ = R o B’
Phương pháp lập luận mờ
Mô hình mờ


15

Mô hình mờ là một tập các luật có dạng mệnh đề dạng “If…then…”, trong
đó phần “If” được gọi là tiền đề còn phần “then” được gọi là phần kết luận. Mô hình
mờ có hai dạng:
Mô hình mờ dạng đơn giản là tập các luật (mệnh đề If-then) mà trong đó mỗi
luật chỉ chứa một điều kiện và một kết luận được cho như sau:
if X = A1

then Y = B1

if X = A2

then Y = B2

(1.26)

..........

if X = An

then Y = Bn

Trong đó X, Y là các biến ngôn ngữ thuộc không gian U, V tương ứng và các
giá trị ngôn ngữ A1, A2,…, An, B1, B2, …, Bn là nhãn các tập mờ.
Mô hình mờ dạng tổng quát là một tập các luật (mệnh đề If-then) mà phần
tiền đề của mỗi luật là một điều kiện phức có dạng như sau:
If X1 = A11 and ... and Xm = A1n

then Y = B1

If X1 = A21 and ... and Xm = A2n

then Y = B2

..........
If X1 = Am1 and ... and Xm = Amn

(1.27)
then Y = Bm

Ở đây X1, X2, …, Xm và Y là các biến ngôn ngữ, Aij, Bi (i = 1,…, m; j =
1,…, n) là các giá trị ngôn ngữ tương ứng.
(1.26) còn đư ợc gọi là mô hình mờ đơn điều kiện và (1.27) được gọi là mô
hình mờ đa điều kiện, ngoài ra (1.27) còn được gọi là bộ nhớ mờ liên hợp (Fuzzy
Associate Memory - FAM) vì nó biểu diễn tri thức của chuyên gia trong lĩnh v ực
ứng dụng nào đó đang được xét.
Phương pháp lập luận mờ đa điều kiện
Trên cơ sở lý thuyết tập mờ và logic mờ như đã đ ề cập ở phần trên, các

phương pháp lập luận xấp xỉ đã đư ợc phát triển mạnh mẽ và tìm đư ợc những ứng


16

dụng thực tiễn quan trọng. Một số trong những phương pháp lập luận như vậy là
phương pháp lập luận mờ nhằm giải quyết bài toán lập luận mờ:
Cho trước mô hình mờ ở dạng (1.26) hoặc (1.27). Khi đó ứng với các giá trị
(hoặc giá trị mờ,hoặc giá trị thực) của các biến đầu vào đã cho, hãy tính giá trị của
biến đầu ra Y.
Dựa trên cách tiếp cận của lý thuyết tập mờ, các phương pháp lập luận mờ đa
điều kiện nói chung dựa trên ý tưởng sau:
Ngữ nghĩa của các giá trị ngôn ngữ của các biến ngôn ngữ trong mô hình mờ
được biểu thị bằng các tập mờ.
Kết nhập các đầu vào của các luật mờ trong mô hình (nếu n > 1) để chuyển
mô hình mờ về mô hình đơn điều kiện.
Từ các luật mờ dạng if – then xây dựng quan hệ mờ tương ứng bằng các
phép kéo theo.
Xây dựng quan hệ mờ tổng hợp bằng cách lấy giao hoặc hợp các quan hệ
mờ trên.
Khi đó mỗi mô hình mờ sẽ được mô phỏng bằng một quan hệ mờ hai ngôi R.
Khi đó ứng với vectơ đầu vào A0, giá trị của biến đầu ra được tính theo
công thức.
B0 = A0oR, trong đó o là một phép hợp thành.
Vấn đề mờ hóa và khử mờ
Dữ liệu đầu vào của bài toán lập luận có thể là các giá trị rõ. Vì vậy cần phải
mờ hoá (fuzzier) để chuyển các dữ liệu số đầu vào thành các tập mờ để quá trình
lập luận

mờ có thể thao tác được.


Mờ hoá là quá trình biến đổi một vector x=(x1,x2,…,xn) ∈ U ⊆ Rn thành
một tập mờ A’ trên U. A’ sẽ là đầu vào cho bộ suy diễn mờ. Mờ hoá phải thoả các
tiêu chuẩn sau:
Điểm dữ liệu x phải có độ thuộc cao vào A’


17

Vector x thu nhận từ môi trường ngoài có thể sai lệch do nhiễu nên A’ phải
phản ánh được tính gần đúng của dữ liệu thực.
Hiệu quả tính toán: đơn giản cho các tính toán trong bộ suy diễn. Sau đây là
một số phương pháp mờ hoá thông dụng.
Sau đây chúng ta sẽ xem xét 3 phương pháp mờ hóa quan trọng, đó là mờ
hóa cá thể, mờ hóa tam giác và mờ hóa Gauss.

Mờ hoá đơn trị: Mỗi điểm dữ liệu x được xem như một tập mờ đơn trị tức là
tập

mờ A có hàm thuộc xác định như sau:

1 if u = x
0 if u ≠ x

A (u ) = 
'
i

Mờ hoá tam giác: Mỗi giá trị xi được biểu diễn thành một số mờ A’i. Tập A’
là tích đề-các của các A’:


A

'
i


u i − xi
1 −
bi
( ui ) = 
0


if

u i − x i ≤ bi

if

u i − xi

> bi

Mờ hoá Gauss: Mỗi giá trị xi được biểu diễn thành một số mờ A’i. Tập A’ là
tích đề-các của các A’ với ai>0:

 A ( ui ) = e
'


i

Vấn đề khử mờ

 u −x 
− i i 
 ai 

2


18

Dữ liệu đầu ra của bài toán lập luận mờ ở dạng các tập mờ sẽ được giải mờ
(defuzzier) chuyển thành giá trị số.
Giải mờ (hay còn gọi là khử mờ) là quá trình xác định một điểm y từ một tập
mờ

trên B’ trên V. (B’ là đầu ra của bộ suy diễn mờ ). Giải mờ phải thoả các tiêu

chuẩn sau:
+ Điểm y là đại diện tốt nhất cho B’. Trực quan y là điểm có độ thuộc cao
nhất vào B’ và ở trung tâm tập giá đỡ của B’.
+ Hiệu quả tính toán nhanh.
+ Tính liên tục, khi B’ thay đổi ít thì y cũng thay đ ổi ít.
Sau đây là một số phương pháp giải mờ thông dụng, đó là phương pháp lấy
max, phương pháp lấy trọng tâm và phương pháp trung bình trọng tâm.
Phương pháp lấy max: Phương pháp này chọn y là điểm có độ thuộc cao nhất
vào B’, cụ thể:
+ Đầu tiên ta xác định tập rõ :



H =  y ∈ V  B' ( y ) = sup  B' (v) 
v∈V



+ Sau đó có thể chọn y trong H như sau:
y bất kỳ.
y là điểm cực biên (lớn nhất hoặc nhỏ nhất).
y là trung điểm của H.
Phương pháp khử mờ lấy max có ưu điểm là tính toán đơn giản và dễ cài
đặt.
Phương pháp lấy trọng tâm: Phương pháp này chọn y là điểm trọng tâm của
tập B’, cụ thể :
y = ∫ v B' (v)dv / ∫  B' (v)dv
v

v

Phương pháp lấy trung bình tâm: Vì B’ thường là hợp hoặc giao của m tập
mờ thành phần do vậy ta có thể tính gần đúng giá trị y là bình quân có trọng số của


19

tâm m tập mờ thành phần. Giả sử xi và hi là tâm và độ cao của tập mờ thành
phần B’ i ta có:
 m
  m 

y =  ∑ xi hi  /  ∑ hi 
 i =1
  i =1 

Phương pháp trung bình tâm có ưu điểm là kết quả đầu ra y có xét đến ảnh
hưởng của tất cả các luật tương tự như phương pháp trọng tâm nhưng độ phức tạp
tính toán ít hơn.
1.2. Mạng nơron truyền thẳng và giải thuật huấn luyện
1.2.1. Cấu trúc và mô hình của mạng nơ ron
Mạng nơ ron là sự tái tạo bằng kỹ thuật những chức năng của hệ thần kinh con
người. Trong quá trình tái tạo không phải tất cả các chức năng của bộ não con ngư ời
đều được tái tạo, mà chỉ có những chức năng cần thiết. Bên cạnh đó còn có nh ững
chức năng mới được tạo ra nhằm giải quyết một bài toán định trước .
Mạng nơ ron bao gồm vô số các nơ ron được liên kết truyền thông với nhau
trong mạng, hình 1.4 là một phần của mạng nơ ron bao gồm hai nơ ron.
Rễ đầu ra của nơ ron 1
được nối với axon
axon

Nhân

Rễ đầu ra

axon

Chiều thông tin
axon được nối với rễ đầu
vào của nơ ron 2
Hình 1.4. Một mạng nơ ron đơn giản gồm hai nơ ron.



20

Nơ ron còn có thể liên kết với các nơ ron khác qua các rễ. Chính vì cách liên
kết đa dạng như vậy nên mạng nơ ron có độ liên kết rất cao.
Các rễ của nơ ron được chia làm hai loại: loại nhận thông tin từ nơ ron khác
qua axon, ta gọi là rễ đầu vào và loại đưa thông tin qua axon tới nơ ron khác gọi là
rễ đầu ra. Một nơ ron có thể có nhiều rễ đầu vào, nhưng chỉ có một rễ đầu ra như
vậy có thể xem nơ ron là mô hình nhiều đầu vào một đầu ra (hình 1.5).
x1
x2
.
.
xn

.
.

Nơron

y

Hình 1.5. Mô hình của một nơ ron
Một tính chất rất cơ bản của mạng nơ ron sinh học là các đáp ứng theo kích
thích có khả năng thay đổi theo thời gian. Các đáp ứng có thể tăng lên, giảm đi hoặc
hoàn toàn biến mất. Qua các nhánh axon liên kết tế bào nơ ron này với các nơ ron
khác, sự thay đổi trạng thái của một nơ ron cũng kéo theo sự thay đổi trạng thái của
những nơ ron khác và do đó làm thay đổi toàn bộ mạng nơ ron. Việc thay đổi trạng
thái của mạng nơ ron có thể thực hiện qua một quá trình “dạy” hoặc do khả năng
“học” tự nhiên.

Sự thay thế những tính chất này bằng một mô hình toán học tương đương
được gọi là mạng nơ ron nhân tạo. Mạng nơ ron nhân tạo có thể được xây dựng theo
nhiều cách khác nhau, vì vậy trong thực tế có nhiều kiểu mạng nơ ron.
Mô hình nơ ron có m đầu vào x1, x2, ...xm và một đầu ra y (hình 1.5), mô hình
này gồm có ba thành phần cơ bản:
+ Các kích thích đầu vào của tế bào nơ ron có thế năng tác động vào màng
membran khác nhau được biểu diễn qua trọng số wi, i = 1, .., m tương ứng với
cường độ kích thích của từng đầu vào. Các kích thích đầu vào được thực hiện qua
bộ tổng f(.), đó là giá trị đo kích thích đầu vào tác động vào tế bào nơ ron.


21

+ Đầu ra của bộ tổng được đưa đến bộ đáp ứng a(.), bộ này không chỉ có chức
năng tạo ra đáp ứng tức thời mà còn có khả năng lưu giữ các đáp ứng theo thời gian.
+ Nơ ron bị kích thích trong thời gian thế năng của màng membran vượt quá
ngưỡng. Quan hệ này được thực hiện nhờ hàm a(.), nó có chức năng xác định phụ
thuộc của tín hiệu ra y vào các kích thích đầu vào.
Cách thành lập nơ ron nhân tạo như vậy tạo ra một độ tự do trong thiết kế. Việc
lựa chọn phép cộng tín hiệu đầu vào và đáp ứng a(.) sẽ cho ra các kiểu mạng nơ ron
nhân tạo khác nhau và tương ứng là các mô hình mạng khác nhau.
x1

wi1

x2
wi2
f(.) a(.)

Σ


yi

i

wim

Đầu ra

xm

Đầu vào
Hình 1.6. Cấu trúc của một nơ ron
Theo hình 1.6. thì tín hiệu đầu ra yi là:
 m

yi (t + 1) = a ∑ wij x j (t ) −  i 
 j =1


(1.28)

Trong đó hàm kích hoạt a(f) ở dạng hàm bước nhẩy:
1 khi f ≥ 0
a( f ) = 
0 khi f < 0

Như vậy yi chỉ có thể có 2 giá trị hoặc bằng 0, hoặc bằng 1.
Các hàm f(.) thường được sử dụng


(1.29)


22

m
f i = neti = ∑ wij x j −  i
j =1

(1.30)

+ Hàm bình phương (Quadratic function):
m
fi = ∑ wij x 2j −  i
j =1

(1.31)

+ Hàm hình cầu (Spherical function):
2
m
fi =  −2 ∑  x j − wij  − i

j =1

(1.32)

Trong đó  và wij là bán kính và tâm của hình cầu.
+ Hàm đa thức (Polynomial function):




m m
fi = ∑ ∑ w x j x + x j j + x k − i
k
k
j =1k =1 ijk

(1.33)

Trong đó wijk là trọng số kết nối phần tử j và k đến phần tử i; j và k là các hệ
số thực không đổi, ở đây i là ngưỡng đặt vào phần tử nơ ron thứ i.
Các hàm kích hoạt thường sử dụng:
+ Hàm bước nhẩy (Step function):
1 if
a ( f ) = 
0 if

f ≥0

(1.34)

f <0

+ Hàm dấu (Hard limiter – threshold function):
 1 if
a ( f ) = sgn ( f ) = 
− 1 if

f ≥0

f <0

(1.35)

+ Hàm dốc (Ramp function):
1

a( f ) =  f
0


if f > 1
if 0 ≤ f ≤ 1 ,
if f < 0

(1.36)

+ Hàm sigmoid đơn cực (Unipolar sigmoid function):
a( f ) =

1
1 + e−f

(1.37)


23

+ Hàm sigmoid lưỡng cực (Bipolar sigmoid function):
a( f ) =


2
−1
1 + e−f

trong đó λ > 0

(1.38)

Hình 1.7 là đồ thị của các hàm nói trên
a

a

1

a
1

1
f

-1
(b)

(a)0

f

f

(c)
0
a

a

f

f

 = 7 5 3 2 1.5 1 0.5

 = 7 5 3 2 1.5 1 0.5

(d)
(e)
Hình 1.7. Các hàm kích hoạt: (a) hàm bước nhẩy; (b) hàm dấu; (c) hàm
dốc; (d) hàm sigmoid đơn cực; (e) hàm sigmoid lưỡng cực.
1.2.2. Phân loại cấu trúc mạng nơ ron
1.2.2.1. Mạng nơ ron 1 lớp:
Hình 1.8, 1.9, 1.10 là một loại liên kết đặc thù của mạng nơ ron. Nơ ron có các
mối liên hệ đến các nơ ron khác nhờ các trọng số. Một lớp nơ ron là một nhóm các
nơ ron mà chúng đều có cùng các trọng số, nhận cùng số tín hiệu đầu vào đồng thời.

x1

w11

y1


w21
w1m

y1

.
.

x2
w2m
wnm
.

x1

Hình 1.8. Mạng nơ ron 1 lớp.

y2
..

xm

x2

y2

Hình 1.9. Mạng nơ ron hồi quy
xm

yn


yn


24

x1
y1

x2

.

.

yn
xm

Hình 1.10. Mạng nơ ron nhiều lớp.
Trong ma trận trọng số, các hàng thể hiện các nơ ron, mỗi hàng thứ j có thể đặt
nhãn như một véc tơ wj của nơ ron thứ j gồm m trọng số wji.
Các trọng số trong cùng một cột thứ j (j = 1, 2, ...., n) đồng thời cùng nhận
một tín hiệu đầu vào xj:
wj = [ wj1, wj2, ..., wjm ]

(1.39)

Tại cùng một thời điểm, véc tơ đầu vào:
x = [ x1, x2, ..., xm ]


(1.40)

có thể là một nguồn bên ngoài đưa tới mạng
1.2.2.2. Mạng nơron truyền thẳng nhiều lớp
Mạng nơ ron nhiều lớp (hình 1.10) được phân chia thành 3 loại:
- Lớp vào là lớp nơ ron đầu tiên nhận tín hiệu vào xi. Mỗi tín hiệu xi được đưa
đến tất cả các nơ ron của lớp đầu vào, chúng được phân phối trên các trọng số đúng
bằng số nơ ron của lớp này. Thông thường, các nơ ron đầu vào không làm biến đổi
các tín hiệu vào xi, tức là chúng không có các trọng số hoặc không có các loại hàm
chuyển đổi nào, chúng chỉ đóng vai trò phân phối các tín hiệu và không đóng vai trò
sửa đổi chúng.
- Lớp ẩn là lớp nơ ron dưới lớp vào, chúng không trực tiếp liên hệ với thế giới
bên ngoài như các lớp nơ ron vào và ra.
- Lớp ra là lớp nơ ron tạo các tín hiệu ra cuối cùng.


25

1.2.3. Các luật học
Trong luận văn này ta chỉ đề cập tới luật học tham số (Parameter Learning): là
các tham số về trọng số cập nhật kết nối giữa các nơ ron.
Giả sử ma trận trọng số bao gồm tất cả các phần tử thích ứng của mạng nơ ron.
Nhiệm vụ của việc học thông số là bằng cách nào đó, tìm đư ợc ma trận chính xác
mong muốn từ ma trận giả thiết ban đầu với cấu trúc của mạng nơ ron có sẵn.
Để làm được việc trên, mạng nơ ron sử dụng các trọng số điều chỉnh, với
nhiều phương pháp học khác nhau có thể tính toán gần đúng ma trận W cần tìm đặc
trưng cho mạng. Có 2 phương pháp học:
- Học có giám sát (Supervised Learning): Là quá trình học có tín hiệu chỉ đạo
bên ngoài d (hình 1.11).
- Học không có giám sát (Unsupervised Learning): Là quá trình học không có

tín hiệu chỉ đạo từ bên ngoài (hình 1.12).
Dạng tổng quát của luật học trọng số của mạng nơ ron cho biết là gia số của
véc tơ wi là wi tỷ lệ với tín hiệu học r và tín hiệu đầu vào x(t):

wi(t) = .r.x(t)

(1.41)

 là một số dương còn gọi là hằng số học, xác định tốc độ học, r là tín hiệu
học, nó phụ thuộc :
r = fr(wi, x, di).
x

(1.42)

Mạng
Nơron

e

y
x
Tín hiệu sai
lệch

Hình 1.11. Học có giám sát.

MạngNơ
ron


y

d

Hình 1.12. Học không giám sát.

Từ (1.41) ta thấy véc tơ trọng số wi = [wi1, wi2, ..., wim]T có số gia tỷ lệ với tín
hiệu vào x và tín hiệu học r. Véc tơ trọng số ở thời điểm (t+1) được tính như sau:
wi(t+1) = wi(t) + fr(wi(t), x(t), d(t)) x(t)

(1.43)


×