i
LỜI CAM ĐOAN
Tôi xin cam đoan tất cả các nội dung của luận văn này hoàn toàn được
hình thành và phát triển từ quan điểm của chính cá nhân tôi, dưới sự hướng
dẫn chỉ bảo của PGS.TS Lê Bá Dũng. Các số liệu kết quả có được trong luận
văn tốt nghiệp là hoàn toàn trung thực.
Học viên
Nguyễn Tô Hoán
ii
LỜI CẢM ƠN
Để hoàn thành chương trình cao học và viết luận văn này, tôi đã nhận
được sự hướng dẫn, giúp đỡ và chỉ bảo nhiệt tình của thầy giáo, cô giáo
Trường Đại học Công nghệ thông tin và Truyền thông- Đại học Thái Nguyên.
Đặc biệt là các thầy của Viện công nghệ thông tin Hà Nội đã tận tình dạy bảo
cho tôi trong suốt thời gian học tập tại trường.
Tôi xin gửi lời cảm ơn đến PGS.TS Lê Bá Dũng đã dành nhiều thời
gian và tâm huyết hướng dẫn tôi hoàn thành luận văn này.
Mặc dù tôi đã cố gắng hoàn thiện luận văn bằng tất cả năng lực của
mình, song không thể tránh khỏi những thiếu sót, rất mong nhận được sự
đóng góp quý báu của các thầy giáo, cô giáo và các bạn.
Tôi xin chân thành cảm ơn!
iii
MỤC LỤC
LỜI CAM ĐOAN ........................................................................................... i
LỜI CẢM ƠN ................................................................................................ ii
MỤC LỤC .................................................................................................... iii
DANH MỤC CÁC HÌNH VẼ ........................................................................ v
DANH MỤC CÁC BẢNG BIỂU .................................................................. vi
DANH MỤC CÁC TỪ VIẾT TẮT .............................................................. vii
MỞ ĐẦU ....................................................................................................... 1
Chương 1. TỔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO VÀ HỆ MỜ.... 3
1.1 Cấu trúc và mô hình mạng nơron .......................................................... 3
1.1.1 Mô hình một nơron sinh học .......................................................... 3
1.1.2 Mô hình một nơron nhân tạo .......................................................... 4
1.2 Cấu tạo và phương thức làm việc của mạng nơron ............................... 7
1.2.1 Mạng nơron truyền thẳng một lớp.................................................. 8
1.2.2 Mạng nơron truyền thẳng nhiều lớp ............................................... 9
1.2.3 Mạng nơron phản hồi ..................................................................... 9
1.2.4 Mạng nơron hồi quy .................................................................... 10
1.3 Các luật học ........................................................................................ 10
1.3.1 Học có giám sát ........................................................................... 11
1.3.2 Học không có giám sát................................................................. 12
1.3.3 Học củng cố ................................................................................. 13
1.4 Hệ mờ và mạng nơron ........................................................................ 14
1.4.1 Kiến trúc của hệ mờ tổng quát ..................................................... 14
1.4.2 Sự kết hợp giữa logic mờ và mạng neural .................................... 20
1.5 Kết luận chương ................................................................................. 22
Chương 2. MÔ HÌNH MẠNG ANFIS VÀ KHẢ NĂNG ỨNG DỤNG ....... 22
2.1 Hệ suy diễn mờ dựa trên mạng thích nghi........................................... 23
iv
2.1.1 Các mô hình kết hợp giữa hệ mờ và mạng nơron ......................... 23
2.1.2 Luật mờ if then và hệ thống suy diễn mờ ..................................... 24
2.1.3 Mạng thích nghi ........................................................................... 26
2.1.4 Cấu trúc mạng ANFIS ................................................................. 27
2.2 Thuật toán ANFIS .............................................................................. 29
2.2.1 Thuật toán học lan truyền ngược .................................................. 29
2.2.2 Thuật toán học lai ........................................................................ 35
2.3 Khả năng ứng dụng của mạng ANFIS ................................................ 37
Chương 3. ỨNG DỤNG MÔ HÌNH MẠNG ANFIS TRONG BÀI TOÁN
PHÂN TÍCH ĐÁNH GIÁ DỰ BÁO MỰC NƯỚC VÀ THỬ NGHIỆM ...... 39
3.1 Bài toán dự báo mực nước .................................................................. 39
3.1.1 Một số khái quát cơ bản về khí hậu, môi trường tự nhiên ............ 39
3.1.2 Sự cần thiết của việc dự báo mực nước ........................................ 41
3.1.3 Cần phải thích nghi ...................................................................... 43
3.2 Ứng dụng mạng ANFIS trong dự báo mực nước ................................ 45
3.2.1 Thiết kế suy diễn nơron mờ thích nghi ......................................... 45
3.2.2 Xây dựng mô hình ANFIS cho xử lý số liệu ................................ 50
3.3 Đánh giá kết quả thực hiện chương trình ............................................ 57
3.4 Kết luận và hướng phát triển............................................................... 58
3.4.1 Kết luận ....................................................................................... 58
3.4.2. Hướng phát triển ......................................................................... 59
TÀI LIỆU THAM KHẢO ............................................................................ 60
v
DANH MỤC CÁC HÌNH VẼ
Hình 1.1. Cấu trúc của một nơron sinh học điển hình ..................................... 3
Hình 1.2. Mô hình một nơron nhân tạo ........................................................... 4
Hình 1.3. Đồ thị các dạng hàm truyền ............................................................ 7
Hình 1.4. Mạng truyền thẳng một lớp ............................................................. 8
Hình 1.5. Mô hình cấu trúc của mạng nơron truyền thẳng nhiều lớp .............. 9
Hình 1.6. Mạng nơron phản hồi ...................................................................... 9
Hình 1.7. Mạng hồi quy một lớp có nối ngược ............................................. 10
Hình 1.8. Mạng quy hồi nhiều lớp có nối ngược........................................... 10
Hình 1.9. Sơ đồ học tham số có giám sát ...................................................... 12
Hình 1.10. Sơ đồ học tham số không có giám sát ......................................... 13
Hình 1.11. Kiến trúc của hệ mờ tổng quát .................................................... 14
Hình 1.12. Hệ mờ nhiều đầu vào - một đầu ra .............................................. 15
Hình 1.13. Hàm thuộc hệ mờ một đầu vào – một luật ................................... 17
Hình 1.14. Hàm thuộc hệ mờ hai đầu vào - một luật..................................... 18
Hình 1.15. Mô hình hệ mờ - neural............................................................... 22
Hình 2.1. Hệ thống suy luận mờ ................................................................... 25
Hình 2.2. Mạng thích nghi ............................................................................ 26
Hình 2.3. Cấu trúc của ANFIS...................................................................... 27
Hình 2.4. Mạng ba lớp lan truyền ngược ...................................................... 29
Hình 3.1. Hình ảnh đập Hồ thủy điện Thác Bà ............................................. 43
Hình 3.2. Các phương trình minh họa cho việc thực thi mạng ...................... 50
Hình 3.3. Biểu diễn đồ thị các dữ liệu vào ra ................................................ 51
Hình 3.4. Biểu diễn kết quả mực nước thực tế dự báo qua mô hình A .......... 52
Hình 3.5. Biểu diễn kết quả mực nước thực tế dự báo qua mô hình B .......... 52
Hình 3.6. Biểu diễn kết quả mực nước thực tế dự báo qua mô hình C .......... 53
Hình 3.7. Biểu diễn kết quả mực nước thực tế dự báo qua mô hình D .......... 54
Hình 3.8. Biểu diễn kết quả mực nước thực tế dự báo qua mô hình E .......... 54
vi
DANH MỤC CÁC BẢNG BIỂU
Bảng 3.1. Lưu lượng dòng chảy đến các hồ sẽ biến đổi chậm trong 12 tháng45
Bảng 3.3. Các mô hình dự báo đầu ra mực nước hồ với các đầu vào khác nhau 51
Bảng 3.4. Biểu diễn số liệu đo thực và các dự báo theo mô hình bảng 3.3 .... 55
Bảng 3.5. Mô hình dự báo theo ANFIS so sánh với các số liệu dự báo......... 56
của hồ Thác Bà theo tài liệu công bố ............................................................ 56
vii
DANH MỤC CÁC TỪ VIẾT TẮT
ANN
ANFIS
MIMO
MISO
LSE
Artificial Neural Network
Mạng nơron nhân tạo
Adaptive Neural Fuzzy Insference System
Hệ suy luận mờ
Multi Input Multi Output
Hệ mờ nhiều đầu vào - nhiều đầu ra
Multi Input Single Output
Hệ mờ nhiều đầu vào - một đầu ra
Least Squara Error
Phương pháp ước lượng sai số bình phương cực tiểu
1
MỞ ĐẦU
Ngày nay, các mạng nơron nhân tạo, Artificial Neural Network (ANN)
gọi tắt là mạng nơron đã được ứng dụng thành công, các nhà khoa học và các
kĩ sư trong những năm gần đây đã có nhiều nghiên cứu ứng dụng trong việc
xấp xỉ hàm, nhận dạng và điều khiển, xử lý ảnh, dự đoán chuỗi thời gian,…
Hệ mờ nơ ron là một sự kết hợp giữa logic mờ và và khả năng học của
mạng nơron. Một trong những sự kết hợp đó là hệ mờ nơron thích nghi
(ANFIS - Adaptive Neuro Fuzzy Inference System). Hệ thống này có khả năng
tối ưu hóa hệ mờ dựa trên các tập mẫu có sẵn. Các hệ mờ - nơron và các công
cụ thống kê là các phương pháp khác nhau được sử dụng trong các bài toán dự
báo như dự báo các chỉ số kinh tế, tài chính. Các mạng nơron chứa một số
lượng lớn các thông số đầu vào cho phép việc học bên trong các quan hệ không
tuyến tính hiện tại trong chuỗi thời gian, tăng cường khả năng dự báo.
Trong những năm gần đây, nhiều bài toán dự báo được các chuyên gia
đã tin tưởng và sử dụng các hệ thống thông minh khác nhau, trong đó Mạng
Nơron nhân tạo và hệ suy luận mờ - nơron (ANFIS) cũng được ứng dụng
trong lĩnh vực này. Bài toán dự báo mực nước hồ thủy điện là một trong
những yêu cầu của sự phát triển kinh tế xã hội của tỉnh Yên Bái.
Trong luận văn này, mực nước của hồ thủy điện được dự báo bằng cách
sử dụng hệ suy luận mờ dựa trên mạng thích nghi (ANFIS), luận văn bao gồm
các nội dung sau:
Chương 1. Tổng quan về mạn nơron nhân tạo và hệ mờ
Chương 2. Mô hình mạng Anfis và khả năng ứng dụng
Chương 3. Ứng dụng mô hình mạng Anfis trong bài toán phân tích
đánh giá dự báo mực nước và thử nghiệm
Do các yêu cầu trên nên em chọn làm đề tài “Mạng ANFIS và ứng
2
dụng cho dự báo mực nước hồ thủy điện Thác Bà” cho luận văn tốt nghiệp
của mình. Đề tài này, em trình bày một hệ thống suy luận mờ dựa trên mạng
thích nghi ANFIS để dự báo mực nước lâu dài, dự báo mực nước hàng năm,
phục vụ cho phát triển kinh tế xã hội của tỉnh Yên Bái.
3
Chương 1.
TỔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO VÀ HỆ MỜ
1.1 Cấu trúc và mô hình mạng nơron
1.1.1 Mô hình một nơron sinh học
Qua quá trình nghiên cứu về bộ não, người ta thấy rằng: bộ não con
người bao gồm khoảng 1011 nơron tham gia vào khoảng 1015 kết nối trên các
đường truyền. Mỗi đường truyền này dài khoảng hơn một mét. Các nơron có
nhiều đặc điểm chung với các tế bào khác trong cơ thể, ngoài ra chúng còn có
những khả năng mà các tế bào khác không có được, đó là khả năng nhận, xử
lý và truyền các tín hiệu điện hóa trên các đường mòn nơron, các con đường
này tạo nên hệ thống giao tiếp của bộ não.
Hình 1.1. Cấu trúc của một nơron sinh học điển hình
Mỗi nơron sinh học có 3 thành phần cơ bản:
• Các nhánh vào hình cây (dendrites)
• Thân tế bào (cell body)
4
• Sợi trục ra (axon)
Các nhánh hình cây truyền tín hiệu vào đến thân tế bào. Thân tế bào
tổng hợp và xử lý cho tín hiệu đi ra. Sợi trục truyền tín hiệu ra từ thân tế bào
này sang nơron khác. Điểm liên kết giữa sợi trục của nơron này với nhánh
hình cây của nơron khác gọi là synapse. Liên kết giữa các nơron và độ nhạy
của mỗi synapse được xác định bởi quá trình hóa học phức tạp. Một số cấu
trúc của nơron được xác định trước lúc sinh ra. Một số cấu trúc được phát
triển thông qua quá trình học. Trong cuộc đời cá thể, một số liên kết mới được
hình thành, một số khác bị hủy bỏ.
Như vậy nơron sinh học hoạt động theo cách thức sau: nhận tín hiệu
đầu vào, xử lý các tín hiệu này và cho ra một tín hiệu output. Tín hiệu output
này sau đó được truyền đi làm tín hiệu đầu vào cho các nơron khác.
Dựa trên những hiểu biết về nơron sinh học, con người xây dựng nơron
nhân tạo với hy vọng tạo nên một mô hình có sức mạnh như bộ não.
1.1.2 Mô hình một nơron nhân tạo
Mô hình toán học của mạng nơron sinh học được đề xuất bởi
McCulloch và Pitts, thường được gọi là nơron M-P, ngoài ra nó còn được gọi
là phần tử xử lý và được ký hiệu là PE (Processing Element).
Mô hình nơron có m đầu vào x1, x2,…,xm, và một đầu ra yi như sau:
Hình 1.2. Mô hình một nơron nhân tạo
5
Giải thích các thành phần cơ bản:
Tập các đầu vào: Là các tín hiệu vào (input signals) của nơron, các
tín hiệu này thường được đưa vào dưới dạng một vector m chiều.
Tập các liên kết (các trọng số): Mỗi liên kết được thể hiện bởi một
trọng số (thường được gọi là trọng số liên kết - Synaptic weight). Trọng số
liên kết giữa tín hiệu vào thứ j với nơron i thường được ký hiệu là wij. Thông
thường, các trọng số này được khởi tạo một cách ngẫu nhiên ở thời điểm khởi
tạo mạng và được cập nhật liên tục trong quá trình học mạng.
Bộ tổng (Hàm tổng - Summing function): Thường dùng để tính tổng
của tích các đầu vào với trọng số liên kết của nó.
Ngưỡng (còn gọi là một độ lệch - bias): Ngưỡng này thường được
đưa vào như một thành phần của hàm truyền.
Hàm truyền (Transfer function): Hàm này dùng để giới hạn phạm vi
đầu ra của mỗi nơron. Nó nhận đầu vào là kết quả của hàm tổng và ngưỡng đã
cho. Thông thường, phạm vi đầu ra của mỗi nơron được giới hạn trong đoạn
[0,1] hoặc [-1,1]. Các hàm truyền rất đa dạng, có thể là các hàm tuyến tính hoặc
phi tuyến. Việc lựa chọn hàm truyền tùy thuộc vào từng bài toán và kinh
nghiệm của người thiết kế mạng.
Đầu ra: Là tín hiệu đầu ra của một nơron, với mỗi nơron sẽ có tối đa
một đầu ra.
Xét về mặt toán học, cấu trúc của một nơron i được mô tả bằng cặp
biểu thức sau:
n
yi f (neti i ) và neti wij x j
j 1
(1.1)
6
Trong đó:
x1, x2, …xm là các tín hiệu đầu vào, còn wi1, wi2,…,wim là các trọng số
kết nối của nơron thứ i, neti là hàm tổng, f là hàm truyền, θi là một ngưỡng, yi
là tín hiệu đầu ra của nơron.
Như vậy, tương tự như nơron sinh học, nơron nhân tạo cũng nhận các
tín hiệu đầu vào, xử lý (nhân các tín hiệu này với trọng số liên kết, tính tổng
các tích thu được rồi gửi kết quả đến hàm truyền), và cho một tín hiệu đầu ra
(là kết quả của hàm truyền).
Hàm truyền có thể có các dạng sau:
1 khi x 0
0 khi x 0
Hàm bước: y
(1.2)
Hàm giới hạn chặt: (hay còn gọi là hàm bước)
1 khi x 0
y sgn( x)
1 khi x 0
(1.3)
Hàm bậc thang:
1 khi x 1
y sgn( x) x khi 0 x 1
0 khi x 0
(1.4)
Hàm ngưỡng đơn cực:
y
1
với >0
1 e x
(1.5)
Hàm ngưỡng hai cực:
y
2
1 với >0
1 e x
(1.6)
7
Đồ thị các dạng hàm truyền được biểu diễn như sau:
Hình 1.3. Đồ thị các dạng hàm truyền
1.2 Cấu tạo và phương thức làm việc của mạng nơron
Mạng nơron nhân tạo (Artificial Neural Network) là một cấu trúc mạng
được hình thành nên bởi số lượng các nơron nhân tạo liên kết với nhau. Mỗi
nơron có các đặc tính đầu vào, đầu ra và thực hiện một số chức năng tính toán
cục bộ.
Với việc giả lập các hệ thống sinh học, các cấu trúc tính toán, mạng
nơron có thể giải quyết được các lớp bài toán nhất định như: Bài toán xếp loại,
bài toán lập lịch, bài toán tìm kiếm, bài toán nhận dạng mẫu... Các bài toán
phức tạp cao, không xác định. Tuy nhiên, sự liên kết giữa một bài toán bất kỳ
trong thực tế với một giải pháp mạng nơron lại là một việc không dễ dàng.
Xét một cách tổng quát, mạng nơron là một cấu trúc xử lý song song
thông tin phân tán mang các đặc tính nổi bật sau:
- Là một mô hình tính toán dựa trên bản chất của nơron
- Bao gồm một số lượng rất lớn các nơron liên kết với nhau
- Mạng nơron có khả năng học, khái quát hóa tập dữ liệu học thông qua
8
việc gán và hiệu chỉnh các trọng số liên kết.
- Tổ chức theo kiểu tập hợp mang lại cho mạng nơron khả năng tính
toán rất lớn, trong đó không có rron nào mang thông tin riêng biệt.
1.2.1 Mạng nơron truyền thẳng một lớp
Mô hình mạng nơron truyền thẳng một lớp là mô hình liên kết cơ bản và
đơn giản nhất. Các nơron tổ chức lại với nhau tạo thành một lớp, đường truyền
tín hiệu được truyền theo một hướng nhất định nào đó. Các đầu vào được nối với
các nơron theo các trọng số khác nhau, sau quá trình xử lý cho ra một chuỗi các
tín hiệu ra. Mạng nơron là mô hình LTU thì nó được gọi là mạng Perception, còn
mạng nơron là mô hình LGU thì nó được gọi là mạng Adaline.
Hình 1.4. Mạng truyền thẳng một lớp
Với mỗi giá trị đầu vào x = [ x1,x2,....,xn]T. Qua quá trình xử lý của
mạng ta sẽ thu được một bộ tương ứng các giá trị đầu ra là y = [y1,y2,...,yn]T
được xác định như sau:
m
yi fi ( wij x j i ).
i 1, n
j 1
Trong đó:
m : Số tín hiệu vào
n : Số tín hiệu ra
WiT = [ wi1, wi2,...,win]T là véc tơ trọng số của nơron thứ i
f i : Hàm kích hoạt các nơron thứ i
i : Là ngưỡng của nơron thứ i
(1.7)
9
1.2.2 Mạng nơron truyền thẳng nhiều lớp
Với mạng nơron truyền thẳng một lớp ở trên khi phân tích một bài toán
phức tạp sẽ gặp rất nhiều khó khăn, để khắc phục vấn đề này người ta đưa ra
mô hình mạng nơron truyền thẳng nhiều lớp bằng việc kết hợp với một số lớp
nơron lại với nhau. Lớp nhận tín hiệu vào gọi là lớp vào, lớp đưa ra tín hiệu ra
của mạng được gọi là lớp ra. Các lớp ở giữa lớp vào và lớp ra được gọi là các
lớp ẩn.
Hình 1.5. Mô hình cấu trúc của mạng nơron truyền thẳng nhiều lớp
1.2.3 Mạng nơron phản hồi
Kiến trúc phản hồi (Feedback architecture): Là kiểu kiến trúc mạng có
các kết nối từ nơron đầu ra tới nơron đầu vào. Mạng lưu lại các trạng thái
trước đó, và trạng thái tiếp theo không chỉ phụ thuộc vào các tín hiệu đầu vào
mà còn phụ thuộc vào các trạng thái trước đó của mạng. Mạng Hopfield thuộc
loại này.
Hình 1.6. Mạng nơron phản hồi
10
1.2.4 Mạng nơron hồi quy
Mạng quy hồi một lớp có nối ngược
Hình 1.7. Mạng hồi quy một lớp có nối ngược
Mạng quy hồi nhiều lớp có nối ngược
Hình 1.8. Mạng quy hồi nhiều lớp có nối ngược
1.3 Các luật học
Mạng nơron có một số ưu điểm so với máy tính truyền thống. Cấu trúc
song song của mạng nơron rất thích hợp cho nhưng ứng dụng đòi hỏi tốc độ
nhanh theo thời gian thực. Khả năng huấn luyện của mạng nơron có thể khai
thác để phát triển hệ học thích nghi. Mặt khác, với khả năng tổng quát hóa của
mạng nơron, nó có thể áp dụng để điều khiển nhiều tham số phức tạp đồng
thời từ đó giải quyết dễ dàng một số bài toán NP - đầy đủ (NP - Complete).
Các luật học đóng vai trò quan trọng trong việc xác định một mạng nơron nhân tạo. Một cách đơn giản về khái niệm học của mạng nơron là cập
nhật trọng số trên cơ sở các mẫu. Theo nghĩa rộng thì học có thể được chia
thành hai loại: Học tham số và học cấu trúc.
11
Trong luận văn chúng ta chỉ đề cập tới luật học tham số (Parameter
Learning): là các tham số về trọng số cập nhật kết nối giữa các nơron.
Các thủ tục học này nhằm tìm kiếm ma trận trọng số sao cho mạng có
khả năng đưa ra dự báo sát với thực tế. Dạng chung của luật học tham số có
thể được mô tả như sau:
Wij rx j , i 1, N , j 1, M
(1.8)
Trong đó:
Wij : Là sự thay đổi trọng số liên kết từ nơron j đến nơron i
x j : Là tín hiệu vào nơron j
: Là tốc độ học, nằm trong khoảng (0,1)
r: là hằng số học
Vấn đề đặt ra ở đây là tín hiệu học r được sinh ra như thế nào để hiệu
chỉnh trọng số của mạng.
Có 2 phương pháp học:
1.3.1 Học có giám sát
Là quá trình học dựa vào sai số giữa đầu ra thực và đầu ra mong muốn
để làm cơ sở cho việc hiệu chỉnh trọng số. Sai số này chính là hằng số học r.
Luật học điển hình của nhóm này là luật học Della của Widrow (1962) nêu ra
đầu tiên dùng xấp xỉ trọng số của Adaline dựa trên nguyên tắc gradient.
Trong nhóm luật học này cũng cần kể đến luật học Perceptron của
Rosenblatt (1958). Về cơ bản luật học này thay đổi các giá trị trọng trong thời
gian học, còn Perceptron thì thêm hoặc bỏ trọng tùy theo giá trị sai số là
dương hay âm.
Một loạt các luật học khác cũng được dựa trên tư tưởng này. Luật oja là
cải tiến và nâng cấp của luật Delta. Luật truyền ngược là luật mở rộng của
luật Delta cho mạng nhiều lớp. Đối với mạng truyền thẳng thường sử dụng
12
luật truyền ngược để chỉnh trọng số với tín hiệu chỉ đạo từ bên ngoài và người
ta gọi mạng này là mạng lan truyền ngược.
Tín hiệu vào
Tín hiệu ra
Mạng nơron
Sản sinh sai số
Tín hiệu ra mong muốn
Hình 1.9. Sơ đồ học tham số có giám sát
1.3.2 Học không có giám sát
Luật học này sử dụng đầu ra của mạng làm cơ sở để hiệu chỉnh các
trọng số liên kết. Hay trong luật này chính là tín hiệu ra của mạng. Điển hình
là luật Hebb (1949) thường dùng cho các mạng tự liên kết, luật LVQ
(Learning Vector Quantization) dùng cho mạng tự tổ chức một lớp thuộc lớp
mạng ánh xạ đặc trưng của Kohonen.
Luật học Hebb là luật sinh học xuất phát từ tiên đề của Hebb cho rằng:
Giữa hai nơron có quan hệ và có thay đổi thế năng mạng thì giữa chúng có sự
thay đổi trọng số liên kết. Nói cách khác, trọng số được điều chỉnh theo mối
tương quan trước và sau, nghĩa là:
Wij yi x j , i 1, N , j 1, M
(1.9)
Trong đó:
Wij : Là sự thay đổi trọng số liên kết từ nơron j đến nơron i
x j : Là tín hiệu vào nơron j
yi : Là tín hiệu ra của nơron i
: Là tốc độ học, nằm trong khoảng (0,1)
Luật Hebb giải thích việc chỉnh trọng số trong phạm vi cục bộ của
13
mạng mà không cần tín hiệu chỉ đạo từ bên ngoài. Hopfield cũng cải tiến luật
Hebb cho các mạng tự liên kết thành 16 dạng khác nhau theo kiểu luật Hebb,
luật đối Hebb, luật Hopfield...
Như vậy, ứng với mỗi nhóm mạng thường áp dụng một luật học nhất
định. Nếu tồn tại hàng chục loại mạng khác nhau thì các luật học dùng trong
mạng nơron có thể tăng lên rất nhiều lần.
Đối với mạng phản hồi thường sử dụng luật Hebb và các luật cải tiến
của nó để chỉnh trọng số mà không cần tín hiệu chỉ đạo từ bên ngoài.
Tín hiệu
vào
Tín hiệu ra
Mạng nơron
Hình 1.10. Sơ đồ học tham số không có giám sát
1.3.3 Học củng cố
Tín hiệu tăng cường có thể lấy từ môi trường bên ngoài, nhưng tín hiệu
này không được đầy đủ mà chỉ có tính chất kiểm tra quá trình tốt hay xấu.
Học củng cố cũng là một dạng của học giám sát, bởi vì vẫn nhận được một số
tín hiệu từ bê ngoài. Nhưng tín hiệu phản hồi chỉ mang tính chất đánh giá hơn
là mang tính chất chỉ dẫn. Nó cho biết mức độ tốt hay xấu của một đầu ra cụ
thể. Tín hiệu củng cố bên ngoài thường được xử lý bằng máy phát tín hiệu
đánh giá để tạo ra nhiều hơn nữa các thông tin tín hiệu đánh giá, sau đó dùng
để điều chỉnh các trọng số với mục đích đạt được tín hiệu đánh giá tốt hơn.
14
1.4 Hệ mờ và mạng nơron
1.4.1 Kiến trúc của hệ mờ tổng quát
Một hệ mờ tiêu biểu có kiến trúc như hình vẽ:
Cơ sở
luật mờ
Tham khảo
luật mờ
Đầu vào
(tập mờ)
Đầu vào
(số)
Bộ
mờ hóa
Đầu ra
(số)
Đầu ra
(tập mờ)
Bộ suy
diễn mờ
Bộ
giải mờ
Hình 1.11. Kiến trúc của hệ mờ tổng quát
Thành phần trung tâm của hệ mờ cơ sở luật mờ (fuzzy rule base). Cơ sở
luật mờ bao gồm các luật mờ if-then biểu diễn tri thức của chuyên gia trong lĩnh
vực nào đó. Trong trường hợp một hệ điều khiển mờ cụ thể thì cơ sở luật mờ
chính là tri thức và kinh nghiệm của các chuyên gia trong việc điều khiển khi chưa
áp dụng hệ mờ [2].
Thành phần quan trọng kế tiếp là bộ suy diễn mờ (fuzzy inference
engine). Nhiệm vụ của bộ phận này là kết hợp các luật trong cơ sở luật mờ, áp
dụng vào tập mờ đầu vào theo các phương pháp suy diễn mờ để xác định tập
mờ đầu ra.
Dữ liệu đầu vào của hệ điều khiển mờ là các tín hiệu do các bộ phận
cảm biến môi trường cung cấp sau khi đã số hóa nên có tính chất rõ (khái
niệm rõ ở đây có nghĩa là các tín hiệu đó không phải là các tập mờ, chứ không
có nghĩa là các tín hiệu không có nhiễu). Vì vậy cần phải có bộ mờ hóa
(fuzzier) để chuyển các dữ liệu số đầu vào thành các tập mờ để bộ suy diễn
mờ có thể thao tác được.
Dữ liệu đầu ra của bộ suy diễn mờ ở dạng các tập mờ sẽ được bộ giải
mờ (defuzzier) chuyển thành tín hiệu số trước khi truyền đến các cơ quan
15
chấp hành như tay máy, công tắc, van điều khiển...
Do các dữ liệu đầu vào và đầu ra được số hóa nên ta chỉ cần xem xét
các hệ mờ làm việc với các biến số. Trường hợp tổng quát, hệ mờ nhận một
vector n chiều ở đầu vào và cho ra một vector n chiều ở đầu ra. Hệ mờ như
thế được gọi là hệ mờ nhiều đầu vào - nhiều đầu ra (MIMO). Nếu m bằng 1,
ta có hệ mờ nhiều đầu vào - một đầu ra (MISO). Một hệ mờ nhiều đầu vào nhiều đầu ra có thể phân tích thành nhiều hệ nhiều đầu vào - một đầu ra. Do
đó ta chỉ cần tìm hiểu kĩ về hệ mờ nhiều đầu vào một đầu ra với các biến số.
Khi chỉ nói về hệ mờ nhiều - một thì ta sẽ ngầm hiểu là một hệ mờ
n
nhiều đầu vào - một đầu ra với các biến số. Kí hiệu U U i R n , V R ,
i 1
trong đó U i là miền xác định của các biến vào i, i = 1..n và V là miền giá trị
của biến ra y, ta có mô hình hệ mờ nhiều đầu vào - một đầu ra như hình vẽ:
x U1
x U1
x U1
Hệ mờ
nhiều đầu vào
- một đầu ra
y V
Hình 1.12. Hệ mờ nhiều đầu vào - một đầu ra
1.4.1.1 Cơ sở luật mờ
Cơ sở luật mờ của hệ mờ n đầu vào - một đầu ra gồm m luật if -then mờ có
dạng:
If “x1 là Ak1” và “x2 là Ak2” và…và “xn là Akn” then “y là Bk”, k
= 1…m (*).
Trong đó k là chỉ số của luật (luật thứ k trong tập luật), xi là các biến
đầu vào, Aki là các tập mờ trên Ui (i=1..n), y là biến đầu ra và Bk là tập mờ
16
trên V (k=1..m).
Các luật mờ dạng (*) được gọi là các luật If-then mờ chuẩn tắc. Các luật
mờ không chuẩn tắc có thể biến đổi để đưa về dạng chuẩn tắc tương đương.
Có nhiều phương pháp để xác định các luật mờ để đưa vào cơ sở luật
mờ. Các phương pháp thông dụng là nhờ các chuyên gia trong lĩnh vực áp
dụng, hoặc từ quan sát, thực nghiệm thống kê để có được các tập dữ liệu mẫu
đầu vào và ra tương ứng, từ đó dùng các kĩ thuật khai dữ liệu để rút ra các
luật.
1.4.1.2 Bộ suy diễn mờ
Phương pháp thiết kế bộ suy diễn trong trường hợp cơ sở luật mờ gồm
m luật if-then mờ chuẩn tắc, nhiều đầu vào và một đầu ra (MISO)
Các luật if-then trong thực tế thì thường được tính bằng công thức
Mamdani max-min hoặc max-tích (max-prod).
Ta xét kĩ kiến trúc bộ suy diễn mờ sử dụng phương pháp suy diễn maxmin. Khi chuyển qua phương pháp suy diễn max-tich thì chỉ cần thay min
bằng phép nhân trong các công thức.
Cho A, A’, B lần lượt là các tập mờ trên vũ trụ X, X, Y. Luật if A then
B được thể hiện như một quan hệ mờ R = A x B trên X x Y. Khi đó tập mờ B’
suy ra từ A’ được xác định bởi:
B ' ( y ) max min A' x , R x, y
(1.10)
Trường hợp một đầu vào và một luật
Ta có: B ' ( y ) maxmin A' ( x), R ( x, y )
x
maxmin A' ( x), A ( x), B ( y )
x
min{maxmin A' x , A x , B y }
x
min{max A A x , B y
x
17
minhA' A , B ( y )
Trong đó: hA' A là độ cao của tập mờ A’ A
Hình 1.13. Hàm thuộc hệ mờ một đầu vào – một luật
Trường hợp hai đầu vào và một luật
Đây là trường hợp luật được phát biểu “Nếu x là A và y là B thì z là C”
Luật: Nếu x là A và y là B thì z là C
Sự kiện: x là A’ và y là B’
Kết luận: z là C’
Luật mờ với điều kiện có 2 mệnh đề như trên có thể biểu diễn ở dạng A
x B => C. Suy luận tương tự trường hợp một đầu vào và một luật ta có:
C ' ( z ) minhA'xB ' AxB , C ( z )
(1.11)
Mà A’xB’ AxB = (A’ A) x (B’ B) nên hA'xB' AxB minhA'xA , hB 'xB
Vậy C ' ( z ) minhA' A , hB ' B , C ( z )
(1.12)
Suy rộng cho các trường hợp nhiều đầu vào Ai, i = 1..n và một luật
Luật: Nếu x1 là A1 và x2 là A2 và…và xn là An thì z là C
Sự kiện: x1 là A1’ và x2 là A2’ và…và xn là An’
Kết luận: z là C’
C ' ( z ) min{(min hA'i Ai ), C ( z )}
i 1..n
(1.13)
18
Minh họa:
Hình 1.14. Hàm thuộc hệ mờ hai đầu vào - một luật
Trường hợp nhiều đầu vào và nhiều luật
Trong trường hợp nhiều đầu vào và nhiều luật, ta tính kế quả đầu ra cho
từng luật sau đó kết quả của hệ sẽ là các phép giao hoặc hợp các kết quả riêng
đó tùy theo bảo chất của hệ là hội hay tuyển các luật.
Nếu trong một luật có dạng: “nếu x là A hoặc y là B thì z là C” ta
tách thanh hai luật riêng biệt “Nếu x là A thì z là C” và “Nếu x là B thì z là
C” để tính.
1.4.1.3 Bộ suy diễn mờ
Mờ hóa là quá trình biến đổi một vector x = (x1, x2,…,xn) U R n
thành một tập mờ A’ trên U. A’ sẽ là đầu vào cho bộ suy diễn mờ. Mờ hóa
phải thỏa mãn các tiêu chuẩn sau:
Điểm dữ liệu x phải có độ cao phụ thuộc vào A’
Vector x thu nhận từ môi trường ngoài có thể sai lệch do nhiễu nên
A’ phải phản ánh được tính gần đúng của dữ liệu thực.
Hiệu quả tính toán: Đơn giản cho các tính toán trong bộ suy diễn.
Sau đây là một số phương pháp mờ hóa thông dụng.
+ Mờ hóa đơn trị
Mỗi điểm dữ liệu x được xem như một tập mờ đơn trị tức là tập mờ A
có hàm thuộc xác định như sau: