Tải bản đầy đủ (.pdf) (65 trang)

Lai ghép mạng nơron Hopfield và giải thuật di truyền giải bài toán tối ưu ràng buộc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.08 MB, 65 trang )


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ




PHAN VIỆT CƯỜNG




LAI GHÉP NƠRON HOPFIELD VÀ GIẢI
THUẬT DI TRUYỀN GIẢI BÀI TOÁN
TỐI ƯU RÀNG BUỘC



LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN


Chuyên ngành:
Mã số: 1.01.10

Người hướng dẫn khoa học:
PGS.TS ĐẶNG QUANG Á




HÀ NỘI - 2007


3
MỤC LỤC
LỜI CẢM ƠN 1
LỜI CAM ĐOAN 2
MỤC LỤC 3
DANH MỤC CÁC TỪ VIẾT TẮT TRONG LUẬN VĂN 5
DANH MỤC CÁC HÌNH VẼ TRONG LUẬN VĂN 6
DANH MỤC CÁC BẢNG TRONG LUẬN VĂN 7
MỞ ĐẦU 8
Chƣơng 1. Tổng quan về mạng nơ ron 10
1.1. Giới thiệu về mạng nơ ron 10
1.1.1. Lịch sử phát triển của mạng nơ ron 10
1.1.2. Mô hình mạng nơ ron nhân tạo 11
1.2. Phạm vi ứng dụng của mạng nơ ron 19
1.2.1. Những bài toán thích hợp 19
1.2.2. Các lĩnh vực ứng dụng mạng nơ ron 22
1.2.3. Ƣu và nhƣợc điểm của mạng nơ ron 23
1.3. Mạng Hopfield 23
1.3.1. Mạng Hopfield rời rạc 24
1.3.2. Mạng Hopfield liên tục: 26
1.3.3. Mạng Hopfield với bài toán tối ƣu 27
1. 4. Kết luận 30
Chƣơng 2. Giải thuật di truyền và tính toán tiến hóa 31
2. 1. Giải thuật di truyền (Genetic Algorithms – GAs) 31
2.1.1 Giải thuật di truyền cổ điển 31
2.2 Tính toán tiến hóa 36
2.3. Áp dụng chƣơng trình tiến hóa giải bài toán Knapsack0_1 37
2.3.1. Phát biểu bài toán. 37
2.3.2. Thiết kế thuật toán 38
2.3. Ứng dụng của giải thuật di truyền 40

4
2.4. Ƣu nhƣợc điểm của giải thuật di truyền 40
Chƣơng 3. Bài toán kết nối các thiết bị đầu cuối tới các bộ tập trung. 42
3.1. Giới thiệu 42
3.2. Xác định bài toán 43
3.2.1 Phân tích các định nghĩa bài toán: 44
3.2.2. Ví dụ về bài toán TA 45
3.2.3. Các bài toán liên quan khác. 46
3.3 Các cách tiếp cận trƣớc đây 47
3.3.1 Giải thuật tham ăn 47
3.3.2 Giải thuật di truyền 48
3.3.3 Cách tiếp cận lai ghép giữa mạng nơ ron và giải thuật di truyền. 49
Chƣơng 4. Kết quả thực nghiệm và đánh giá 55
4.1 Bộ dữ liệu chuẩn 55
4.2 Kết quả thực nghiệm 56
4.2.1 Giải thuật di truyền 56
4.2.2. Giải thuật di truyền I 56
4.2.3. Giải thuật di truyền II 57
KẾT LUẬN 58
TÀI LIỆU THAM KHẢO 59
PHỤ LỤC 62

5
DANH MỤC CÁC TỪ VIẾT TẮT TRONG LUẬN VĂN

BP
Bin Packing
EC
Evolutionary Computation
GA

Genetic Algorithm
TA
Terminal Assignment
TSAP
Task Assignment Processor
6
DANH MỤC CÁC HÌNH VẼ TRONG LUẬN VĂN

Hình 1.1
Mô hình nơ ron sinh học
Hình 1.2
Mô hình một nơ ron
Hình 1.3
Mạng nơ ron truyền thẳng một lớp
Hình 1.4
Mạng truyền thẳng nhiều lớp
Hình 1.5
Mạng hồi qui một lớp có nối ngƣợc
Hình 1.6
Mạng hồi quy nhiều lớp có nối
Hình 1.7
Mô hình mạng Hopfield
Hình 1.8
Biểu diễn lời giải bài toán cặp sách có trọng số
Hình 2.1
Sơ đồ tổng quát của giải thuật di truyền
Hình 3.1
Biểu diễn lời giải bài toán TA

7

DANH MỤC CÁC BẢNG TRONG LUẬN VĂN

Bảng 3.1
Dung lƣợng và toạ độ của thiết bị đầu cuối.
Bảng 3.2
Dung lƣợng và toạ độ của các bộ tập trung.
Bảng 4.1
Các giá trị đầu vào cho thuật toán.
Bảng 4.2
Kết quả đạt đƣợc bởi GA I.
Bảng 4.3
Kết quả đạt đƣợc bởi GA II.










8
MỞ ĐẦU
Trong những năm gần đây nhu cầu sử dụng dịch vụ của mạng viễn thông càng
ngày càng tăng mạnh cùng với sự phát triển và tăng trƣởng của internet. Nhƣng tiện
ích, chất lƣợng và khả năng của các mạng viễn thông hiện là có giới hạn, do đó yêu
cầu đặt ra là phải thiết kế đƣợc những mạng viễn thông tối ƣu. Sự đa dạng của bài
toán kết nối tối ƣu đã nảy sinh không chỉ trong thiết kế, mà còn trong việc quản lý
chất lƣợng dịch vụ của mạng viễn thông. Có nhiều vấn đề mới đƣợc yêu cầu, trong

nhiều trƣờng hợp, các ứng dụng của các kỹ thuật tối ƣu xuất hiện cho việc giải
quyết chúng. Một trong những vấn đề đó là bài toán kết nối các thiết bị đầu cuối
vào các bộ tập trung (terminal assignment – TA).
Bài toán TA là một bài toán NP-đầy đủ, nó đã đƣợc rất nhiều các tác giả trên
thế giới quan tâm tìm hiểu và đề xuất các cách tiếp cận khác nhau. Trong luận văn
này chúng tôi trình bày cách tiếp cận lai ghép giữa giải thuật di truyền và mạng nơ
ron Hopfield để tối ƣu hóa bài toán TA.
Nội dung chính của luận văn bao gồm 4 chƣơng.
Chƣơng 1: Tổng quan về mạng nơ ron. Chƣơng này trình bày tổng quan về cơ
sở của mạng nơ ron nhân tạo bao gồm: giới thiệu về nơ ron sinh học, mô hình mạng
nơ ron nhân tạo, phạm vi ứng dụng của mạng nơ ron, ƣu nhƣợc điểm của mạng nơ
ron và trình bày về mạng nơ ron Hopfield, phƣơng pháp ánh xạ một bài toán lên
mạng nơ ron.
Chƣơng 2: Giải thuật di truyền và tính toán tiến hóa. Chƣơng này trình bày về
giải thuật di truyền, tính toán tiến hóa, ƣu nhƣợc điểm của giải thuật di truyền. Ứng
dụng của giải thuật di truyền đối với bài toán tối ƣu tổ hợp.
Chƣơng 3: Bài toán kết nối các thiết bị đầu cuối vào các bộ tập trung. Trình
bày các cách tiếp cận trƣớc đây cho bài toán TA. Cách tiếp cận của chúng tôi cho
bài toán này, và đánh giá những ƣu điểm của cách tiếp cận của chúng tôi so với các
cách tiếp cận trƣớc đây.
9
Chƣơng 4: Kết quả thực nghiệm và đánh giá. Chƣơng này trình bày kết quả
đạt đƣợc qua thực nghiệm, và so sánh với các phƣơng pháp khác.



















10
Chương 1. Tổng quan về mạng nơ ron
1.1. Giới thiệu về mạng nơ ron
1.1.1. Lịch sử phát triển của mạng nơ ron
Quá trình nghiên cứu và phát triển mạng nơ-ron nhân tạo có thể chia thành
bốn giai đoạn nhƣ sau:
Giai đoạn 1: Có thể tính từ nghiên cứu của William (1890) về tâm lý học với
sự liên kết các nơ ron thần kinh. Năm 1940, McCulloch và Pitts đã cho biết: nơ ron
có thể đƣợc mô hình hóa nhƣ thiết bị ngƣỡng (giới hạn) để thực hiện các phép tính
logic và mô hình mạng nơ ron của McCulloch-Pitts cùng với giải thuật huấn luyện
mạng của Hebb ra đời năm 1943.
Giai đoạn 2: Vào khoảng gần những năm 1960, một số mô hình nơ ron hoàn
thiện hơn đã đƣợc đƣa ra nhƣ: mô hình Perceptron của Rosenblatt (1958), Adaline
của Widrow (1962). Trong đó mô hình Perceptron rất đƣợc quan tâm vì nguyên lý
đơn giản, nhƣng nó cũng có hạn chế vì nhƣ Marvin Minsky và Seymour Papert của
MIT (Massachurehs Insritute of Technology) đã chứng minh nó không dùng đƣợc
cho các hàm logic phức (1969). Còn Adaline là mô hình tuyến tính, tự chỉnh, đƣợc
dùng rộng rãi trong điều khiển thích nghi, tách nhiễu và vẫn phát triển cho đến nay.
Giai đoạn 3: Có thể tính vào khoảng đầu thập niên 80. Những đóng góp lớn

cho mạng nơ ron trong giai đoạn này phải kể đến Grossberg, Kohonen, Rumelhart
và Hopfield. Trong đó đóng góp của Hopfield gồm hai mạng phản hồi: mạng rời rạc
năm 1982 và mạng liên tục năm 1984. Đặc biệt, ông đã dự kiến nhiều khả năng tính
toán lớn của mạng nơ ron mà một nơ ron không có khả năng đó. Cảm nhận của
Hopfield đã đƣợc Rumelhart, Hinton và Williams đề xuất thuật toán sai số truyền
ngƣợc nổi tiếng để huấn luyện mạng nơ ron nhiều lớp nhằm giải bài toán mà mạng
khác không thể thực hiện đƣợc. Nhiều ứng dụng mạnh mẽ của mạng nơ ron ra đời
cùng với các mạng theo kiểu máy Boltzmann và mạng Neocognition của
Fukushima.
11
Giai đoạn 4: Tính từ năm 1987 đến nay, hàng năm thế giới đều mở hội nghị
toàn cầu chuyên ngành nơ ron (IJCNN) (International Joint Conference on Neural
Networks). Rất nhiều công trình đƣợc nghiên cứu để ứng dụng mạng nơ ron vào các
lĩnh vực, ví dụ nhƣ: kỹ thuật tính toán, tối ƣu, sinh học, y học, thống kê, giao thông,
hóa học… Cho đến nay, mạng nơ ron đã tìm đƣợc và khẳng định đƣợc vị trí của
mình trong rất nhiều ứng dụng khác nhau.
1.1.2. Mô hình mạng nơ ron nhân tạo
1.1.2.1. Nơ ron sinh học
Hệ thần kinh ở ngƣời có khoảng 10
10
tế bào thần kinh đƣợc gọi là các nơ ron.
Mỗi nơ ron gồm có ba phần: Thân nơ ron với nhân ở bên trong (soma), một đầu
thần kinh ra (axon) và một hệ thống hình cây thần kinh (dendrite). Có nhiều loại nơ
ron khác nhau về kích thƣớc và khả năng thu phát tín hiệu. Tuy nhiên, chúng có cấu
trúc và nguyên lý hoạt động chung. Hình vẽ (1.1) là một hình ảnh đơn giản hóa của
một loại nơ ron. Trong thực tế có rất nhiều dây thần kinh vào và chúng bao phủ một
diện tích rất lớn (0.25 mm
2
) để nhận các tín hiệu từ các nơ ron khác. Đầu thần kinh
ra đƣợc rẽ nhánh nhằm chuyển giao tín hiệu từ thân nơ ron tới nơ ron khác. Các

nhánh của đầu thần kinh đƣợc nối với các khớp thần kinh (synapse). Các khớp thần
kinh này đƣợc nối với thần kinh vào của các nơ ron khác. Thêm vào đó, các nơ ron
có thể sửa đổi tín hiệu tại các khớp, trong nơ ron nhân tạo đƣợc gọi là trọng số.
Khớp nối dây thần
kinh (đầu vào)
Nhân
Tế bào
Trục
Đầu ra
Hình 1.1. Mô hình nơ ron sinh học
12
Hoạt động của nơ ron sinh học có thể mô tả tóm tắt nhƣ sau:
Mỗi nơ ron nhận tín hiệu vào từ các tế bào thần kinh khác. Chúng tích hợp các
tín hiệu vào, khi tổng tín hiệu vƣợt quá một ngƣỡng nào đó chúng tạo tín hiệu ra và
gửi tín hiệu này tới các nơ ron khác thông qua dây thần kinh. Các nơ ron liên kết
với nhau thành mạng. Mức độ bền vững của các liên kết này xác định một hệ số gọi
là trọng số liên kết.
1.1.2.2. Nơ ron nhân tạo
a. Trọng số và tổng tín hiệu đầu vào:
Mô phỏng nơ ron sinh học để tạo ra các nơ ron nhân tạo. Mỗi nơ ron có rất
nhiều dây thần kinh vào nghĩa là mỗi nơ ron có thể tiếp nhận đồng thời nhiều tín
hiệu. Giả sử tại nơ ron i có N tín hiệu vào, mỗi tín hiệu vào S
j
đƣợc gán một trọng
số W
ij
tƣơng ứng. Ta có thể ƣớc lƣợng tổng tín hiệu đi vào nơ ron net
i
theo một số
dạng sau:

- Dạng tuyến tính:



N
j
jiji
swnet
1

- Dạng toàn phƣơng:



N
j
jiji
swnet
1
2

- Dạng mặt cầu:
 
2
1
2





N
j
ijji
wsnet


Trong đó:


ij
w
(j=1, ,N) lần lƣợt là bán kính và tâm mặt cầu.
b. Hàm kích hoạt
Hàm biến đổi tín hiệu đầu vào net cho tín hiệu đầu ra out đƣợc gọi là hàm kích
hoạt. Hàm này có đặc điểm là không âm và bị chặn. Có nhiều dạng hàm kích hoạt,
ngƣời ta thƣờng sử dụng một hàm kích hoạt chung cho toàn mạng.
Một số hàm kích hoạt thƣờng đƣợc sử dụng:
(1.2)

(1.3)

(1.1)

13
- Hàm McCuloch-Pitts:
 









net
net
netfout
nÕu
nÕu
0
1
(1.4)
- Hàm McCuloch-Pitts trễ:
 
 








kh¸cnÕu
nÕu
nÕu
netf
LTPnet
UTPnet
netfout 0

1
(1.5)
ở đây UTP > LTP. Trong đó:
UTP là ngƣỡng trên (Upper Trip Point)
LTP là ngƣỡng dƣới (Lower Trip Point)
- Hàm Sigmoid:
 
 




net
e
netfout
1
1
(1.6)
Trong đó
0


là hằng số xác định độ nghiêng của hàm

c. Nút bias:
Là một nút thêm vào nhằm tăng khả năng thích nghi của mạng nơ ron trong
quá trình học. Trong các mạng nơ ron có sử dụng bias, mỗi nơ ron có thể có một
trọng số tƣơng ứng với bias. Trọng số này luôn có giá trị là 1.
Mô hình của một nút xử lý (nút thứ i):













N
ij
j
ijiji
VWU
#
1
θ
(1.7)
 
iii
UfV 
(1.8)
V
i
=f
i
(U
i

)
U
i
= 
V
i

V
i

W
i1

V
j

V
N

W
ij

W
iN

Hình 1.2. Mô hình một nơ ron



14

Trong đó:
i
U
là tín hiệu vào tại nơ ron i
i
V
là tín hiệu ra tại nơ ron i.
ij
W
là trọng số liên kết từ nơ ron j đến nơ ron i.
i

là ngƣỡng (đầu vào ngoài) kích hoạt nơ ron i.
i
f
là hàm kích hoạt của nơ ron i.
1.1.2.3. Mạng nơ ron
Mạng nơ ron nhân tạo (Artificial Neural Network) là một cấu trúc mạng đƣợc
hình thành nên bởi một số lƣợng các nơ ron nhân tạo liên kết với nhau. Mỗi nơ ron
có các đặc tính đầu vào, đầu ra và thực hiện một chức năng tính toán cục bộ.
Với việc giả lập các hệ thống sinh học, các cấu trúc tính toán, mạng nơ ron có
thể giải quyết đƣợc các lớp bài toán nhất định, nhƣ: bài toán xếp loại, bài toán lập
lịch, bài toán tìm kiếm, bài toán nhận dạng mẫu…Các bài toán phức tạp cao, không
xác định. Tuy nhiên, sự liên kết giữa một bài toán bất kỳ trong thực tế với một giải
pháp mạng nơ ron lại là một việc không dễ dàng.
Xét một cách tổng quát, mạng nơ ron là một cấu trúc xử lý song song thông tin
phân tán mang các đặc tính nổi bật sau:
- Là mô hình toán học dựa trên bản chất của nơ ron.
- Bao gồm một số lƣợng rất lớn các nơ ron liên kết với nhau.
- Mạng nơ ron có khả năng học, khái quát hóa tập dữ liệu học thông qua việc

gán và hiệu chỉnh các trọng số liên kết.
- Tổ chức theo kiểu tập hợp mang lại cho mạng nơ ron khả năng tính toán rất
lớn, trong đó không có nơ ron nào mang thông tin riêng biệt.
Ví dụ: hình 1.3, 1.4, 1.5, 1.6 là một số mô hình mạng thông dụng.
a. Mạng truyền thẳng:
- Mạng truyền thẳng một lớp:
Mô hình mạng nơ ron truyền thẳng một lớp là mô hình liên kết cơ bản và đơn
giản nhất. Các nơ ron tổ chức lại với nhau và tạo thành một lớp, đƣờng truyền tín
15
hiệu đƣợc truyền theo một hƣớng nhất định nào đó. Các đầu vào đƣợc nối với các
nơ ron theo các trọng số khác nhau, sau quá trình xử lý cho ra một chuỗi các tín
hiệu ra. Nếu mạng nơ ron là mô hình LTU thì nó đƣợc gọi là mạng Perceptron, nếu
mạng nơ ron là mô hình LGU thí nó đƣợc gọi là mạng Adaline.







Với mỗi giá trị đầu vào x = [x
1
,x
2
,….,x
n
]
T
. Qua quá trình xử lý của mạng ta sẽ
thu đƣợc một bộ tƣơng ứng các giá trị đầu ra là y = [y

1
,y
2
,…,y
n
]
T
đƣợc xác định nhƣ
sau:
nixwfy
ijij
m
j
ii
,1).(
1


θ
(1.9)
Trong đó:
m: số tín hiệu vào
n: số tín hiệu ra
 
12
, , ,
T
T
i i i in
W w w w

là véc tơ trọng số của nơ ron thứ i.
f
i
: hàm kích hoạt của nơ ron thứ i.
i

: là ngƣỡng của nơ ron thứ i.
- Mạng truyền thẳng nhiều lớp.
Với mạng nơ ron truyền thẳng một lớp ở trên, khi phân tích một bài toán phức
tạp sẽ gặp rất nhiều khó khăn, để khắc phục vấn đề này ngƣời ta đƣa ra mô hình
mạng nơ ron truyền thẳng nhiều lớp bằng việc kết hợp một số lớp nơ ron lại với
nhau. Lớp nhận tín hiệu vào gọi là lớp vào, lớp đƣa ra tín hiệu ra của mạng đƣợc gọi
là lớp ra. Các lớp ở giữa lớp vào và lớp ra đƣợc gọi là các lớp ẩn. Hình (1.4) mô tả
cấu trúc của mạng nơ ron truyền thẳng nhiều lớp.
y
1
y
n
y
2
x
m
x
1
x
2
Hình 1.3: Mạng nơ ron truyền thẳng một lớp.


16

b. Mạng hồi quy:
- Mạng hồi qui một lớp có nối ngƣợc








- Mạng hồi qui nhiều lớp có nối ngƣợc








1.1.2.4. Luật học
Mạng nơ ron có một số ƣu điểm so với máy tính truyền thống. Cấu trúc song
song của mạng nơ ron rất thích hợp cho những ứng dụng đòi hỏi tốc độ nhanh theo
thời gian thực. Khả năng huấn luyện của mạng nơ ron có thể khai thác để phát triển
hệ học thích nghi. Mặt khác, với khả năng tổng quát hóa của mạng nơ ron, nó có thể
. . .
. . .
. . .
X
1
X

2
X
N
Y
1
Y
2
Y
M
Hình 1.5. Mạng hồi qui một lớp có nối ngƣợc
Y
1
Y
2
Y
M
. . .
. . .
X
1
X
2
X
N
. . .
. . .
Hình 1.6. Mạng hồi quy nhiều lớp có nối ngƣợc
Lớp vào lớp ẩn lớp ra
x
1

y
1


x
2
y
2



x
m
y
n

Hình 1.4. Mạng truyền thẳng nhiều lớp




(ii)
(




17
áp dụng để điều khiển nhiều tham số phức tạp đồng thời từ đó giải quyết dễ dàng
một số bài toán thuộc lớp bài toán NP – đầy đủ (NP – complete).

Các luật học đóng vai trò quan trọng trong việc xác định một mạng nơ ron
nhân tạo. Một cách đơn giản về khái niệm học của mạng nơ ron là cập nhật trọng số
trên cơ sở các mẫu. Theo nghĩa rộng thì học có thể đƣợc chia làm hai loại: học tham
số và học cấu trúc.
a. Học tham số: các thủ tục học này nhằm tìm kiếm ma trận trọng số sao cho
mạng có khả năng đƣa ra dự báo sát với thực tế. Dạng chung của luật học tham số
có thể đƣợc mô tả nhƣ sau:
, 1, ; 1, ,
ij j
W rx i N j M

   
(1.10)
Trong đó:
ij
W
là sự thay đổi trọng số liên kết từ nơ ron j đến nơ ron i.
j
x
là tín hiệu vào nơ ron j.

là tốc độ học, nằm trong khoảng (0,1).
r là hằng số học.
Vấn đề đặt ra ở đây là tín hiệu học r đƣợc sinh ra nhƣ thế nào để hiệu chỉnh
trọng số của mạng.
Có thể chia thủ tục học tham số ra thành ba lớp nhỏ hơn: học có chỉ đạo, học
tăng cƣờng và học không chỉ đạo. Việc xác định r phụ thuộc vào từng kiểu học.
+ Học có tín hiệu chỉ đạo: là quá trình mạng học dựa vào sai số giữa đầu ra
thực và đầu ra mong muốn để làm cơ sở cho việc hiệu chỉnh trọng số. Sai số này
chính là hằng số học r. Luật học điển hình của nhóm này là luật học Delta của

Widrow (1962) nêu ra đầu tiên dùng để xấp xỉ trọng số của Adaline dựa trên
nguyên tắc giảm gradient.Trong nhóm luật học này cũng cần phải kể đến luật học
Perceptron của Rosenblatt (1958). Về cơ bản luật học này thay đổi các giá trị trọng
số trong thời gian học, còn luật Perceptron thì thêm hoặc bỏ trọng số tùy theo giá trị
sai số là dƣơng hay âm.
18
Một loạt các luật học khác cũng đƣợc dựa trên tƣ tƣởng này. Luật Oja là cải
tiến và nâng cấp của luật Delta. Luật truyền ngƣợc là luật mở rộng của luật Delta
cho mạng nhiều lớp. Đối với mạng truyền thẳng thƣờng sử dụng luật truyền ngƣợc
để chỉnh trọng số với tín hiệu chỉ đạo từ bên ngoài và ngƣời ta gọi mạng này là
mạng lan truyền ngƣợc.
+ Học không có tín hiệu chỉ đạo: luật học này sử dụng đầu ra của mạng làm cơ
sở để điều chỉnh các trọng số liên kết. Hay trong luật này chính là tín hiệu ra của
mạng. Điển hình là luật Hebb (1949) thƣờng dùng cho các mạng tự liên kết, luật
LVQ (Learning Vectơ Quantization) dùng cho mạng tự tổ chức một lớp thuộc lớp
ánh xạ đặc trƣng của Kohonen.
Luật học Hebb là luật sinh học xuất phát từ tiên đề của Hebb cho rằng: giữa
hai nơ ron có quan hệ và có thay đổi thế năng mạng thì giữa chúng có sự thay đổi
trọng số liên kết. Nói cách khác, trọng số đƣợc điều chỉnh theo mối tƣơng quan
trƣớc và sau, nghĩa là:
, 1, , 1,
ij i j
W y x i N j M

   
(1.11)
Trong đó:
ij
W
là sự thay đổi trọng số liên kết từ nơ ron j đến nơ ron i.

x
j
là tín hiệu vào nơ ron j.
y
i
là tín hiệu ra của nơ ron i.

là tốc độ học, nằm trong khoảng (0,1)
Luật Hebb giải thích việc chỉnh trọng số trong phạm vi cục bộ của mạng mà
không cần tín hiệu chỉ đạo từ bên ngoài. Hopfield cũng cải tiến luật Hebb cho các
mạng tự liên kết thành 16 dạng khác nhau theo kiểu luật Hebb, luật đối Hebb, luật
Hopfield…
Nhƣ vậy, ứng với mỗi nhóm mạng thƣờng áp dụng một luật học nhất định.
Nếu tồn tại hàng chục loại mạng khác nhau thì các luật học dùng trong mạng nơ ron
có thể tăng lên rất nhiều lần.
19
Đối với mạng phản hồi thƣờng sử dụng luật Hebb và các luật cải tiến của nó
để điều chỉnh trọng số mà không cần tín hiệu chỉ đạo từ bên ngoài.
+. Học tăng cƣờng: trong một số trƣờng hợp, thông tin phản hồi chỉ là tín
hiệu bao gồm hai trạng thái cho biết tín hiệu đầu ra của mạng là đúng hay sai. Quá
trình học dựa trên các thông tin hƣớng dẫn nhƣ vậy đƣợc gọi là học có củng cố (học
tăng cƣờng) và tín hiệu mang thông tin phản hồi đƣợc gọi là tín hiệu củng cố cho
quá trình học. Ta có thể thấy rằng quá trình học này là một dạng của quá trình học
có tín hiệu chỉ đạo bởi vì mạng nhận đƣợc một số thông tin phản hồi từ bên ngoài.
b. Học cấu trúc: tìm kiếm các tham số của cấu trúc mạng để tìm ra một cấu
trúc mạng hoạt động tốt nhất. Trong thực tế, việc học cấu trúc là tìm ra số lớp ẩn và
tìm ra số nơ ron trên mỗi lớp đó. Giải thuật di truyền thƣờng đƣợc sử dụng trong
các cấu trúc nhƣng thƣờng chạy rất lâu, thậm chí ngay cả đối với mạng có kích
thƣớc trung bình. Ngoài ra kỹ thuật gọt tỉa mạng hay mạng tăng dần cũng đƣợc áp
dụng trọng việc học cấu trúc của mạng có kích thƣớc tƣơng đối nhỏ.

1.2. Phạm vi ứng dụng của mạng nơ ron
1.2.1. Những bài toán thích hợp
Mạng nơ ron đƣợc coi nhƣ là hộp đen biến đổi vectơ đầu vào m biến thành
vectơ đầu ra n biến. Tín hiệu ra có thể là các tham số thực (tốt nhất nằm trong
khoảng [0,1], hoặc [-1,1]), số nhị phân 0,1 hay số lƣỡng cực -1;+1. Số biến của
vectơ vào ra không bị hạn chế song sẽ ảnh hƣởng tới thời gian tính và tải dữ liệu
của máy tính. Nói chung, các lớp bài toán áp dụng cho nơ ron có thể đƣợc phân chia
thành bốn loại:
 Phân lớp (classification)
 Mô hình hóa (modeling)
 Biến đổi, thực hiện ánh xạ từ một không gian đa biến vào không gian
đa biến khác tƣơng ứng (transformation and mapping).
 Liên kết và kỹ thuật dịch chuyển cửa sổ (association and moving
window).
20
1.2.1.1 Phân loại:
Một trong các công việc đơn giản và thƣờng đƣợc sử dụng nhiều trong việc
quản lý các đối tƣợng đa biến là phân loại (phân lớp một đối tƣợng vào các nhóm,
nhóm con, hay chủng loại…). Ví dụ: bài toán phân lớp ảnh, nhận dạng mẫu,…
Khi phải phân loại một quyết định phức tạp, chúng ta phải bắt đầu với việc
nghiên cứu thống kê các mối liên quan giữa nhiều đối tƣợng và thuộc tính của lớp
các đối tƣợng. Có thể nói việc xây dựng một cây phân lớp các quyết định phải đƣợc
thực hiện trƣớc khi thủ tục học đƣợc tiến hành. Nếu kết quả cuối cùng không thỏa
mãn, chúng ta cần phải xem xét lại cách biểu diễn các đối tƣợng hoặc cây phân lớp
hoặc thay đổi cả hai.
1.2.1.2 Mô hình hóa:
Các hệ thống phân loại đƣa ra các câu trả lời rời rạc nhƣ có, không hoặc một
số nguyên định danh các đối tƣợng đầu vào thuộc lớp nào. Mô hình hóa yêu cầu hệ
thống phải sản sinh ra các câu trả lời mang tính liên tục. Trong quá trình mô hình
hóa, cần một số lƣợng nhỏ các số liệu để xây dựng mô hình.

Mô hình này có thể đƣa ra các dự báo cho tất cả các đối tƣợng đầu vào. Việc
tìm ra đƣờng cong phù hợp với các số liệu thực nghiệm là một trong những ứng
dụng thuộc dạng này. Trong bất kỳ loại mô hình nào cũng phải tuân theo một giả
định là: các thay đổi nhỏ của tín hiệu vào chỉ gây ra những biến đổi nhỏ của tín hiệu
ra.
Trong các vấn đề đa biến, mạng nơ ron có nhiều lợi thế hơn so với các phƣơng
pháp mô hình hóa cổ điển sử dụng các hàm giải tích. Bởi vì trong phƣơng pháp mô
hình hóa cổ điển đối với mỗi đầu ra, ta phải định nghĩa một hàm cụ thể cùng một bộ
các tham số, trong khi đối với mạng nơ ron thì không phải quan tâm tới các hàm đó.
Tuy nhiên, trong các phƣơng pháp mô hình hóa cổ điển, các hệ số có thể có một số
ý nghĩa nào đó đối với vấn đề cần giải quyết, trái lại các trọng số của mạng không
mang một ý nghĩa nào cả.
21
Trong nhiều ứng dụng khá đặc biệt, khi sai số thực hiện khá lớn chúng ta có
thể mô hình hóa bằng cách cân xứng hóa giữa tín hiệu vào tín hiệu ra. Trong các
trƣờng hợp này, sử dụng mạng nhƣ một bảng tra là đủ, mặc dù các bảng này sẽ cho
lời giải giống nhau trong một khoảng nào đó của tín hiệu vào.
Đối với việc chọn chiến lƣợc học, chúng ta cần quan tâm đến sự phân bố của
các đối tƣợng dùng để học. Nếu số lƣợng đối tƣợng dùng cho việc học là ít và đƣợc
phân bố tƣơng đối đều trong toàn không gian, khi đó số liệu có thể đƣợc dùng ngay
cho việc mô hình hóa. Trái lại, nếu các đối tƣợng là nhiều, sẵn có nhƣng phân bố
ngẫu nhiên trong không gian biến, đầu tiên phải giảm thiểu chúng sao cho vẫn bao
trùm toàn không gian, sau đó mới dùng làm số liệu cho mô hình hóa.
1.2.1.3 Biến đổi
Việc biến đổi nhằm mục đích nén các đối tƣợng từ không gian m chiều vào
không gian có số chiều nhỏ hơn rất nhiều. Qua việc nén, các đối tƣợng này sẽ bộc lộ
các đặc điểm mà chúng ta không thể nhận thấy khi chúng thuộc không gian nhiều
chiều. Theo một chừng mực nào đó, biến đổi tƣơng tự nhƣ việc nhóm các đối tƣợng
hay phân loại thể hiện ở chỗ biểu diễn các kết quả ra. Trong phân loại, chúng ta
muốn định danh các nhóm hoặc lớp mà đối tƣợng thuộc vào, còn trong biến đổi,

chúng ta quan tâm đến toàn bộ các đối tƣợng và từ đó chúng ta thu nhận đƣợc các
nhóm từ các đối tƣợng học. Điểm quan trọng trong biến đổi là các đối tƣợng đƣợc
biểu diễn tọa độ của nơ ron trung tâm chứ không phải là giá trị của tín hiệu ra.
Một trong những ứng dụng của việc biến đổi là tiền xử lý (thƣờng đƣợc gọi là
kế hoạch hóa thực nghiệm). Thông qua quá trình tiền xử lý, chúng ta có thể chọn ra
các đối tƣợng điển hình từ tập vô số các đối tƣợng ngẫu nhiên, loại trừ các đối
tƣợng dƣ thừa hay trùng lặp. Điều này là cực kỳ quan trọng khi lựa chọn các đối
tƣợng làm mẫu học cho mạng lan truyền ngƣợc sai số.
1.2.1.4 Liên kết
Liên kết là tìm ra đối tƣợng đích có mối quan hệ với một đối tƣợng vào, thậm
chí cả khi đối tƣợng vào bị hỏng hoặc hoàn toàn không biết. Theo một nghĩa nào
22
đó, liên kết có thể đƣợc coi là phân loại. Thủ tục học cho vấn đề này là học có tín
hiệu chỉ đạo.
Lĩnh vực nghiên cứu các quá trình phụ thuộc thời gian là một trong những lĩnh
vực chính trong nghiên cứu quá trình điều khiển. Ở đây ngƣời sử dụng dự báo đƣợc
các hành vi của hệ thống đa biến dựa trên một chuỗi số liệu đƣợc ghi nhận theo thời
gian. Trong mô hình hóa phụ thuộc thời gian, các biến của tín hiệu vào bao gồm các
giá trị hiện tại và quá khứ của các biến quá trình, trong đó tín hiệu ra dự báo giá trị
trong tƣơng lai của những biến quá trình đó. Về nguyên tắc các hiểu biết này có thể
có các độ dài tùy ý nhƣng trong quá trình kiểm soát hiểu biết tƣơng lai chỉ bao gồm
một bƣớc thời gian. Việc học dịch chuyển tới bƣớc tiếp theo tạo ra các cửa sổ bao
gồm số bƣớc thời gian của vectơ ra. Để tạo ra mô hình hoàn chỉnh của một quá
trình, tất cả các biến quá trình phải đƣợc huấn luyện tại đầu ra của mạng, nhƣng
không phải tất cả các biến trong quá trình đều ảnh hƣởng nhƣ nhau đối với kết quả
cuối cùng, chỉ có một số biến là đáng quan tâm. Do đó chúng ta chỉ phải chọn các
biến đó cho quá trình học. Kỹ thuật dịch chuyển cửa sổ có thể đƣợc sử dụng để giải
quyết các vấn đề chuỗi các sự kiện và đối tƣợng nhƣ trong các lĩnh vực về môi
trƣờng theo thời gian, kiểm soát hỏng hóc.
1.2.2. Các lĩnh vực ứng dụng mạng nơ ron

Khó có thể thống kê đầy đủ các ứng dụng của mạng nơ ron. Tuy nhiên, có thể
nêu ra một số ứng dụng nhƣ sau:
 Xử lý ảnh.
 Nhận dạng mẫu
 Y học
 Các hệ thống quân sự
 Bài toán lập kế hoạch, điều khiển và tìm kiếm
 Các hệ thống năng lƣợng.
 Dự đoán
23
 Giải các bài toán tối ƣu: vấn đề chính là tìm những thuật toán huấn luyện
mạng để góp phần tìm nghiệm cho nhiều lớp bài toán tối ƣu toàn cục.
1.2.3. Ưu và nhược điểm của mạng nơ ron
Ưu điểm
 Xử lý song song
 Thiết kế hệ thống thích nghi
 Không đòi hỏi các đặc trƣng mở rộng của bài toán (chủ yếu dựa trên tập học)

Nhược điểm:
 Không có các quy tắc và các hƣớng dẫn thiết kế một cách rõ ràng đối với
một ứng dụng nhất định.
 Không có cách tổng quát để đánh giá hoạt động bên trong mạng.
 Việc học đối với mạng có thể khó (hoặc không thể) thực hiện.
 Khó có thể dự đoán trƣớc đƣợc hiệu quả của mạng trong tƣơng lai (khả năng
tổng quát hóa).
1.3. Mạng Hopfield
Trong mạng hồi quy tín hiệu ra của một nơ ron có thể đƣợc truyền ngƣợc lại
làm tín hiệu vào cho các nơ ron ở các lớp trƣớc, hoặc các nơ ron trong cùng một
lớp. Phần này sẽ trình bày mô hình mạng tiêu biểu thuộc lớp mạng hồi quy, đó là
mạng Hopfield.

Mạng Hopfield đƣợc bắt đầu nghiên cứu từ năm 1982. Đây là mạng một lớp
với thông tin và quá trình xử lý có nối ngƣợc. Chính công trình của Hopfield đã
đƣợc áp dụng trong rất nhiều ứng dụng, đặc biệt trong bộ nhớ liên kết và trong các
bài toán tối ƣu.
Giả sử mạng đƣợc xây dựng dƣới mạng một lớp, mỗi nơ ron đƣợc truyền
ngƣợc lại làm tín hiệu vào cho các nơ ron khác, nhƣng bản thân các nơ ron không tự
liên kết với chính nó. Khi đó mô hình mạng Hopfield đƣợc biểu diễn nhƣ hình 1.7.
24
Tín hiệu ra của nơ ron thứ j nào đó đƣợc truyền ngƣợc lại làm tín hiệu vào cho
các nơ ron khác trong mạng một cách đầy đủ thông qua các trọng số tƣơng ứng.
Ký hiệu W
ij
là liên kết giữa hai nơ ron i và j (W
ij
= W
ji
), V
i
là đầu ra của nơ
ron i. Ta coi vectơ (V
1
,V
2
,…,V
n
) là trạng thái của mạng. Tại mỗi thời điểm t mỗi nơ
ron i tổng hợp các tín hiệu V
j
từ các nơ ron khác và tín hiệu từ bên ngoài (bias)
()

i ij j i
j
U W V t l


Tùy theo hàm kích hoạt f
i
mà nơ ron i cho đầu ra là:
V
i
(t+1) = f
i
(V
i
(t)).
Mạng đạt trạng thái cân bằng nếu V
i
(t+1) = V
i
(t),
i

Ta định nghĩa hàm năng lƣợng của mạng
1
1
11
1
( , , )
2
n n n

n ij i j i i
j
ii
ji
E E V V W VV IV



   
 
(1.12)
Tuỳ theo phƣơng thức hoạt động của mạng mà ngƣời ta phân mạng Hopfield
ra thành mạng Hopfield rời rạc và mạng Hopfield liên tục.
1.3.1. Mạng Hopfield rời rạc
Mạng Hopfield rời rạc là mạng đƣợc tính rời rạc (đầu ra rời rạc) và làm việc ở
chế độ không đồng bộ.
Trƣờng hợp mạng nhận các giá trị nhị phân {0,1}, hàm kích hoạt đƣợc xác
định nhƣ sau:
i
ff


Hình 1.7. Mô hình mạng Hopfield
X
1
X
2
X
N
Y

1
Y
2
Y
M
.
.
.
Đầu vào
Đầu ra
25



Việc cho hàm kích hoạt (1.13) tƣơng đƣơng với quy tắc chuyển trạng thái của
mạng V
i
(t+1) = V
i
(t) +
i
V
;
Trong đó
i
V
đƣợc cho bởi công thức (quy tắc)








Định lý: Giả sử W
ii
= 0 (
,i i n
). Khi đó với quy tắc chuyển trạng thái nhƣ
trên và cập nhật không đồng bộ thì năng lƣợng của mạng không tăng (tức là giảm
hoặc giữ nguyên) [13].
Chứng minh: Giả sử nơ ron k thay đổi trạng thái từ thời điểm t đến t+1. Khi
đó mạng sẽ thay đổi năng lƣợng và
kj
( 1) ( ) W ( )
j k k
E E t E t V t I V

       




Vì thế theo công thức (1.14) ta luôn có
E
0
, tức là năng lƣợng của mạng
không tăng. Vì thế hàm năng lƣợng sẽ đạt tới giá trị cực tiểu. Do hàm giới nội.
Do tính chất hội tụ và giá trị nhị phân của các nơ ron nên mạng Hopfield rời
rạc đƣợc sử dụng cho các bài toán tối ƣu {0,1}

Một mở rộng của mạng nhị phân là mạng lƣợng tử hoá (xem [18]). Đây là một
loại mạng mới đƣợc đề xuất và thích hợp cho việc giải các bài toán quy hoạch
nguyên.
nếu
ngƣợc lại
1 0
()
0
net
f net





(1.13)
i
1 ( ) 0 ( ) 0
1 ( ) 0 ( ) 1
0
ij j i i
j
ij j i i
j
W V t l V t
V W V t l V t

  



     






nÕu vµ
nÕu vµ
trong c¸c trêng hîp kh¸c
(1.14)

26
1.3.2. Mạng Hopfield liên tục:
Mạng Hopfield liên tục là mạng mà trạng thái của nó đƣợc mô tả bởi phƣơng
trình động học
ij
W
i
ji
j
dU
VI
dt


(1.15)
V
i
= f

i
(U
i
), trong đó f
i
là hàm kích hoạt.
Ở đây ta cũng giả thiết W
ij
= W
ji
và W
ii
= 0. Dễ thấy rằng nếu hàm năng lƣợng
đƣợc cho bởi (1.12) thì:

i
i
V
E
dt
dU




Sự hội tụ của mạng Hopfield liên tục đƣợc cho bởi định lý sau:
Định lý: (Xem Takefuji [22]) Nếu f
i
(U
i

) (
ni ,1
) là các hàm khả vi và không
giảm thì
.0
dt
dE

Chứng minh: Ta có

Với giả thiết các hàm f
i
(U
i
) là không giảm nếu
,0
i
i
dU
dV
do đó
.0
dt
dE

Với tƣ cách là hàm kích hoạt ngƣời ta thƣờng chọn hàm Sigmoid:
))
2
tanh(1(
2

1
1
1
)(
i

ii
U
λ
e
USigmoidV
i




(1.16)
Trong đó  > 0 là tham số xác định độ dốc của hàm. Đồ thị của hàm Sigmoid
với một số giá trị của  xem hình vẽ





 















i i
i
i
i
i
i
i
i
dU
dV
V
E
dt
dU
dU
dV
V
E
dt
dE
.

2
-5 -4 -3 -2 -1 0 1 2 3 4 5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1

lamda =1
-5 -4 -3 -2 -1 0 1 2 3 4 5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1

lamda =2

×