Một số quy trình tính toán mờ và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.67 MB, 51 trang )

Bộ giáo dục và đào tạo
Trờng đại học bách khoa hà nội
------------------------------------------

Vũ Việt Dũng
Một số quy trình tính toán mờ và
ứng dụng
Chuyên ngành: Đảm bảo toán học cho máy tính và hệ thống tính toán

Luận văn thạc sĩ khoa học
Đảm bảo toán HọC cho máy tính
Và Hệ thống tính toán

Ngời hớng dẫn khoa học: Pgs.tsKH. Bùi công cờng

Hà nội - 2010

Một số quy trình tính toán mờ và ứng dụng

Vũ Việt Dũng ĐBT2008

Lời cam đoan

Kính gửi: Trung tâm Đào tạo và Bồi dỡng sau Đại học
- Trờng Đại học Bách Khoa Hà Nội

Tên tôi là: Vũ Việt Dũng
Sinh ngày: 09-07-1984
Học viên cao học khóa 2008-2010
Tôi xin cam đoan, toàn bộ kiến thức và nội dung trong bài luận văn của mình

là các kiến thức tự nghiên cứu từ các tài liệu tham khảo trong và ngoài nớc, không
có sự sao chép hay vay mợn dới bất kỳ hình thức nào để hoàn thành luận văn tốt
nghiệp cao học chuyên ngành Đảm bảo toán học cho máy tính và hệ thống tính toán.
Tôi xin chịu hoàn toàn trách nhiệm về nội dung của luận văn này trớc Trung
tâm Đào tạo và Bồi dỡng sau Đại học Trờng Đại học Bách khoa Hà Nội.

2

Một số quy trình tính toán mờ và ứng dụng

Vũ Việt Dũng ĐBT2008

mục lục

Lời cam đoan.............................................................................................. 2
mục lục......................................................................................................... 3
Từ viết tắt ................................................................................................... 5
Danh mục các bảng................................................................................ 6
Danh mục hình vẽ, đồ thị .................................................................... 7
Mở đầu........................................................................................................... 8
I. Cơ sở lý thuyết .................................................................................. 10
1. Một số khái niệm cơ bản và hệ mờ Takagi - Sugeno .............................. 10
1.1. Một số khái niệm cơ bản .................................................................. 10
1.2. Suy diễn mờ và hệ mờ ...................................................................... 11
1.3. Luật mờ Takagi - Sugeno ................................................................. 13
2. Mạng nơ - ron nhân tạo (Artificial neural network)................................ 13
2.1. Cấu trúc mạng nơ - ron..................................................................... 14
2.2. Phân loại cấu trúc mạng nơ - ron ..................................................... 16
2.3. Hàm hoạt động ................................................................................. 17

2.4. Tiến trình học ................................................................................... 18
3. Mạng thích nghi(Adaptive network) ....................................................... 19
3.1. Mạng thích nghi ............................................................................... 19
3.2. Phơng pháp luyện mạng bằng thuật toán lan truyền ngợc ........... 20
3.3. Phơng pháp luyện lai (hybrid learning).......................................... 22
4. Hệ thống suy diễn mờ dựa trên mạng thích nghi( Adaptive network based
fuzzy inference system: ANFIS) ................................................................. 25
4.1. Cấu trúc mạng ANFIS ...................................................................... 25
4.2. Phơng pháp luyện lai ...................................................................... 27
II. Mô hình mạng ANFIS để dự báo giá cổ phiếu ....................... 28
3

Một số quy trình tính toán mờ và ứng dụng

Vũ Việt Dũng ĐBT2008

1. Thị trờng chứng khoán .......................................................................... 28
1.1. Thị trờng chứng khoán thế giới ...................................................... 28
1.2. Thị trờng chứng khoán Việt Nam .................................................. 29
1.3. Các nghiên cứu dự báo về thị trờng chứng khoán .......................... 30
1.4. Các chỉ số cơ bản của thị trờng chứng khoán Việt Nam................ 31
2. Mô hình mạng nơ - ron kết hợp suy diễn mờ để dự báo giá chứng khoán
..................................................................................................................... 33
2.1. Lựa chọn đầu vào và tiền xử lý dữ liệu ............................................ 33
2.2. Mờ hóa dữ liệu đầu vào .................................................................... 34
3. ứng dụng mô hình mạng ANFIS trong thực tế TTCK Việt Nam............ 34
4. Các hạn chế của mô hình......................................................................... 42
III. Hớng phát triển mô hình mạng nơ ron dự báo tình
trạng cổ phiếu........................................................................................ 43

1. Hệ thống dự báo chỉ số chứng khoán dựa trên luật mờ dạng Takagi Sugeno ......................................................................................................... 43
2. Phơng pháp phân cụm K-Means ........................................................... 46
2.1. Đặt vấn đề......................................................................................... 46
2.2. Thuật toán gần đúng giải bài toán K - Means .................................. 46
3. Luyện tham số bằng phơng pháp SA..................................................... 47
Kết luận ..................................................................................................... 50
Tài liệu tham khảo............................................................................... 51

4

Vũ Việt Dũng ĐBT2008

Một số quy trình tính toán mờ và ứng dụng

Từ viết tắt
ANN

Artificial neural network

Mạng nơ -ron nhân tạo

LSE

Least squares estimate

Ước lợng bình phơng tối thiểu

ANFIS

Adaptive network based fuzzy Hệ thống suy diễn mờ dựa trên
inference system
mạng thích nghi

TTCK

Thị trờng chứng khoán

TTGDCK

Trung tâm giao dịch chứng khoán

HOSE

Trung tâm giao dịch chứng khoán Tp. Hồ Chí Minh

HASTC,
HNX

Trung tâm giao dịch chứng khoán Hà Nội

UpCom

Trung tâm giao dịch chứng khoán của các công ty đại chúng cha
niêm yết

OTC

Cổ phiếu cha niêm yết trên thị trờng

VN - Index

Chỉ số chứng khoán đại diện cho TTGDCK Tp. Hồ Chí Minh

HNX - Index

Chỉ số chứng khoán đại diện cho TTGDCK Hà Nội

MA

Six days moving average

Đờng trung bình trong 06 ngày

BIAS

Six days bias

Độ chênh giá trung bình trong 06
ngày

RSI

Six days relative strength Chỉ số sức mạnh tơng đối 06 ngày
index

MACD

Moving average convergence Đờng hội nhập và phân ly trung
and divergence

bình

PSY

13 days psychological line

Chỉ số tâm lý trong 13 ngày

SA

Simulated annealing

Thuật toán mô phỏng quá trình
luyện kim

MAPE

Mean absolutely percentage Trung bình phần trăm sai số tuyệt
error
đối

5

Một số quy trình tính toán mờ và ứng dụng

Vũ Việt Dũng ĐBT2008

Danh mục các bảng
Chơng I

Chơng II
Bảng 1 - Hệ số điều chỉnh .................................................................................... 35
Bảng 2 - Tham số của hàm liên thuộc .................................................................. 38
Chơng III

6

Một số quy trình tính toán mờ và ứng dụng

Vũ Việt Dũng ĐBT2008

Danh mục hình vẽ, đồ thị

Chơng I:
Hình 1: Cấu trúc một nơ - ron .............................................................................. 15
Hình 2 : Mạng dẫn tiến một lớp .......................................................................... 16
Hình 3 : Mạng dẫn tiến nhiều lớp ........................................................................ 17
Hình 4: Tiến trình học ......................................................................................... 19
Hình 5: Mạng thích nghi ..................................................................................... 20
Hình 6 : Hệ suy diễn mờ Takagi-Sugeno ............................................................ 25
Hình 7 : Cấu trúc mạng ANFIS đơn giản ............................................................ 25
Chơng II:
Hình 8: File dữ liệu luyện .................................................................................... 35
Hình 9: File dữ liệu kiểm tra ............................................................................... 36
Hình 10: Khởi tạo mạng ANFIS .......................................................................... 36
Hình 11: Cấu trúc mạng ANFIS .......................................................................... 37
Hình 12: Luyện mạng ANFIS ............................................................................. 37

Hình 13: Đồ thị của hàm liên thuộc của các biến đầu vào .................................. 39
Hình 14: Kết quả kiểm tra mạng ......................................................................... 41
Chơng III:
Hình 15: Cấu trúc hệ thống dự đoán chứng khoán .............................................. 45
Hình 16: Luyện tham số bằng phơng pháp SA .................................................. 49

7

Một số quy trình tính toán mờ và ứng dụng

Vũ Việt Dũng ĐBT2008

Mở đầu
Trong những năm gần đây, lý thuyết tập mờ và mạng nơ-ron nhân tạo đã và
đang phát triển rất nhanh và đa dạng. Công nghệ mờ và công nghệ mạng nơ-ron đã
góp phần tạo ra những bộ điều khiển linh hoạt, thông minh, những công cụ phân
tích, dự báo có khả năng làm việc với những bài toán khó, phức tạp, phải xử lý nhiều
loại thông tin mập mờ, cha đầy đủ và thiếu chính xác. Hai công nghệ này là hai trụ
cột chính tạo nên công nghệ tính toán mềm.
Hiện nay, việc áp dụng tính toán mềm vào phân tích dự báo biến động của thị
trờng chứng khoán đang thu hút rất nhiều sự quan tâm nghiên cứu. Để có đợc một
quyết định đầu t đúng đắn thì việc phân tích, xác định mức giá của cổ phiếu để lựa
chọn tỉ lệ mua, bán tối u là hết sức quan trọng. Trớc đây, đã có rất nhiều các
phơng pháp phân tích kỹ thuật cho thị trờng chứng khoán đợc phát triển nh Kline hay trung bình động Những phơng pháp này chủ yếu dựa trên thống kê số
liệu. Tuy nhiên, thị trờng chứng khoán là một hệ thống phi tuyến chịu nhiều tác
động của các yếu tố chính trị, kinh tế, tâm lý, xã hội. Do đó, việc sử dụng các công
cụ truyền thống để trợ giúp ra quyết định trong giao dịch chứng khoán là hết sức
khó khăn.
Mạng nơ-ron nhân tạo, với khả năng xử lý các hàm phi tuyến, linh hoạt trong

việc áp dụng và khả năng tự học cao có thể nói là một phơng pháp hiệu quả để áp
dụng vào hệ thống phức tạp của thị trờng chứng khoán. Trong các mô hình mạng
nơ -ron thì mô hình mạng nơ-ron lan truyền ngợc đợc sử dụng rộng rãi nhất và có
tính chính xác hơn cả. Không nh các mô hình toán học cổ điển, mô hình mạng nơ ron lan truyền ngợc giúp ta xây dựng các hàm xấp xỉ dựa trên quan hệ của các đầu
vào và đầu ra xác định mà không cần một mô hình cụ thể . Tuy nhiên, mô hình
mạng nơ-ron lan truyền ngợc truyền thống cũng có một số điểm yếu nh kết quả
tìm đợc rất có thể rơi vào điểm tối u địa phơng hay trong một số trờng hợp tốc
độ tính toán rất chậm ảnh hởng đến độ chính xác và đảm bảo của mô hình dự đoán.
Để cải thiện mô hình dự đoán này, ta có thể kết hợp một số phơng pháp suy diễn
mờ với mạng nơ-ron mà điển hình là mô hình mạng thích nghi kết hợp hệ suy luận
mờ ANFIS.

8

Một số quy trình tính toán mờ và ứng dụng

Vũ Việt Dũng ĐBT2008

Luận văn Một số quy trình tính toán mờ và ứng dụng đã nghiên cứu những
kiến thức về mạng ANFIS và ứng dụng mạng ANFIS vào việc dự đoán giá cổ phiếu,
kiểm nghiệm mô hình khi áp dụng vào thực tế thị trờng chứng khoán Việt Nam, từ
đó đánh giá các hạn chế của phơng pháp, đa ra hớng cải tiến.
Luận văn gồm 03 chơng:
Chơng 1: Cơ sở lý thuyết - Trình bày các khái niệm cơ bản về tập mờ, suy
diễn mờ, hệ mờ, luật mờ Takagi Sugeno, mạng nơ ron nhân tạo, mạng thích nghi
và hệ thống suy diễn mờ dựa trên mạng thích nghi ANFIS;
Chơng 2: Mô hình mạng ANFIS để dự báo giá cổ phiếu Trình bày sơ
lợc vể thị trờng chứng khoán thế giới, thị trờng chứng khoán Việt Nam, các
nghiên cứu dự báo về thị trờng chứng khoán và các chỉ số cơ bản của thị trờng

chứng khoán Việt Nam. Trên cơ sở đó, xây dựng mạng nơ -ron kết hợp suy diễn mờ
để dự báo giá chứng khoán, lựa chọn đầu vào và kiểm nghiệm mô hình với thực tế
thị trờng chứng khoán Việt Nam đồng thời đánh giá các hạn chế của mô hình;
Chơng 3: Hớng phát triển mô hình mạng nơ -ron dự báo tình trạng cổ
phiếu Trình bày hớng phát triển hệ thống dự báo chỉ số chứng khoán dựa trên
luật mờ Takagi Sugeno, phơng pháp phân cụm K-Means và phơng pháp luyện
tham số dựa trên thuật toán mô phỏng quá trình luyện kim.
Cuối cùng, để có bản luận văn này, tôi xin bày tỏ lòng biết ơn sâu sắc tới gia
đình, bạn bè, thầy cô giáo của Trung tâm đào tạo và bồi dỡng sau Đại học, Khoa
Toán Tin ứng dụng, Ban Giám hiệu trờng Đại học Bách Khoa Hà Nội đã hết sức
tạo điều kiện, động viên và truyền thụ các kiến thức bổ ích. Đặc biệt, tôi xin gửi lời
cám ơn chân thành đến thầy giáo PGS.TSKH. Bùi Công Cờng cùng các bạn trong
nhóm nghiên cứu lý thuyết mờ đã tận tình giúp đỡ để tôi có thể hoàn thành tốt bản
luận văn này.

9

Vũ Việt Dũng ĐBT2008

Một số quy trình tính toán mờ và ứng dụng

I. Cơ sở lý thuyết
Trớc khi đi vào tìm hiểu t tởng thuật toán dự báo giá cổ phiếu bằng mô
hình mạng nơ-ron kết hợp suy diễn mờ, ta cần tìm hiểu một số khái niệm cơ bản về
mạng nơ-ron, mạng nơ-ron lan truyền ngợc và luật mờ Takagi-Sugeno.
1. Một số khái niệm cơ bản và hệ mờ Takagi - Sugeno
1.1. Một số khái niệm cơ bản
~

Tập mờ A xác định trên tập cơ sở X là một tập hợp mà mỗi phần tử của nó là
một cặp giá trị ( x, à ~ ( x )) , trong đó x X và à ~ ( x ) là ánh xạ:
A

A

à : X [0,1]
~

A

~

ánh xạ à ~ ( x ) đợc gọi là hàm liên thuộc của tập mờ A .
A

Hàm liên thuộc cho biết độ phụ thuộc của các phần tử vào tập mờ (phần tử
thuộc tập mờ bao nhiêu phần trăm). Một số hàm liên thuộc hay đợc sử dụng:
- Hàm singleton:
.

- Hàm Gaussian:
- Hàm Bell tổng quát (Generalized Bell):
- Hàm Signmoidal:
- Hàm tam thức (Triangular):

10

Một số quy trình tính toán mờ và ứng dụng

Vũ Việt Dũng ĐBT2008

Cho X, Y là hai không gian nền. R gọi là quan hệ mờ trên
một tập mờ trên

, tức là có một hàm thuộc:

nếu R là
, ở đây

là độ liên thuộc của (x,y) vào quan hệ R.
Quan hệ mờ trên các tập mờ. Cho tập mờ A với hàm liên thuộc

trên Y. Quan hệ mờ trên các tập mờ A và B là

tập mờ B với hàm liên thuộc
quan hệ mờ R trên

trên X,

thỏa mãn điều kiện:

1.2. Suy diễn mờ và hệ mờ
Suy luận xấp xỉ, hay còn gọi là suy luận mờ, là quá trình suy ra những kết
luận dới dạng mệnh đề mờ trong điều kiện các quy tắc, các luật, các dữ liệu đầu
vào cho trớc cũng không hoàn toàn xác định.
Ví dụ: Xét một suy diễn mờ nh sau:
Luật mờ

Nếu góc tay quay ga lớn thì xe đi nhanh

Sự kiện mờ Góc tay ga quay khá lớn
Hệ quả

Xe đi khá nhanh

Trong suy diễn mờ này, ta đã sử dụng biến ngôn ngữ x = góc tay quay trên
(góc cho phép quay tay ga của xe máy), A = góc

không gian nền

lớn là một tập mờ trên U, với hàm thuộc

.

Tơng tự, biến ngôn ngữ y = tốc độ xe trên không gian nền
. Q = xe đi nhanh là một tập mờ B trên không gian nền V với
hàm thuộc

.

Khi đó, đặt
P =góc tay quay lớn = {x=A},
Q = xe đi nhanh = y=B, và luật mờ sẽ có dạng
Nh vậy, một luật mờ dạng Nếu P thì Q sẽ đợc biểu diễn thành một quan
hệ mờ R của phép kéo theo

với hàm thuộc của R trên không gian nền

đợc cho bởi phép kéo theo dự định sử dụng:

11

Vũ Việt Dũng ĐBT2008

Một số quy trình tính toán mờ và ứng dụng

, với mọi

.

Ta có thể viết lại suy diễn mờ nh sau:
Luật mờ (tri thức)

, với quan hệ cho bởi

Sự kiện mờ (đầu vào)

, xác định bởi tập mờ

Hệ quả

,

Sau khi đã chọn phép kéo theo I xác định quan hệ mờ
trên V với hàm thuộc của

trên U

,

là một tập mờ

đợc tính bằng phép hợp thành

, cho bởi

công thức:
với mỗi

.

Một dạng suy rộng khác trong cơ sở tri thức của nhiều hệ mờ thực tiễn, ví dụ
điển hình là trong các hệ điều khiển mờ, có thể phát biểu dới dạng sau:
là các biến vào của hệ thống, y là biến ra. Các tập

Cho
với

là các tập mờ trong không gian nền tơng ứng của biến

vào và biến ra đạng sử dụng của hệ thống,

là các suy diễn mờ (luật mờ) dạng

Nếu thì
: Nếu

là

và và

là

thì y là

: Nếu

là

và và

là

thì y là

: Nếu

là

và và

là

thì y là

Bài toán đặt ra cho hệ mờ sẽ có dạng:
Cho

Nếu

Tính

Giá trị y là
ở đây

và và

là

là

là các giá trị đầu vào hay sự kiện (có thể là giá trị mờ hoặc giá

trị rõ).
Có thể nhận thấy rằng, phần cốt lõi của nhiều hệ mờ cho bởi cơ sở tri thức
dạng R=[các luật

] và các cơ chế suy diễn cài đặt trong mô tơ suy diễn.

12

Một số quy trình tính toán mờ và ứng dụng

Vũ Việt Dũng ĐBT2008

1.3. Luật mờ Takagi - Sugeno
Các dạng hệ mờ xét ở trên đợc gọi là hệ mờ Mamdami. Đặc điểm của hệ mờ
Mamđami là cả đầu vào và đầu ra đều là các mệnh đề mờ, do đó hệ mờ Mamđami
có tính thông dịch cao nhng tính chính xác kém. Để cải thiện mô hình này, Takagi
Sugeno đã thay đổi phần kết luận của mỗi luật mờ, thay bởi hàm rõ của các biến
đầu vào.
Luật mờ Takagi - Sugeno đợc phát biểu nh sau:

If ( x1 = A1 ) AND( x2 = A2 ) AND... AND( xn = An )
then y = f ( x1 , x2 ,..., x n )
Trong đó:
Ai: là các tập mờ;
f(.) : làm hàm của các tín hiệu vào(hàm rõ).
Nhận xét : trong luật mờ Takagi - Sugeno điều kiện là mệnh đề mờ còn kết
luận là hàm rõ.
Một hệ mờ Takagi Sugeno tổng quát có thể đợc mô tả nh sau :
: Nếu

là

và và

là

thì

: Nếu

là

và và

là

thì

: Nếu

là

và và

là

thì

Hệ mờ Takagi Sugeno đợc xây dựng hệ mờ hệ các hàm rõ
sẽ cho kết quả chính xác hơn hệ mờ Mamdami. Các hàm

thờng đợc sử dụng là

các hàm dạng tuyến tính đối với các biến vào :

Các tham số

sẽ đợc xác định qua các thủ tục luyện mạng (các thuật

toán học)
2. Mạng nơ - ron nhân tạo (Artificial neural network)
Mạng nơ - ron nhân tạo (ANN) là một mô phỏng xử lý thông tin, đợc
nghiên cứu ra từ hệ thống thần kinh của sinh vật, giống nh bộ não để xử lý thông

13

Một số quy trình tính toán mờ và ứng dụng

Vũ Việt Dũng ĐBT2008

tin. ANN bao gồm số lợng lớn các mối gắn kết cấp cao để xử lý các yếu tố làm
việc trong mối liên hệ giải quyết vấn đề rõ ràng. ANN giống nh con ngời, đợc
học bởi kinh nghiệm, lu những kinh nghiệm hiểu biết và sử dụng trong những tình
huống phù hợp.
ANN đợc giới thiệu lần đầu tiên vào năm 1943 bởi nhà thần kinh học
Warren McCulloch và nhà logic học Walter Pits. Tuy nhiên, các hạn chế về kỹ thuật
trong thời gian này không cho phép họ nghiên cứu phát triển. Những năm gần đây,
các mô phỏng ANN bắt đầu xuất hiện và đợc nghiên cứu ứng dụng trong nhiều lĩnh
vực. Các ứng dụng của ANN trong các ngành: điện, điện tử, kỹ thuật chế tạo, y học,
quân sự, và đặc biệt là kinh tế và thị trờng chứng khoán đã mang lại một số kết quả
nhất định.
2.1. Cấu trúc mạng nơ - ron
Mạng nơ - ron là một mạng liên kết gồm nhiều đơn vị xử lý thông tin đợc
gọi là nơ - ron (neural) hay nút mạng. Mỗi nơ-ron nhận tạo này có nhiều đầu vào và
một đầu ra. Các đầu vào tiếp nhận kích thích từ đầu ra của các nơ- ron khác trong
mạng hoặc từ môi trờng. Mỗi đầu vào có một trọng số tơng ứng nhằm khuyếch
đại tín hiệu kích thích. Tất cả các tín hiệu kích thích này sau khi đợc khuyếch đại
sẽ đi vào thân nơ-ron bắt đầu từ bộ cộng. Bộ cộng sẽ thực hiện việc tổng hợp các

kích thích theo công thức:

trong đó

: đầu vào thứ i ;

: trọng số của đầu vào thứ i.

Tín hiệu sau khi đợc tổng hợp lại tiếp tục đợc biến đổi nhờ một hàm phi
tuyến, thờng đợc gọi là hàm hoạt động. Và cuối cùng tín hiệu sẽ đợc đa ra đầu
ra của nơ-ron để trở thành đầu vào của các nơ-ron khác hoặc trở thành tín hiệu ra
của toàn bộ mạng.

14

Vũ Việt Dũng ĐBT2008

Một số quy trình tính toán mờ và ứng dụng

X1

Wk1

X2

F(.)

Wk2

X3

Output
Yk

Wk3
b

Hình 1: Cấu trúc một nơ -ron
Trong đó:
Xi: Các tín hiệu đầu vào;
Wki: trọng số tơng ứng của các tín hiệu đầu vào;
Bộ cộng;
F(.): hàm hoạt động;
Yk: Đầu ra của nơ -ron;
b: Thông số ảnh hởng đến ngỡng ra của đầu ra.
Khi kết hợp các nơ-ron lại với nhau thành một mạng nơ-ron nhân tạo, ta có
thể xem nh mạng này là một mô hình tính toán

với X là vectơ số liệu

vào và Y là vectơ số liệu ra. Ưu điểm của mạng nơ-ron nhân tạo là cho phép xây
dựng một mô hình tính toán có khả năng học dữ liệu rất cao. Chỉ cần đa vào mạng
một tập mẫu dữ liệu trong quá trình học là mạng có khả năng phát hiện những ràng
buộc dữ liệu và áp dụng những ràng buộc này trong quá trình sử dụng mà không cần
phải có thêm các tri thức về miền ứng dụng. Khả năng này cho phép ta xây dựng mô
hình dữ liệu một cách dễ dàng. Một u điểm khác của mạng nơ-ron là khả năng
dung thứ lỗi cao. Mạng có thể chấp nhận những dữ liệu mẫu không hoàn toàn chính

xác mà vẫn đảm bảo đợc phần nhiều tính đúng đắn của bài toán. Điều này làm
giảm nhẹ quá trình sàng lọc, làm mịn dữ liệu trong khai thác đồng thời cho phép xây

15

Một số quy trình tính toán mờ và ứng dụng

Vũ Việt Dũng ĐBT2008

dựng các mô hình thích nghi mà trong đó sự thay đổi liên tục về quy luật dữ liệu có
thể dễ dàng đợc cập nhật trong quá trình học lại của mạng.
2.2. Phân loại cấu trúc mạng nơ - ron
a. Mạng dẫn tiến một lớp
Đây là cấu trúc mạng nơ - ron đơn giản nhất. Mạng nơ - ron này chỉ bao gồm
01 lớp dẫn xuất, không có lớp ẩn trung gian.
nơ-ron

Đầu vào

Đầu ra

nơ-ron
nơ-ron

nơ-ron

Hình 2 : Mạng dẫn tiến một lớp
b. Mạng dẫn tiến nhiều lớp
Một mạng dẫn tiến nhiều lớp có thể đợc mô tả nh hình 3. Mạng này có đặc

tính là chia thành nhiều lớp, lớp vào tơng ứng với các tín hiệu đầu vào của hệ thống
và lớp ra tơng ứng với các kết quả trả về. Mạng nơ - ron nhiều lớp có thể giải quyết
các bài toán phi tuyến nhờ vào các lớp ẩn. Các lớp ẩn này xen giữa các đầu vào bên
ngoài và đầu ra của mạng. Càng nhiều lớp ẩn thì khả năng mở rộng thông tin càng
cao và xử lý tốt mạng có nhiều đầu vào và đầu ra.

16

Một số quy trình tính toán mờ và ứng dụng

Vũ Việt Dũng ĐBT2008

Đầu ra 1

Đầu ra 2

Đầu ra 3

Đầu vào

Lớp ẩn

Đầu ra

Hình 3 : Mạng dẫn tiến nhiều lớp
Mạng nơ-ron nhiều lớp đợc đặc tả bởi tập các thông tin cấu trúc S bao gồm
số lớp của mạng, số lợng nơ-ron trên mỗi lớp và một tập thông tin tham số P là tập
các trọng số của từng nơ-ron trong mạng. Khi xây dựng mạng ta cần xác định cả hai
tập S và P này. Thông thờng, quá trình xác định S và P phụ thuộc vào tập dữ liệu

mẫu

đã đợc lu trữ lại từ những tình huống sử dụng thực tế của hệ thống.

Mạng sẽ đợc học nhằm xây dựng một cặp S và P tốt nhất từ đó mạng có khả năng
dự đoán một kết quả Y khi đầu vào X nào đó trong bộ (X, Y) này đảm bảo đợc tính
quy luật nh trong tập dữ liệu mẫu.
Một vấn đề khi xây dựng mạng nơ-ron là xác định số lớp ẩn tối u cho mạng
vì càng nhiều lớp ẩn thì cấu trúc mạng sẽ trở nên phức tạp và thời gian luyện mạng
quá lớn sẽ không đáp ứng đợc các yêu cầu thực tế. Việc xác định này thờng đợc
thực hiện dựa trên kinh nghiệm hoặc phép thử và sai. Thông thờng, ngời ta lựa
chọn số lớp ẩn cho mạng nơ-ron chỉ dừng ở 01 hoặc 02 lớp ẩn.
Ngoài các mạng trên, còn có mạng hồi quy và mạng nơ - ron dạng lới.
2.3. Hàm hoạt động
Các hàm hoạt động của một nơ -ron phải đảm bảo các đặc tính sau :
- Hàm bị chặn trên và chặn dới ;

17

Một số quy trình tính toán mờ và ứng dụng

Vũ Việt Dũng ĐBT2008

- Hàm có tính đơn điệu ;
- Hàm phải có tính liên tục và trơn.
Trong thực tế thông thờng ngời ta chọn các hàm sau:
a. Hàm Threhold

1 nếu u 0

f (u) =
0 nếu u < 0
b. Hàm piecewise- linear

1 nếu u 1 / 2

f (u) = u nếu 1 / 2 > u -1 / 2
0 nếu u < -1 / 2

c. Hàm sigmoid(logistic)

f (u ) =

1
1 + exp( au)

d. Hàm tang - hyperbol

eu e u
f (u) = tanh(u) = u
e + eu
2.4. Tiến trình học
Tiến trình học là tiến trình quan trọng của con ngời, nhờ học mà bộ não
ngày càng tích lũy những kinh nghiệm để thích nghi với môi trờng và xử lý tình
huống tốt hơn. Mạng nơ - ron nhân tạo xây dựng lại cấu trúc bộ não, do đó cũng
phải có khả năng nhận biết dữ liệu thông qua tiến trình học, với các thông số tự do
của mạng có thể thay đổi liên tục bởi những thay đổi của môi trờng và mạng nơ ron ghi nhớ các giá trị đó. Tiến trình học của mạng nơ-ron có thể đợc mô tả trong
hình 4.

18

Vũ Việt Dũng ĐBT2008

Một số quy trình tính toán mờ và ứng dụng

Học/Sửdụng

Đầu vào

X1

W1

X2

W2
Đầu ra

X3

W3

Neural
Dữ liệu học

Hình 4: Tiến trình học
Trong quá trình học, giá trị đầu vào đợc đa vào mạng và theo dòng chảy
trọng mạng tạo thành giá trị ở đầu ra. Tiếp đó, ta thực hiện quá trình so sánh giữa
giá trị tạo ra bởi mạng nơ - ron với giá trị ra mong muốn. Nếu hai giá trị này giống

nhau thì không thay đổi các giá trị trong mạng. Ngợc lại, nếu có một sai lệch giữa
hai giá trị này vợt quá giá trị sai số mong muốn thì đi ngợc mạng từ đầu ra về đầu
vào để thay đổi một số kết nối.
Đây là quá trình lặp liên tục và có thể không dừng khi không tìm đợc các
giá trị W sao cho đầu ra tạo bởi mạng nơ - ron đúng với đầu ra mong muốn. Do đó,
trong thực tế ngời ta phải thiết lập tiêu chuẩn dựa trên một giá trị sai số nào đó của
hai giá trị này, hay dựa trên một số lần lặp xác định.
3. Mạng thích nghi(Adaptive network)
3.1. Mạng thích nghi
Mạng thích nghi là một khái niệm đợc Jyh-Shing Roger Jang phát triển từ
năm 1993. Mạng thích nghi đợc phát triển dựa trên mạng nơ-ron lan truyền thẳng
với khả năng học có thầy. Cấu trúc mạng thích nghi cũng bao gồm các nút mạng và
các liên kết trực tiếp giữa các nút mạng, tuy nhiên, sự khác biệt nằm ở chỗ một số
hoặc tất cả các nút mạng có khả năng thích nghi, tức là đầu ra của chúng có khả
năng thay đổi tùy theo các tham số của nút đó, trong khi các nút mạng khác không
có tham số. Tiến trình học của mạng sẽ xác định các tham số của các nút thích nghi
sao cho sai số của mạng là nhỏ nhất.

19

Một số quy trình tính toán mờ và ứng dụng

Vũ Việt Dũng ĐBT2008

Mạng thích nghi là một mạng đa lớp lan truyền thẳng, bao gồm các nút cố
định (hình tròn) và các nút thích nghi (hình vuông) nh hình 5:

Vectơ
đầu

vào

Vectơ
đầu ra

Hình 5: Mạng thích nghi
Mỗi nút của mạng thích nghi đặc trng bởi một hàm đối với các tín hiệu đầu
vào (hàm nút) và một tập các tham số của nút. Hàm nút có thể khác nhau đối với
mỗi nút và phụ thuộc vào hàm đầu vào và hàm đầu ra đợc xác định cho từng mạng.
Liên kết trong mạng thích nghi là liên kết trực tiếp giữa các nút, không có trọng số
đối với các liên kết.
3.2. Phơng pháp luyện mạng bằng thuật toán lan truyền ngợc
Cũng nh các mạng nơ-ron, mạng thích nghi có thể thực hiện tiến trình học
bằng thuật toán lan truyền ngợc dựa trên phơng pháp gradient.
Xét một mạng thích nghi gồm L lớp, lớp thứ k có
lớp thứ k là (k, i) và hàm nút của nó là

nút. Gọi nút thứ i trong

. Do hàm nút phụ thuộc vào tín hiệu đầu

vào và các tham số của nó nên ta có :

Trong đó: a,b,c, là các tham số của nút.
Giả sử cho một bộ dữ liệu luyện gồm P bộ dữ liệu. Gọi

là hàm giá (hay hàm đánh

giá sai số) cho thành phần thứ p của bộ dữ liệu luyện.

đợc tính theo công thức :

20

Vũ Việt Dũng ĐBT2008

Một số quy trình tính toán mờ và ứng dụng

Trong đó:
-

: thành phần thứ m của vectơ đầu ra mong muốn thứ p của mạng ;

-

: thành phần thứ m của vectơ đầu ra qua tính toán thứ p của mạng;

Nh vậy, tổng hàm đánh giá sai số

.

Để thực hiện các thủ tục luyện mạng theo phơng pháp tụt gradient của E
trên không gian các tham số, ta tính toán tỉ lệ sai số

đối với dữ liệu luyện

thứ p và từng hàm nút O. Tỉ lệ lỗi của nút thứ i trong lớp thứ L (L, i) có thể đợc tính
trực tiếp từ công thức (2) :

Đối với nút (k,i). tỉ lệ sai số có thể tính toán bằng luật lan truyền ngợc, cụ
thể :

Với

. Theo đó, tỉ lệ lỗi của một nút bất kỳ thuộc các lớp giữa của

mạng sẽ đợc tính thông qua một tổ hợp tuyến tính của tỉ lệ lỗi các nút trong lớp kế
tiếp.
Gọi

là tham số của mạng thích nghi đang xét, ta có :

Trong đó S là tập các nút có đầu ra phụ thuộc vào .
Ta có mối quan hệ giữa tổng sai số của mạng và tham số
nh sau :

Theo đó, việc cập nhật tham số

sẽ theo công thức sau :

21

đợc biểu diễn

Vũ Việt Dũng ĐBT2008

Một số quy trình tính toán mờ và ứng dụng

Trong đó

là tỷ lệ học đợc tính theo công thức

Với k là bớc chuyển, độ dài của bớc chuyển gradient trong không gian tham số.
Việc thay đổi k sẽ ảnh hởng đến tốc độ hội tụ của phơng pháp luyện.
Trong thực tế, tùy trờng hợp áp dụng, ta có thể sử dụng hai phơng pháp
luyện tham số đối với mạng thích nghi : phơng pháp luyện theo lợt (batch
learning hay off-line learning) và phơng pháp luyện theo mẫu (pattern learning hay
on-line learning). Trong phơng pháp luyện theo lợt, tham số

sẽ đợc cập nhật

theo công thức (6) sau khi toàn bộ dữ liệu luyện đã đợc chạy (sau mỗi vòng lặp).
Đối với phơng pháp luyện theo mẫu, tham số

đợc cập nhật theo công thức (5)

sau khi một bộ dữ liệu luyện đợc chạy.
3.3. Phơng pháp luyện lai (hybrid learning)
Phơng pháp luyện dựa trên gradient trình bày ở trên có thể dùng để xác định
các tham số của mạng thích nghi. Tuy nhiên, phơng pháp gradient thờng có tốc độ
hội tụ chậm và dễ dừng ở các cực tiểu địa phơng. Phơng pháp luyện lai kết hợp
giữa phơng pháp gradient và ớc lợng bình phơng tối thiểu (LSE) sẽ cải thiện
các điểm yếu của phơng pháp cổ điển trên.
a. Phơng pháp luyện lai theo lợt
Để đơn giản, xét mạng thích nghi chỉ có một đầu ra (output)

Trong đó là tập các biến đầu vào và S là tập các tham số. Giả sử tồn tại một
hàm H sao cho hàm hợp

là hàm tuyến tính đối với một số thành phần của S,

khi đó các thành phần này có thể xác định bằng phơng pháp bình phơng tối thiểu.
Bên cạnh đó, nếu tập S có thể phân hoạch thành hai tập

22

Vũ Việt Dũng ĐBT2008

Một số quy trình tính toán mờ và ứng dụng

(trong đó
của

là phép cộng trực tiếp) sao cho

tuyến tính với các thành phần

, áp dụng vào (9) ta có :

là tuyến tính đối với các thành phần của

. Khi đó, với tập

đợc khởi tạo giá trị,

áp dụng tập dữ liệu luyện P vào (11), ta thu đợc phơng trình :

Với X là vectơ chứa các thành phần của tập tham số

. Đặt

, khi đó số

. Thông thờng, số lợng bộ dữ

chiều của A, X và B lần lợt là

liệu luyện P thờng lớn hơn số tham số tuyến tính M, do đó, phơng trình (12) trở
nên quá xác định và không tìm đợc nghiệm chính xác. Vì vậy, ta sử dụng phơng
pháp ớc lợng bình phơng tối thiểu với

để tối thiểu hóa bình phơng sai số

. Đây là bài toán quen thuộc trong hồi quy tuyến tính, lọc thích nghi và
xử lý tín hiệu.

Với

đợc tính bằng công thức :

là ma trận chuyển vị của A.

là ma trận giả nghịch đảo của A nếu

không kì dị.
Công thức (13) tuy ngắn gọn, nhng đòi hỏi khối lợng tính toán rất lớn vì
phải làm việc với ma trận nghịch đảo, hơn nữa, sẽ gặp khó khăn khi

kì dị. Để

ớc lợng bình phơng tối thiểu của X, ta áp dụng công thức chuỗi để tính toán.
Phơng pháp này cho hiệu quả tính toán tốt hơn (đặc biệt trong trờng hợp M nhỏ)
và dễ dàng sửa đổi để áp dụng cho phơng pháp luyện mẫu.
Gọi

là dòng thứ i của ma trận A,

có thể đợc tính qua chuỗi sau :

23

là thành phần thứ i của B. Khi đó, X

Vũ Việt Dũng ĐBT2008

Một số quy trình tính toán mờ và ứng dụng

Trong đó
và

là ma trận hiệp phơng sai và
, với I là ma trận đơn vị kích thớc

. Khởi tạo chuỗi (14) với
. Trong trờng hợp hệ mạng

thích nghi nhiều đầu ra ( output trong công thức (9) là một vectơ cột), công thức
(14) vẫn có thể áp dụng với

là dòng thức i của ma trận B.

Nh vậy, ta có thể kết hợp phơng pháp gradient và phơng pháp ớc lợng
bình phơng tối thiểu để cập nhật các tham số cho mạng thích nghi. Mỗi vòng lặp
của quá trình luyện lai sẽ gồm hai pha : pha tiến và pha lùi. Trong pha tiến, ta sử
dụng các dữ liệu luyện đầu vào, tính toán đầu ra của từng nút cho đến khi thu đợc
ma trận A và B tại công thức (12) và các giá trị tham số trong

đợc tính toán theo

công thức (14). Trong pha lùi, ta thực hiện quay lui trên mạng, sử dụng thuật toán
gradient để tính toán cá giá trị của

theo công thức (7).

b. Phơng pháp luyện theo mẫu
Phơng pháp luyện theo mẫu hay luyện online rất cần thiết cho các mạng có
tính thay đổi cao. Để chuyển từ phơng pháp luyện theo lợt sang luyện theo mẫu,
đòi hỏi thủ tục tụt theo gradient phải dựa trên

(công thức(5)) thay vì E. Nh vậy,

thực chất không phải dùng thủ tục gradient thực sự để cực tiểu hóa E, tuy nhiên ta có
thể xấp xỉ thủ tục gradient bằng cách sử dụng tỷ lệ học nhỏ.
Đối với công thức chuỗi bình phơng tối thiểu trong trờng hợp mạng thay
đổi liên tục, ta cần giảm ảnh hởng của bộ dữ liệu cũ trớc khi áp dụng bộ dữ liệu
mới. Một phơng pháp đợc áp dụng là thêm vào công thức (14) một hệ số quên

:

với
Rõ ràng,

càng nhỏ thì ảnh hởng của dữ liệu cũ càng đợc giảm. Tuy

nhiên, việc lựa chọn

quá nhỏ có thể dẫn đến tính bất ổn định của công thức và nên

đợc hạn chế.

24

Một số quy trình tính toán mờ và ứng dụng

Vũ Việt Dũng ĐBT2008

4. Hệ thống suy diễn mờ dựa trên mạng thích nghi( Adaptive network
based fuzzy inference system: ANFIS)
ANFIS là một lớp mạng riêng của các mạng thích nghi, có chức năng tơng
đơng với một hệ suy diễn mờ. Mạng ANFIS thờng đợc sử dụng để mô hình hóa
các hệ suy diễn mờ dạng Takagi-Sugeno.
4.1. Cấu trúc mạng ANFIS
Xét một hệ mờ dạng Takagi Sugeno gồm hai luật mờ:
: Nếu

là

và

là

thì

: Nếu

là

và

là

thì

Hình 6 : Hệ suy diễn mờ Takagi-Sugeno
Dễ thấy, ta có một mạng thích nghi 5 lớp tơng ứng với hệ suy diễn mờ trên
với cấu trúc nh hình 7. Một mạng thích nghi nh vậy đợc gọi là một hệ suy diễn
mờ dựa trên mạng thích nghi.

Hình 7 : Cấu trúc mạng ANFIS đơn giản.

25

Một số quy trình tính toán mờ và ứng dụng

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về