Tải bản đầy đủ (.doc) (45 trang)

Nội suy bởi hàm cơ sở, bán kính RBF

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.41 MB, 45 trang )

MỤC LỤC
1.3 Tính gần đúng đạo hàm bằng đa thức nội suy....................................................................13
1.4.1 Hàm hàm cơ sở bán kính (Radial Basis Function networks)...........................................16

1


MỞ ĐẦU
Ngày nay với sự phát triển mạnh mẽ của công nghệ thông tin, con người đã
ứng dụng những thành tựu của nó trong rất nhiều lĩnh vực khác nhau. Máy tính
đã trở thành một công cụ hỗ trợ đắc lực cho con người trong việc xử lý dữ liệu
một cách nhanh chóng và chính xác.
Từ khoảng hai chục năm nay người ta đã và đang phát triển một kỹ thuật
nội suy mới có độ chính xác cao. Đó là nội suy bởi hàm cơ sở bán kính (Radial
Basis Functions) viết tắt là RBF. Phương pháp nội suy này đã được sử dụng
trong nhiều lĩnh vực của CNTT như xử lý tín hiệu, xử lý ảnh, đồ họa máy tính
và lý thuyết điều khiển. Một số phần mềm về hàm RBF và các ứng dụng cũng
đã được phát triển. Ngoài ra, một lĩnh vực ứng dụng khác rất hiệu quả của nội
suy RBF là tính toán khoa học. Các kỹ thuật RBF được sử dụng ngày càng nhiều
trong việc giải số phương trình đạo hàm riêng, đặc biệt là các bài toán phi tuyến
và/hoặc các bài toán trong các miền hình học phức tạp. Lĩnh vực này được phát
triển dựa trên nền tảng của hình học họa hình, hình học tính toán, hình học vi
phân cùng nhiều kiến thức toán học của đại số và giải tích, cũng như các thành
tựu của phần cứng máy tính.
Luận văn gồm có ba chương:
Chương 1. Nội suy hàm nhiều biến bởi hàm RBF
Khái niệm cơ bản về nội suy và xấp xỉ hàm số
Một số phương pháp nội suy hàm một biến
Nội suy hàm nhiều biến
Hàm cơ sở bán kính và các tính chất
Nội suy bởi hàm RBF


Chương 2. Phương trình khuyếch tán - truyền tải
Giới thiệu bài toán
Phương pháp sai phân giải phương trình khuyếch tán - truyền tải
Một số thí dụ tính toán
Chương 3. Giải phương trình khuếch tán - truyền tải bằng phương
pháp không lưới

2


Chương trình MATLAB giải bài toán bằng phương pháp sai phân và
phương pháp RBF
Em xin được bày tỏ lòng biết ơn đến thầy giáo PGS.TS. Đặng Quang Á đã
tận tình hướng dẫn em hoàn thành luận văn này. Em cũng xin chân thành cảm
ơn các thầy cô giáo, bạn bè, đồng nghiệp, Khoa Công nghệ Thông tin – Đại học
Thái Nguyên đã động viên, giúp đỡ em trong quá trình học tập và nghiên cứu.
Thái Nguyên, ngày 30 tháng 10 năm 2010

3


CHƯƠNG 1 : NỘI SUY HÀM NHIỀU BIẾN BỞI HÀM RBF
1.1 XẤP XỈ HÀM BẰNG NỘI SUY
1.1 .1Bài toán nội suy.
Giả sử chúng ta có hàm số y=f(x), và biết giá trị của nó tại các điểm x0
=a < x1đơn giản xácđịnh trên [a,b] sao cho: y= f(x) ≅ g(x) và g(xi) =yi
Hàm f(x) thường là hàm thực nghiệm hoặc hàm khó tính giá trị nên chỉ
xác định giá trị tại một số điểm nhất định. Các điểm xi (i=0,..,n) gọi là các mốc
nội suy.

Về mặt hình học bài toán nội suy được diễn đạt như sau: Tìm hàm g(x) có
đồ thị đi qua các điểm (xi, f(xi))
y = f(x)
y = g(x)

f(xi)

xn= a

xn= b

xi

(1.1)

Lược đồ giải bài toán nội suy.
Người ta cố gắng tìm hàm G(c0, .., cn, x) khá đơn giản, thỏa mãn một số
điều kiện nhất định và phụ thuộc n+1 tham số ci . Các tham số ci này sẽ được
xác định nhờ hệ phương trình sau:
G(c0,..,cn,xk) = yk với k=0,..,n

(1.2)

Thường người ta chọn hàm G có dạng:
G (c0 , c1 ,..., cn , x ) = ∑ ckϕk ( x )
(1.3)
4


k =0

Trong đó các hàm {ϕk(x)} (k=0;n) là họ hàm độc lập tuyến tính cho trước
và thỏa mãn điều kiện
| ϕk(xi) | ≠ 0

(1.4)

Khi đó hệ (2.2) là luôn giải được và có duy nhất nghiệm đối với ci.
Các hàm {ϕk(x)} (k=0;n) được chọn theo kinh nghiệm hoặc bằng hàm
xk để dễ tính toán
Với các ci (i=0;n) tìm được, hàm g(x) = G(c0, .., cn, x) gọi là hàm
nội suy và dùng làm công thức để tính giá trị của hàm f(x) với các x trong
đoạn[a,b].
1.1.2 Đa thức nội suy Lagrange
Lagrange đã xét trường hợp ϕk(x) = xk, (k=0;n), khi đó hàm nội suy là đa
thức bậc n. Còn định thức | ϕk(xi) | là định thức Vandermon nên khác không.
Tuy vậy giải hệ (1.2) với n lớn vẫn rất khó khăn nên Lagrange đã xây dựng đa
thức nội suy đơn giản sau.
1.1.2.1 Xây dựng đa thức nội suy
Ký hiệu L(n)(x) là đa thức nội suy cần tìm. Lagrange chọn đa thức này dưới
n

dạng L(n) =

∑ y (k ) L ( x)
k =0

k
n

(1.5)


k
Trong đó Ln ( x) (k=0;n) là (n+1) đa thức bậc n có nghiệm x= x i (với i ≠ k)


Lkn ( x) =1. Thấy
Lkn ( x) =

Π( x − x i ) i ≠k
(1.6)
Π ( xk − xi ) i ≠ k

Khi đó Ln(x) là đa thức nội suy cần tìm.
5


Ví dụ: Giả sử với hàm y = f(x) ta đo được tại các điểm x 0, và x1 tương ứng
là y0 = f(x0) và y1 = f(x1) thì:
L10 ( x) =

(x − x 0 )
( x0 − x1 )

L11 ( x) =

(x − x 0 )
( x0 − x1 )

Từ 2.5 ta được
L1(x) =


y −y
y 0( x − x1 ) y1( x − x0)
+
= y0 + 1 0 ( x − x0 )
xo − x2
( x1 − x0 )
x1 − x0

Đây chính là đường thẳng đi qua 2 điểm (x0,y0) và (x1,y1).
Ví dụ: hàm y = f(x) đo được tại 4 điểm như sau:
x

0

1

2

3

xi

0

0.1

0.3

0.5


yi

-0.5

0

0.2

1

Khi đó ta có:
L03 ( x) =

( x − 0.1)( x − 0.3)( x − 0.5)
x 3 − 0.9 x 2 + 0.23 x − 0.015
=−
(−0.1)(−0.3)( −0.5)
0.015

L23 ( x) =

x( x − 0.1)( x − 0.5)
x3 − 0.6 x 2 + 0.25 x
=−
(0.3)(0.2)(−0.2)
0.012

x( x − 0.1)( x − 0.3)
x 3 − 0.4 x 2 + 0.03 x

L ( x) =
=−
(0.5)(0.4)(−0.2)
0.04
3
3

L33 ( x) =

x( x − 0.1)( x − 0.3)
x 3 − 0.4 x 2 + 0.03 x
=−
(0.5)(0.4)(0.2)
0.04

1
Vì y1= 0 nên không cần tính L3 ( x)

L(3) = y0 L3 ( x) + y2 L3 ( x) + y2 L3 ( x) =
0

2

3

125 3
73
x − 30 x 2 + x − 0.5 là đa thức nội suy
3
12


cần tìm.
1.1.2.2 Sai số nội suy
Với x∈[a,b] ta ước lựong sai số f(x) – Ln(x), trong đó x cho trước.
6


ωn(t) = (t-x0) (t-x1) ..(t-xn)

Đặt

Rõ ràng nếu x không bằng mốc nội suy thì ωn(x)≠ 0, nên tìm được hằng
số k để:
f(x) – Ln(x) = k.ωn(x) (1.7)
Xét hàm số: F(t) = f(t) - Ln(t)-k.ωn(t) (1.8)
Hàm này có n+2 nghiệm phân biệt

t=xi (i=0;n) và t=x; Bằng phương

pháp quy nạp có thể chứng minh được rằng tồn tại điểm c ∈[a,b] sao
cho F(n+1) (c)=0. Vì Ln là đa thức bậc n nên có thể tính đạo hàm cấp (n+1)
biểu thức (2.2). Ta có:
F(n+1)(c) = f(n+1) (c) – 0 – k (n+1)! =0
k=

f ( n +1) (c)
(2.5)
( n + 1)!

Thay giá trị của k vào biểu thức (2.1) ta được

f ( x ) − Ln( x ) = f ( n +1) (c )

ω (c )
(1.9)
(n + 1)!

Điểm c thay đổi khi x thay đổi. Nếu đạo hàm cấp (n+1) của f bị chặn: |
f(n+1)(x)| ≤M (2.7)
với ∀x ∈[a,b] thì ta có ước lượng sai số nội suy là:
M

│f(x)- Ln(x)│ ≤ (n + 1)! │ωn(x)│(1.10)
1.1.3 Đa thức nội suy với mốc cách đều.
Ta xét trường hợp đặc biệt khi các mốc nội suy cách nhau một đoạn bằng
nhau:
∆xi= xi+1 – xi = h = (b-a) /n (với i=0; n –1)(2.9)
Dùng phép đổi biến (x – x0)/h = t , các đa thức Lkn ( x) sẽ là đa thức theo t
chỉ phụ thuộc vào số mốc n và có nhiều cách biểu diễn đơn giản, dễ sử dụng
7


hơn.

8


1.3.1 Công thức tổng quát
Đặt

x – x0 = h.t


(1.11)

Ta có: x – xk = (t – k) h; ∀k=1 ; n ; xj – xk = (j – k) h
Thay vào (1.6) ta được:
L ( x) = P
k
x

k
n

(1.12)

Π ( x − x ) t (t − 1)..(t − k + 1)(t − k − 1)..(t − n)
(t ) =
=
( −1) k !( n − k )!
Π( x − x )
i

i≠k

n −k

k

i≠k

i


Hay
Pnk (t ) = (−1) n − k

Cnk
t (t − 1)...(t − k + 1)(t − k − 1)..(t − n)
n!

không phụ thuộc vào mốc nội suy. Tùy theo từng trường hợp người ta có
các công thức hàm nội suy thích ứng.
1.1.3.2 Sai phân hữu hạn
Trong trường hợp các mốc nội suy cách đều xi+1 – xi =∆xi = h =const
với i=0,..,n-1. Các sai phân hữu hạn được định nghĩa như sau:
Sai phân cấp 1: ∆yi = yi+1 – yi
Sai phân cấp 2: ∆2yi =∆yi+1 –∆yi
........
Sai phân cấp k: ∆kyi =∆k-1yi+1 –∆k-1yi
Để tính sai phân hữu hạn bằng tay người ta thường dùng bảng như sau:
x

y

∆y

∆2y
∆2y

0

∆3y

∆3y

0

∆4y
∆4y

∆2y1

∆3y1

∆4y1

∆y3

∆2y2

∆3y2

∆y4

∆2y3

x0 x1 x2 x3 y0 y1 y2 y3 ∆y0
x4 x5

y4 y5

∆y1
∆y2


Ví dụ với hàm y=ex ta có bảng sai phân với 4 mốc như sau:
9

0

∆5y
∆5y

0


x

y

∆y

x0

3.60 36,598

1,877

∆2y
0,095

x1

3.65 38,475


1,972

0,102

x2

3,70 40,447

2,074

x3

3,75 42,521

∆3y
0,007

1.1.3.3 Công thức nội suy Newton
Với các sai phân định nghĩa như trên ta có công thức nội suy Newton hay
còn gọi là công thức Newton .
Với phép biến đổi x-x0 = ht như trên ta có
Ln ( x) = Pn (t ) = y0 + t ∆y 0 +

t (t − 1) 2
t (t − 1)....(t − n + 1) n
∆ y0 + ... +
∆ y0
2!
n!


Với phép biểu diễn sai số:
Rn ( x ) = h n +1

t (t − 1)....(t − n)
n!

Với y = ex có hàm nội suy là:
g ( x) ≈ 36.598 + 1.877t +

0.095
0.077
t (t − 1) +
t (t − 1)(t − 2)
2
6

trong đó x = 3,60 + 0,05 t.
1.2. XẤP XỈ BÌNH PHƯƠNG TỐI THIỂU
Trên đây chúng ta đã xét bài toán xấp xỉ hàm với đòi hỏi hàm gần đúng
phải có giá trị trùng với giá trị đã biết tại các mốc nội suy. Khi số mốc nội suy
lớn thì số tham số cần tìm để xác định hàm g(x) càng nhiều. Nếu nội suy
bằng đa thức thì bậc đa thức sẽ lớn khi có nhiều mốc nội suy, kết quả không ổn
định. Để khắc phục nhược điểm trên người ta chấp nhận giá trị gần đúng ở các
mốc đo được và chọn hàm dạng đơn giản có sai số bình phương nhỏ nhất. Đó
chính là phương pháp bình phương tối thiểu.
1.2.1 Xấp xỉ thực nghiệm.
10



Bài toán: Giả sử có thể đo dược giá trị của hàm y=f(x) tại n điểm thuộc
đoạn [a,b]:
x1 < x2< . . .
yi = f(xi) (i=1;n)

Với k ≤ n – 1 ta tìm được hàm
ϕ(x) = Φ( c1, .. ck, x)

(2.1)

trong đó, Φ là hàm cho trước, cj là các tham số cần tìm sao cho sai số
trung bình bình phương nhỏ nhất.

∑=

1 n
(ϕ ( xi ) − yi ) 2 (2.2)

n i =1

Khi đó ta nói hàm ϕ(x) là xấp xỉ tốt nhất của y(x) trong lớp các
hàm có dạng (2.1) theo nghĩa bình phương tối thiểu.
Về mặt hình học, đồ thị hàm y=ϕ(x) không đòi hỏi đi qua các điểm (xi,
f(xi)) như trong phép nội suy.
Bài toán tìm cực tiểu hàm trong trường hợp tổng quát là rất khó.
Trong trường hợp hàm Φ( c1, .. ck, x) có dạng:
k

Φ (c1 ,...ck , x) = ∑ c jϕ j ( x) (2.3)

j =1

trong đó ϕk(x) là các hàm độc lập tuyến tính và có dạng đơn giản thì cực
trị toàn cục của hàm Σ có thể xác định được nhờ giải hệ phương trình đại số
tuyến tính của điều kiện các đạo hàm cấp 1 bằng không.
1.2.2 Xấp xỉ bằng đa thức
Với k ≤ n – 2 ta tìm xấp xỉ tốt nhất của y(x) dưới dạng đa thức bậc k:
k

Pk ( x) = ∑a j x j
j =0

Khi đó sai số trung bình bình phương là:

∑=

1 n k
∑ (∑ a jx ij − y j )2 (2.4)
n i =1 j = 0

11


Để tìm cực tiểu của (2.4) ta giải hệ phương trình đại số tuyến tính :

∂a p

∑ = 0; p = 0,...k

(2.5)


Hay
n

k

n

i =1

j =0

i =1

∑ (∑ a j xij ) xip = ∑ yi x jp ; p = 0,...k
k

n

n

j =0

i =1

i =1

p+ j
p
Hệ ∑ aj∑ xi = ∑ yi xi ; p = 0,...k (2.6)có duy nhất nghiệm a0,..,ak cho ta


xấp xí tốt nhất
Để làm ví dụ ta xét xấp xỉ bậc nhất (k=1). Khi đó y(x) được xấp xỉ bằng:
P(x) = a.x +b và hệ (2.6) trở thành:
n

n

i =1

i =1

n

a ∑ xi2 + b∑ xi = ∑ xi yi
i =1

n

n

i =1

i =1

a ∑ xi + nb = ∑ yi

(2.7)

Để giải ra a và b ta phải tính các hệ số với các giá trị xi, yi cho trước. Ví

dụ nếu ta có:
xi = -1; 0;
yi = 4; 1;
thì hệ (2.7) có dạng:

1;
2;

2;
0;

4
-3

22a+6b=-14
6a+5b=4
Hệ này có nghiệm a = – 42/37, b= 86/37 và xấp xỉ tốt nhất
P( x) = −

42
86
x+
37
37

1.2.3 Xấp xỉ hàm khả tích
Gọi L2(a,b) là tập các hàm bình phương khả tích trên đoạn [a,b] và
y = f(x) ∈L2(a,b). Ta muốn xấp xỉ y(x) bởi hàm ϕ(x) có dạng:
ϕ(x) = Φ( c1, .. ck, x)


(2.8)
12


trong đó c1, .. ck là các hệ số được xác định sao cho sai số bình phương
trung bình:

∑=

b

1
(ϕ ( x ) − f ( x)) 2 d ( x)

b−aa

(2.9)

đạt cực tiểu. Khi đó ta nói hàm ϕ(x) là xấp xỉ tốt nhất của hàm f(x) trên
đoạn [a,b] theo bình phương tối thiểu.
1.3 Tính gần đúng đạo hàm bằng đa thức nội suy
- Giả sử người ta phải tính xấp xỉ đạo hàm của hàm số f(x) trên đoạn (a,b).
Trước hết người ta thay hàm f(x) bằng đa thức nội suy p(x), sau đó lấy đạo hàm
p'(x) và coi là xấp xỉ của đạo hàm f'(x).
Ta có thể dùng công thức nội suy Lagrange để tính đạo hàm:

Vì điểm c phụ thuộc x nên ước lượng (3.3) chỉ đánh giá được khi x là các
mốc nội suy x=xi;
Thông thường người ta xét đa thức nội suy với mốc cách đều với h=xi+1 – xi.
Ví dụ.

Giả sử ta xác định được đa thức nội suy là:
p3(x) =8x3 -29x +5
Khi đó đạo hàm:
p3'(x) = 24x2 -29 được xem là xấp xỉ của f'(x).
Tính đạo hàm cấp 1.
Đạo hàm tại các điểm biên.
Khi x là điểm biên x0 hoặc xn ta dùng công thức nội suy bậc nhất với hai
mốc nội suy để tính gần đúng đạo hàm:
13


y’(x0) = (y1-y0)/h
y’(xn) = (yn-yn-1)/h
Vì yn = yn-1 + y’(xn) h + 0(h2) nên sai số của ước lượng O(h2).
Đạo hàm tại các điểm trong.
Khi x=xi là các điểm trong (i=1,2,..,n-1) ta dùng công thức nội suy bậc 2 có xi là
điểm giữa

với x = xi-1 +ht
Đạo hàm theo x ta được:

thay x=xi hay t=1 vào công thức trên ta được:

hay

với ∀i=1,2,…,n-1.
Để tính ước lượng sai số ta có các công thức:

14



hay công thức có sai số là O(h2).
Đạo hàm cấp 2.
Để tính đạo hàm cấp 2 ta dùng công thức nội suy cấp 2 để tính y’’(x i). Đạo
hàm hai lần liên tiếp biểu thức ta có:

ta có các công thức sau:

Vậy sai số có bậc O(h2).
Chúng ta đã có công thức tính đạo hàm cấp 1 và cấp 2 tại các mốc nội suy.
Để tính đạo hàm tại các điểm không là mốc ta lại áp dụng phương pháp nội suy
Lagrange.
Sai số khi tính đạo hàm ngoài sai số của công thức còn phải tính đến sai số
làm tròn, và các bước nội suy h phải đủ nhỏ.
Ví dụ: Hàm y=f(x) được cho tại các mốc sẽ có đạo hàm cấp 1 và cấp 2 tại
các mốc này được tính và cho trong bảng sau:

15


1.4. HÀM CƠ SỞ BÁN KÍNH VÀ CÁC TÍNH CHẤT
1.4.1 Hàm hàm cơ sở bán kính (Radial Basis Function networks)
Hàm phân lớp tuyến tính đơn thuần (Perceptron) không thể phân lớp trong
một số trường hợp. Ví dụ như hàm XOR: {(0,0),{1,1)} Є ω1. {(1,0),(0,1)} Є ω2
Khả năng nhớ các mẫu học: nếu đầu vào của hàm phân lớp “gần giống”
với một mẫu học đã biết trước đó thì kết quả phân lớp cũng phải “gần giống” kết
quả phân lớp đã được học.
Ý tưởng phân lớp trên không gian có nhiều chiều hơn: có nhiều ví dụ cho
thấy, khi được ánh xạ lên không gian nhiều chiều hơn lúc đầu, bài toán phân lớp
trở nên dễ dàng hơn.

1.4.2 Tính chất hàm bán kính (radial function): Hàm bán kính là hàm chỉ
phụ thuộc vào khoảng cách từ đối số x đến một điểm c (gọi là tâm) cho trước.
W ( x) = W ( x − A ) = W ( r )

với r = x − A

(1)

 − x2 
2
W ( r ) = exp 
 = exp − β r
 2σ 

{

Hàm Gaussian:

}

(2)

Hàm đa thức:

W ( x ) = r 2 k +1

(3)

Hàm spline:


W ( x ) = x 2 ln x

(4)

Khoảng cách:

W ( r) = r2 + β 2

(5)

Trong đó:
A – Véc tơ chứa các tâm RBF.
W – Hàm cơ sở hoặc hàm kích hoạt của hàm.
r – Bán kính.
σ, β – Các thông số tỷ lệ.
|| . || - Chuẩn euclidean, tức là nếu x chứa n phần tử thì:
x =

n

∑x
i =1

2
i

(6)
16



1.4.3 hàm cơ sở bán kính (RBF):
Giả sử ta có D tâm c 1…cD, khi đó hàm hàm cơ sở bán kính là tổ hợp tuyến
tính của các hàm bán kính tại các tâm này

Như vậy
1. Hàm hàm cơ sở bán kính đã tạo ra ánh xạ

với

.

2. Kết quả của hàm là

vì vậy, đây là hàm tuyến tính phân lớp dữ liệu trên không gian

.

3. Hàm RBF còn có thể dùng để xấp xỉ hàm số nếu ta trực tiếp dùng đầu ra
.
Hàm RBF: Với tập mẫu học D= {(xi, yi)}N với i = 1..N
ta phải tìm các tham số của hàm bao gồm: trọng số W = ( ω1 ……., ωD)T
tâm của các hàm bán kính C= C1. ….CD, tham số của các hàm bán kính
B= {β1 … βD} .
Hàm sai số (error function): Để xác định các tham số của hàm, ta phải đưa
ra một tiêu chí đánh giá các tham số này khi áp dụng hàm RBF trên tập mẫu học
. Một tiêu chí đánh giá hay dùng là hàm tổng bình phương sai số

17



Hàm tổng bình phương sai số hay được sử dụng vì thuận tiện trong tính
toán đạo hàm. Gần đây, người ta nhận ra một số nhược điểm của loại hàm sai số
này và có xu hướng chuyển sang các hàm sai số khác. Ví dụ, hàm tổng sai số
tuyệt đối

hoặc hàm sai số tuyệt đối lớn nhất

Trường hợp B, C cố định: giải bài toán tối ưu

Nếu ta đặt

thì bài toán trên tương đương với

Đây là bài toán tối thiểu bình phương sai số kinh điển. Trường hợp
hạng đầy đủ (full rank), giá trị tối ưu của

trong đó





gọi là ma trận giả nghịch đảo.Trong thực hành,

người ta không dùng ma trận giả nghịch đảo mà sử dụng biến đổi Gauss để giải
(giống như giải hệ phương trình tuyến tính). Một đặc điểm nữa của

theo công

thức trên là


nghĩa là

là vectơ có độ dài nhỏ nhất trong các véctơ

tối thiểu hóa

. Đặc điểm này có ý nghĩa lớn vì nó làm tăng tính ổn định của hệ thống
(không làm f(x) quá lớn).

18


Trường hợp C= {x1……xN}: Nghĩa là tâm của các hàm bán kính chính là
các mẫu học. Khi đó, ma trận

là ma trận vuông, ta có giá trị tối ưu của trọng số

Tất nhiên, trong thực hành, người ta không tính nghịch đảo của
biến đổi Gauss để giải phương trình

mà dùng

.

Trường hợp B, C cũng là tham số cần tìm: Ta cần giải bài toán tối ưu

Do hàm sai số này không còn là hàm lồi, cách giải quyết thường dùng là sử
dụng phương pháp xuống đồi theo véctơ đạo hàm. Khi đó, người ta lấy đạo hàm
của e2(W, B, C) theo các biến W, B, C rồi chỉnh lại các tham số này. Một cách

tối ưu hóa khác là:
1. Cố định B, C, tính
2. Cố định

theo phương pháp trên.

, chỉnh sửa B,C theo phương pháp đạo hàm.

3. Lặp bước 1,2.
Trong thực hành, người ta thấy việc tìm B,C rất mất thời gian. Do đó, các tâm
C thường được chọn là chính các mẫu học. Còn đặt giá trị
sau đó chọn thử một vài giá trị β đến khi đạt được kết quả như ý.
Ví dụ 1: Hàm XOR
Giả sử ta chọn
trận

, các tâm chính là các mẫu học, khi đó ma



Thế W mới tìm được vào hàm f(x):

ta có thể tính được f(x) như trong hình sau
19


Xấp xỉ hàm XOR bằng hàm RBF
Để ý rằng tại các mẫu học, hàm RBF cho kết quả chính xác:
f(xi)= yi, i= 1,2, 3, 4
Ví dụ 2: Vẫn xấp xỉ hàm XOR nhưng ta dùng ít tâm hơn

c1= (0,0)
c1= (1,0)
c1= (0.5,0)
Với trọng số

này, đồ thị của hàm f(x) = {W, Φ (x)} như sau

20


Xấp xỉ hàm XOR bằng hàm RBF với 3 tâm
Như vậy, nếu số tâm ít hơn số mẫu học, hàm có thể không học được toàn bộ
tập mẫu học. Tuy nhiên, ở những vị trí mẫu học gần tâm, kết quả phân lớp vẫn
chính xác.
Xác định số tâm của hàm: Ta thấy ở ví dụ trên, số tâm của hàm ảnh hưởng
đến chất lượng xấp xỉ hàm số. Để xác định số tâm người ta thường làm như sau:
1. Bắt đầu với số tâm bằng D= 0 hay f(x)= 0 ∀x
2. Tính sai số

và chọn i max = arg max e(xi)

3. Thêm một tâm
4. Tính trọng số

5. Dừng nếu

của hàm mới và giá trị hàm sai số

cho trước, ngược lại, quay về bước 2.


Như vậy mỗi lần thêm 1 tâm tức là ta thêm 1 cột mới vào ma trận .
Dùng biến đổi QR (Gram-Schmidt QR decomposition) để trực giao hóa cột
mới thêm vào
Lợi dụng tính trực giao của các cột để tính sai số e (xi).
1.4.4 Quá trình học của hàm:
Việc luyện hàm RBF phụ thuộc vào việc chọn tâm như thế nào. Có 2 kỹ
thuật luyện hàm RBF:
-

Chọn các giá trị của tâm cố định. Sau đó sử dụng kỹ thuật thích

nghi để luyện hàm tìm ra các trọng số Bi tối ưu.
-

Giá trị của tâm không được chọn cố định mà được chọn trong quá

trình luyện. Như vậy cả Ai và Bi được tìm trên cơ sở sử dụng các phương trình
giảm gradient.

21


Kỹ thuật sau chậm hơn kỹ thuật trước, nhưng nếu tập dữ liệu bị giới hạn
thì kỹ thuật sau sẽ cho kết quả tốt hơn.
Với tập mẫu học D = { x i , yi } i =1 ta phải tìm các tham số của hàm bao gồm:
N

T
trọng số B = ( B1 ,..., BM ) , tâm của các hàm bán kính A = { A1 ,..., A M } , tham số của


các hàm bán kính β = { β1 ,..., βM } .
Ví dụ với kỹ thuật thứ nhất:
Sau khi có được hàm kích hoạt ở trên ta xác định được ma trận trọng số B
từ công thức:
Y = W.B  B = W-1Y

(7)

(Vậy ta cần phải xác định được ma trận nghịch đảo của W).
Nếu ma trận W không vuông nhưng có hạng đầy đủ ta có thể tính W-1 theo
công thức sau:
B = (WTW)-1WTY

(8)

Đối với mỗi hàm, việc xấp xỉ được lưu giữ trong các trọng số và tâm của
RBF. Tuy nhiên các trọng số này không phải là duy nhất. Giả sử ta có M tâm
A1…AM, khi đó hàm hàm cơ sở bán kính RBF là tổ hợp tuyến tính của các hàm
bán kính tại các tâm này và có biểu diễn toán học như sau:
M

(

f ( x ) = ∑ BijWj x j − Ai
j =0

)

(9)


Trong đó:
f(x) – Hàm nhận được từ đầu ra của hàm.
B – Véc tơ chứa các trọng số RBF.
Mỗi tâm Ai có cùng số chiều với vécto đầu vào x. Các tâm cũng là các
điểm bên trong không gian dữ liệu đầu vào và được chọn sao cho chúng thể hiện
dữ liệu đầu vào. Khi RBF tính toán quá trình xấp xỉ đối với một số điểm dữ liệu
đầu vào thì khoảng cách giữa các điểm đầu vào và mỗi tâm được tính theo
khoảng cách euclidean. Những khoảng cách này được chuyển qua W sau đó
được trọng số hóa bằng Bi và được tổng hợp lại để sinh ra toàn bộ RBF.
22


Hàm Gaussian thể hiện hình ảnh mỗi đầu ra của hàm cơ sở sẽ xa hơn
hoặc gần hơn so với các điểm dữ liệu x = A i – tâm hàm cơ sở. Mặt khác dạng
Gauss của RBF cung cấp các ghép nối qua logic mờ và mỗi vị trí tâm hàm cơ sở
có ý nghĩa vật lý nhất định. Xa hơn nữa mỗi tâm có thể được xem như một dạng
hành vi hoặc phản ứng không chỉ của RBF mà còn là của hệ thống mà RBF thực
hiện nhận dạng. Ngoài ra có thể có các lựa chọn khác đối với hàm cơ sở như
hàm spline làm việc rất hiệu quả trong bài toán nhận dạng mô hình.
Nhận xét:
• Hàm hàm cơ sở bán kính có hàm kích hoạt dạng:
W ( x ) =  W ( x − A1 ) ...W ( x − A M ) 

T

• Kết quả của hàm là:
f ( x ) = { B, W ( x ) }

vì vậy, đây là hàm tuyến tính phân lớp dữ liệu trên không gian RM.
• Hàm RBF còn có thể dùng để xấp xỉ hàm số nếu ta trực tiếp dùng đầu ra

y( x) .

Khi sử dụng hàm RBF trong bài toán nhận dạng cần chú ý một vài điểm
sau:
- Dạng W nào cần chọn? (Thường chọn Hàm Gaussian)
- Bao nhiêu tâm sẽ cho kết quả tốt nhất và tâm cần đặt ở đâu?
- Bao nhiêu dữ liệu cần thiết đủ để luyện hàm?
Nhưng chưa có thuật nào chọn trọng số ban đầu mà thường chỉ là cho trước
ngẫu nhiên. Muốn tìm mô hình tốt nhất cho đối tượng điều khiển thì cần thiết
phải tìm số lượng tâm tối ưu. Có quá nhiều tâm hoặc quá ít tâm sẽ cho kết quả
không tốt. Nhiều tâm quá sẽ không đủ dữ liệu luyện hàm, nhưng ít tâm quá sẽ
cho mô hình sai lệch. Thuật bình phương tối thiểu trong trường hợp có nhiều
tâm sẽ tạo ra trọng số liên kết wi lớn.
23


CHƯƠNG 2: PHƯƠNG TRÌNH KHUẾCH TÁN TRUYỀN TẢI
2.1 Giới thiệu bài toán
Hiện nay có rất nhiều thuật toán với các sơ đồ sai phân khác nhau để giải
bài toán truyền tải khuếch tán vật chất một, hai và ba chiều
∂c
∂c
∂c
∂c
∂2 c ∂2 c
∂ ∂c
+u
+v
+w
−v ( 2 + 2 ) −

µ
= f (1)
∂t
∂x
∂y
∂z
∂x
∂y
∂z ∂z
∂C
+ ΩC = f (2)
∂t

(1+ τθΩ)Ck+1=τ f k+1 + [1- τ (1- θ)Ω]Ck (3)
(1+ τθΩ1)(1+ τθΩ2)(1+ τθΩ3) + O(τ 2) (4)
τ f k+1 + [1- τ (1- θ)Ω]Ck + O(τ 2) (5)
(1 + τθΩ1) C k+1/3= τ f k+1+ [1- τ (1- θ)Ω]Ck (6)
(1 + τθΩ2) C k+2/3= C k + 1/3 (7)
(1 + τθΩ3) C k+2= C k + 2/3 (8)
Về mặt lý thuyết người ta thường cố gắng xây dựng các thuật toán ổn định
với bậc xấp xỉ càng cao càng tốt. Tuy nhiên trong thực tiễn tính toán không phải
bao giờ bậc xấp xỉ cao cũng tốt hơn bậc xấp xỉ thấp. Điều đó cụ thể do Δt và h
= max{Δx, Δy, Δz} không thể lấy quá nhỏ, hoặc thuật toán có bậc xấp xỉ cao
phức tạp hơn nên sai số tính toán, làm tròn của máy tính lớn hơn, hoặc do điều
kiện ràng buộc của Δt và h, hoặc do điều kiện địa hình quá phức tạp ...
Thực tiễn tính toán trên máy cho thấy: Đối với nhiều bài toán thực tiễn
hoặc các bài toán có nghiệm giải tích, khi lấy φ = 0.6, nghĩa là bậc xấp xỉ O(τ
+ h) hoặc O(τ + h2) thì kết quả tính toán ổn định nhanh hơn và phù hợp
với các số liệu đo đạc thực tiễn hơn, hoặc gần với giá trị nghiệm giải tích hơn là
khi lấy φ = 0.5, nghĩa là bậc xấp xỉ O(τ2+ h) hoặc O(τ2+ h2).

2.2 Mô hình toán học
Mô hình toán học mô tả quá trình truyền tải và khuếch tán vật chất
24


có dạng
∂c
∂c
∂c
∂c
∂2 c ∂2 c
∂ ∂c
+u
+v
+w
−v ( 2 + 2 ) −
µ
=f
∂t
∂x
∂y
∂z
∂x
∂y
∂z ∂z

(1+ τθΩ1)(1+ τθΩ2)(1+ τθΩ3) + O(τ 2) (4)
Và (x, y,z) ∈ G ⊂R3, t ∈ ((), T)

Hình trụ G = {(x,y,z): (x,y) ∈ Ω ⊂ R2, z0(x,y) < z < δ(x,y)}, trong đó

C - nồng độ vật chất, (u,v,w) - véc tơ vận tốc dòng chảy, v>= 0 - hệ số
khuếch tán ngang, µ - hệ số khuếch tán đứng, δ ≥0 - hệ số phân huỷ, f
- hàm nguồn.
Phương trình (1) thuộc loại parabolic (xem [6]) với các điều kiện đầu và
điều kiện biên là C(x,y,z,0) = C0(x,y,z) khi t = 0
C(x,y,z,t) = (x,y,z,t) trên Σ khi un < 0,

25


×