Tải bản đầy đủ (.doc) (35 trang)

tóm tắt luận văn thạc sĩ kỹ thuật ứng dụng learning feedforward trên cơ sở mạng nơ ron điều khiển vị trí cánh tay robot

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.11 MB, 35 trang )

Luận văn thạc sĩ kỹ thuật 1 Chuyên ngành kỹ thuật điện tử
LỜI NÓI ĐẦU
Ngày nay, điều khiển robot công nghiệp đã và đang được ứng dụng rộng rãi
trong nhiều lĩnh vực sản xuất và đời sống. Để điều khiển rôbốt đã có rất nhiều phương
pháp khác nhau như dùng bộ điều khiển truyền thống PID, LQR (Linear Quadratic
Regulator), LQG (Linear Quadratic Gaussian), STR (Self Tuning Regulator) Các
bộ điều khiển trên được thiết kế trên cơ sở mô hình tuyến tính hoá với những thông số
biết trước. Tuy nhiên Robốt là hệ cấu trúc có tính phi tuyến mạnh, các tham số không
rõ và thay đổi hoặc chứa các thành phần phi tuyến. Ngoài ra trong quá trình làm việc
hệ còn chịu tác động của các nhiễu bên ngoài có tham số thay đổi. Do vậy đối với các
robot làm việc với yêu cầu đồng thời có độ ổn định và độ chính xác cao thì các bộ điều
khiển trên thể hiện các hạn chế.
Hệ thống điều khiển thích nghi là hệ thống mà cấu trúc và tham số của bộ
điều khiển có thể thay đổi theo sự biến thiên thông số của hệ sao cho chất l ượng đảm
bảo các chỉ tiêu đã định. Đặc biệt hệ điều khiển Learning Feed Forward (LFFC) trên
cơ sở mạng nơ ron, đã được nghiên cứu và thiết kế ứng dụng trong thực tế. Bộ điều
khiển này có ưu điểm là có khả năng kháng nhiễu hệ thống (Systems Noise) có hiệu
quả, nhờ đó độ chính xác và độ ổn định của hệ có thể đồng thời đạt được.
Việc ứng dụng Learning Feed Forward trên cơ sở mạng nơron để điều khiển vị trí cánh
tay rôbốt sẽ nâng cao chất lượng của hệ thống. Vì vậy tôi lựa chọn đề tài: “Ứng dụng
Learning FeedForward trên cơ sở mạng nơ ron điều khiển vị trí cánh tay robot ”
Luận văn này tác giả phân tích mô hình động học của đối tượng thông qua mô
hình toán học đó đưa ra phương án điều khiển. Kết quả điều khiển được mô phỏng
kiểm chứng trên phần mềm matlab
Luận văn này tác giả trình bày trong 3 chương:
Chương 1: Tổng quan về điều khiển bobot công nghiệp
Chương 2:Learning FeedForward control trên cơ sở mạng nơ ron
Chương 3. Thiết kế ứng dụng

Luận văn thạc sĩ kỹ thuật 2 Chuyên ngành kỹ thuật điện tử
CHƯƠNG 1: TỔNG QUAN VỀ ĐIỀU KHIỂN ROBOT CÔNG NGHIỆP


1.1.Tổng quan về Robot
- Về mặt cơ khí robot là một hệ thống cơ khí bao gồm các thanh nối cứng và
các khớp. Ngoài ra còn các bộ phận khác như thân máy, bệ máy
- Về nội dung kỹ thuật cơ khí, điều khiển và điện tử, robot có thể được định
nghĩa như sau:
Robot là một cơ cấu cơ khí có một vài bậc tự do, có thể di chuyển như con
người và được điều khiển bằng máy tính;
Robot công nghiệp là một cơ cấu máy có thể lập trình được và làm việc một
cách tự động không cần sự trợ giúp của con người;
Robot là cơ cấu máy có chức năng như con người và có sự hợp tác giữa các
Robot với nhau.
Sơ đồ Hình 1.1 là sơ đồ điển hình của hệ thống điều khiển vị trí, trên sơ đồ thể
hiện các vị trí và tốc độ của khớp thường được đo bởi các sensor như chiết áp, máy
phát tốc, các thiết bị mã hoá Các tín hiệu ra được đưa đến khối điều khiển tạo ra tín
hiệu điều khiển, điều khiển các khớp các cơ cấu dẫn động làm cho tay máy chuyển
động theo quỹ đạo mong muốn
Tổ chức kỹ thuật của Robot được chia thành 4 khối chức năng chính được minh
hoạ như sau:

Sơ đồ hệ thống điều khiển vị trí
Quỹ đạo đặt
BỘ ĐIỀU
KHIỂN
HỆ THỐNG ĐO
(CÁC SENSOR)
ROBOT
Tín hiệu điều
khiển
Quỹ đạo thực
Luận văn thạc sĩ kỹ thuật 3 Chuyên ngành kỹ thuật điện tử

1.2. Phương trình động học của robot
Với robot công nghiệp có nhiều loại khác nhau và sử dụng nhiều luật điều khiển
khác nhau. Trong khuôn khổ luận văn này tác giả khảo sát robot 2 bậc tự do dùng
Feedback kết hợp LFFC (Learning Feedforward Control) trên cơ sở mạng nơ ron để
điều khiển.
( )
( ) ( )
( )
uGSDCM =++++
θθθθθθθθ

sgn,
Với:
-
θ
: véc tơ góc của khớp nối
-
( )
θ
M
: ma trận mô men quán tính
-
( )
θθ

,C
: mô hình lực coriolis và quán tính ly tâm
-
D
: hệ số ma trận đường chéo ma sát nhớt.


Σ
Teach
Pendent
Record
buttum
Forward
Kinematic
Inverts
Kinematic
Cartesianpont
storage
Trajectory
Phaner
C
o
n
t
r
o
l
Motor
Dymanic
Robot
Dynamic
Physical
Postion
Computer
Block A
Block B

Block D
Block C
Sơ đồ tổ chức kỹ thuật của Robot
Luận văn thạc sĩ kỹ thuật 4 Chuyên ngành kỹ thuật điện tử
-
S
: hệ số ma trận đường chéo ma sát Coulomb
-
( )
θ
G
: trọng lực
-
u
: mô men xoắn của khớp
Trong hình sau mô tả mô hình robot 2 bậc tự do:
Mô hình robot 2 bậc tự do
Phương trình động học của robot 2 bậc tự do được chỉ ra bởi bi biểu thức sau:
( )
( )
( )
( )
( ) ( )
( )
( )
( )
( ) ( )( )
( )







=






+
+++
+












+













+












−−
+



















++
+++++
2
1
2122
21112122
2
2
2
1
2
1
2
1
2
1
21221
2222122221

2
1
2
22
2
1
1
2221
2
2
2221
2
21
2
1
2
1221
2
22
2
1
1
cos
coscos
sgn
sgn
0
0
0
0

0sin
sinsin2
cos2
cos2cos2
u
u
lgm
mmgllgm
s
s
d
d
mll
mllmll
lm
r
J
mlll
mlllmlllllm
r
J
θθ
θθθ
θ
θ
θ
θ
θ
θ
θθ

θθθθ
θ
θ
θ
θθ










Trong đó:
-
2,1
m
: khối lượng của cánh tay 1,2

Luận văn thạc sĩ kỹ thuật 5 Chuyên ngành kỹ thuật điện tử
-
2,1
l
: độ dài cánh tay 1,2
-
2,1
r
: tỷ số truyền của động cơ 1,2

-
2,1
d
: ma sát nhớt của khớp nối 1,2
-
2,1
s
là ma sát coulomb của khớp 1,2
Như vậy có thể kết luận rằng: Góc quay của cánh tay robot có thể được điều khiển bởi
LFFC. Tín hiệu điều khiển Feed – forward mong muốn là:

( ) ( ) ( ) ( )
ddddddddd
MSGDCu
θθθθθθθθ

++++= sgn,

Từ đó cho thấy tín hiệu đầu vào điều khiển BSN sau khi đã đơn giản hóa bao gồm các
thành phần
( )
θθθ

,,,
. Với robot 2 bậc tự do, số lượng đầu vào là 6.
Kết luận Chương I:
Như vậy với robot 2 bậc tự do sử dụng hệ thống điều khiển Feedback kết hợp
với LFFC trên cơ sở mạng nơ ron, tác giả đã chỉ ra phương trình động học như phương
trình trên. Với tín hiệu vào điều khiển Feed – forward bao gồm
( )

θθθ

,,,
tương ứng là
vị trí góc, vận tốc góc, gia tốc góc. Lấy cơ sở từ phương trình này, để xây dựng hệ
thống điều khiển cho robot 2 bậc tự do

Luận văn thạc sĩ kỹ thuật 6 Chuyên ngành kỹ thuật điện tử
CHƯƠNG 2: LEARNING FEED – FORWARD CONTROL TRÊN CƠ SỞ
MẠNG NƠ RON
2.1. Giới thiệu.
Việc thiết kế một bộ điều khiển nói chung thường dựa trên một mô hình của
một đối tượng. Mô hình đối tượng càng chính xác bao nhiêu thì việc thiết kế bộ điều
khiển càng hiệu quả bấy nhiêu. Khi mô hình hóa đối tượng, các vấn đề sau có thể gặp
phải:
- Hệ thống quá phức tạp để có thể hiểu được hoặc trình bày một cách đơn giản.
- Mô hình quá khó hoặc quá đắt để đánh giá. Một số đặc tính của một số tính
chất (phi tuyến) khó có thể đạt được, ví dụ như ma sát….
- Đối tượng có thể chịu ảnh hưởng lớn của nhiễu tác động từ môi trường, điều
này khó dự đoán trước được.
- Các thông số của đối tượng có thể biến đổi theo thời gian.
2.2. Điều khiển học (Learning Control - LC)
Một số định nghĩa về LC sau:
Định nghĩa 2.1: Một bộ LC là một hệ thống điều khiển bao gồm trong đó 1
hàm xấp xỉ các ánh xạ đầu vào – đầu ra tương ứng trong suốt quá trình điều khiển mà
một hoạt động mong muốn của hệ thống điều khiển đạt được.
Định nghĩa 2.2 (hàm xấp xỉ): Một hàm xấp xỉ là một ánh xạ vào/ra được xác
định bởi một hàm được lựa chọn
( )
ω

.,F
, với các véc tơ thông số ω được lựa chọn để
hàm
( )
.F
được xấp xỉ tốt nhất.
Ưu điểm của các bộ điều khiển LC:
Hàm xấp xỉ có khả năng tự khái quát hoá tốt.
Sự mềm mại của giá trị xấp xỉ cần điều khiển được.
Đáp ứng ngắn hạn là học tốt.

Luận văn thạc sĩ kỹ thuật 7 Chuyên ngành kỹ thuật điện tử
Sự ổn định lâu dài cần phải được bảo đảm.
2.3. Bộ điều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning - FEL)
2.3.1. Cấu trúc điều khiển
Hệ thống LC bao gồm 2 phần:
Bộ điều khiển Feef-forward được biểu thị bằng F, nghĩa là 1 hàm/ánh xạ
( )
rFu
F
=
. Khi bộ điều khiển feed-forward bằng với đối tượng nghịch đảo
1−
= PF
, thì
đầu ra của đối tượng
y
sẽ bằng tín hiệu đặt
r
Bộ điều khiển phản hồi sai lệch (FEL)

2.3.2. Một ví dụ về ma sát phụ thuộc vị trí:
Giống như đối tượng động học, các nhiễu tái sinh có thể được bù bởi một bộ
điều khiển feed-forward.
Trong khi đầu ra u
F
được xét dưới dạng moment của động cơ
u
F =
[ ]
3
321
R
T

τττ

Một số đặc điểm của bộ điều khiể này:
Sự ổn định được xác lập.
Đáp ứng ngắn hạn tốt.
Hàm xấp xỉ phù hợp cho việc điều khiển.
Yêu cầu bộ nhớ nhỏ.
Cơ chế học hội tụ chậm và trải qua vùng giá trị cực tiểu cục bộ.

Hàm xấp xỉ
Luận văn thạc sĩ kỹ thuật 8 Chuyên ngành kỹ thuật điện tử
Có khả năng tổng quát hoá tốt.
Học theo sai số phản hồi
Phương thức thứ 2 là sử dụng nhiều bộ điều khiển feed-forward, mỗi một bộ
được huấn luyện để thực hiện một nhiệm vụ cụ thể. Mỗi một mạng nơ ron giám sát
học xem là bộ feed-forward nào được sử dụng cho nhiệm vụ nào. Mạng giám sát đã

học từ bộ điều khiển feed-forward nào được áp dụng cho đối tượng đó.
Tất cả điều này nhằm mục đích cải thiện những vấn đề sau:
- Độ hội tụ nhanh hơn. Khi việc học diễn ra một cách cục bộ, chỉ có 1 số nhỏ
các hàm trọng được thích nghi tạo ra độ hội tụ nhanh.
- Có thể học các dữ liệu tương quan. Các vùng của hàm cơ sở đã được trộn
lẫn, điều này có ích cho quá trình học các dữ liệu tương quan.
- Không có cực tiểu cục bộ. Cơ cấu học không trải qua vùng cực tiểu cục bộ.
2.4. Learning Feedforward Control (LFFC)
2.4.1. Mạng B - Spline
Một số dạng B - Spline

Hàm xấp xỉ
C P
r

r
( )
n
r

+
-
+
+
y
0 1 2 3 4 5
1
µ
a)
0 1 2 3 4 5

1
µ
b)
0 1 2 3 4 5
1
µ
c)
B – Spline cơ bản:
a): B – Spline bậc 1
b): B – Spline bậc 2
c): B – Spline bậc 3
Lớp 1 Lớp 2 Lớp 3

( )
.f
ω
0
1
ω
1
1
x
ω
2
2
x
ω
n
n
x


y
Luận văn thạc sĩ kỹ thuật 9 Chuyên ngành kỹ thuật điện tử
2.4.2. Mạng nơ ron nhân tạo nhiều lớp
1). Nơ ron
Hình sau chỉ ra cấu trúc của một nơ ron nhân tạo.
Nơ ron nhân tạo
Với:
[ ]
1
21
1
+
∈=
N
T
N
Rxxxx 

2). Mạng nơ ron nhân tạo nhiều lớp (Multi layer Perceptron network - MLP)
Trong hình sau chỉ ra cấu trúc một MLP
Cấu trúc MLP 3 lớp
Mỗi nơ ron ở lớp thứ
n
điều được kết nối với các nơ ron ở lớp thứ
1
+
n
.
2.5. Learning Feed – Forward trên cơ sở mạng nơ ron

2.5.1. Lựa chọn các thông số BSNs

Luận văn thạc sĩ kỹ thuật 10 Chuyên ngành kỹ thuật điện tử
Đối với các hệ thống chuyển động, các đầu vào của BSN bao gồm các vị trí
đặt, r, và các đạo hàm của nó
2.5.1.1. Sự phân bố B-Spline trên đầu vào của mạng BSN.
Đầu ra của BSN là tổng trọng số ước lượng của các B- spline. Do đó, số
lượng của các B-Spline và các vị trí của chúng quyết định tính chính xác của giá trị
xấp xỉ. Các tín hiệu đích có dạng trơn có thể được xấp xỉ một cách chính xác với một
số lượng thấp các B-Spline “rộng”. Các tín hiệu có độ dao động lớn yêu cầu một số
lượng lớn các B-Spline “hẹp”
Ánh xạ BSN
2.5.1.2. Sự lựa chọn các cơ cấu học.
Luật online learning như sau:
)()( rer
ii
γµω
=∆

Và luật offline learning như sau:


=
=
=∆
s
s
N
i
ji

N
i
jji
i
r
rer
1
1
)(
)()(
µ
µ
ω

Trong đó:
o
j
r
: đầu vào của BSN. Trong LFFC đầu vào bao gồm cả vị trí đặt
và đạo hàm của nó
{ }
, ,,,
JJj
rrrf

=
o

)(
ii

r
µ
: Thành phần của B – Spline thứ i:
[ ]
1,0)( ∈
ii
r
µ

o
i
ω

: Sự thích nghi của trọng số số B –Spline thứ i

Luận văn thạc sĩ kỹ thuật 11 Chuyên ngành kỹ thuật điện tử
o
γ
: Tốc độ học :
10 <<
γ
o
( )
i
rE
: Sai số xấp xỉ được tạo ra bởi mạng, trong LFFC
)(
i
re


đầu ra của bộ điều khiển phản hồi u
c
o
s
N
: Số lượng các mẫu đầu vào
2.5.1.3. Sự lựa chọn tốc độ học.
Tốc độ học càng lớn thì độ hội tụ của kỹ thuật học càng nhanh. Tuy nhiên một
tốc độ học mà lớn thì sẽ làm cho giá trị xấp xỉ thêm nhạy cảm với nhiễu và có thể là
nguyên nhân gây mất ổn định.
Bằng việc sử dụng BSN, ta đã có các ưu điểm sau:
Không có cực tiểu cục bộ. Đầu ra của BSN là một hàm trọng số tuyến tính.
Học cục bộ. Khi B-Spline có một nền tảng chắc chắn, ánh xạ vào/ra của BSN
có thể thích nghi một cách cục bộ.
Sự chính xác trong điều chỉnh. Độ trơn của quan hệ vào/ra là xác định được
bằng cách chọn phân bố B-spline.
Số lượng các trọng số trong một BSN - N chiều được cho bởi:

j
N
j
t
NN
1=
Π=
Với N
j
là số lượng của B-Spline được định nghĩa ở đầu vào thứ j.
2.6. Luyện mạng
2.6.1. Luyện mạng BSN

Luyện mạng bằng thích nghi không dựa trên hàm cơ sở. Trong luyện mạng
online, hàm trị
J
có thể cực tiểu hóa bằng xấp xỉ bình phương của sai lệch.
( )
2
2
1
yyJ
d
−=

Trong đó: y
d
là đầu ra mong muốn.

Luận văn thạc sĩ kỹ thuật 12 Chuyên ngành kỹ thuật điện tử
Luật học offline:
1. Tại thời điểm tín hiệu vào
j
x
và tín hiệu học
jjd
yy −
,
đưa vào BSN
(j=1,2, ); Khi B –Spline thứ i cho tín hiệu vào
j
x


( )
0>
j
x
µ
, tính toán trọng số thích
nghi
i
ω

2. Tại thời điểm
( )
0=
j
x
µ
,
i
ω
đã thích nghi,
iii
ωωω
∆+=
Xét một ví dụ như hình 2.11 sau:
Cơ chế học offline
2.6.2. Luyện mạng nơ ron
Luyện mạng MLP được thực hiện bằng cách thích nghi trọng số giữa các nốt
mạng theo cơ chế lan truyền ngược. Trọng số thích nghi trong hàm trị,
J
là nhỏ nhất.

Một cách lựa chọn
J
phổ biến là tổng bình phương các sai lệch của các dữ liệu đã qua.
( )
( )
( )
( )
11
0
1
112
1
,,
1
1
0
1
11
1
0
1
11
1
0
1
11
2
1
,,
1

1
0
1
112
1
,,
1
2
0
1
1
0
1
112
1
,,
2
cd
N
n
nnddk
j
K
k
jk
d
jk
cd
d
N

n
nnd
d
N
n
nnd
d
N
n
nnd
dk
j
K
k
jk
d
jk
cd
d
N
n
nnddk
j
K
k
jk
d
jk
cd
k

M
m
m
N
n
nnmmk
j
K
k
jk
d
jkcd
xxfyy
x
x
xf
yy
xf
yy
xf
yy






+

−=








+∂






+∂






+∂
−=








+∂
−=

+














+∂
−=∆
∑∑∑



∑∑

∑∑
∑ ∑
∑∑
==

=
=
=
=
=
=
= =
=
ωωωγ
ω
ωω
ωω
ωω
ωγ
ω
ωωω
γ
ω
ωωωω
γω

Luận văn thạc sĩ kỹ thuật 13 Chuyên ngành kỹ thuật điện tử
2.7. LFFC cho chuyển động lặp
2.7.1. Chuyển động lặp
2.7.1.1. Điều khiển học cho chuyển động lặp (Iterative Learning Control - ILC)
Trong luận văn của tác giả, sự ổn định chỉ ra như sau:
- Chỉ ra Learning control bền vững hoặc không bền vững
- Dự báo đáp ứng tức thời
- Chỉ ra một sự ổn định bền vững
- Chỉ ra cách thức lựa chọn các tham số.

Cấu trúc tổng quát Iterative Learning Control (ILC)
a. Sơ đồ ILC cơ bản (sơ đồ mạch hở)
Trong đó:
- Phần tử phi tuyến
P
được xác định bởi:
( )
Cxy
Buxfx
=
+=

- Luật học:
( ) ( ) ( )
tetutu
k
F
k
F

Γ+=
+1
b. Sơ đồ điều khiển mạch kín:
Trong tần số cho phép, tín hiệu học được cho bởi:
kk
F
k
F
LEUU +=
+1

( ) ( ) ( ) ( )

+

++
−<−∈∀
ωωωωω
jUjUjUjUR
k
F
k
F
k
F
k
F
112
::

Luận văn thạc sĩ kỹ thuật 14 Chuyên ngành kỹ thuật điện tử
c. Sơ đồ ILC đo lường chính xác:
Sơ đồ ILC có đo lường chính xác
2.7.1.2. Chuyển động lặp (Repetitive Control - RC)
Trong luận văn này tác giả thảo luận RC nhằm chỉ ra cách xác định các tham số
learning trong các chuyển động lặp
Sơ đồ điều khiển lặp
Trong hình trên,
R
là một bộ lọc learning. Trong chế độ ổn định của RC, hệ
thống có thể chỉ ra theo một cách khác:

Sơ đồ tương đương điều khiển lặp

Luận văn thạc sĩ kỹ thuật 15 Chuyên ngành kỹ thuật điện tử
Hệ thống trên là ổn định nếu:
- Hệ thống không chuyển động lặp là ổn định, có nghĩa là
CP+1
1
ổn định;
- Vòng lặp phản hồi ổn định: Theo định lý hệ số khuếch đại nhỏ, một điều kiện
cho vòng lặp ổn định là:
1
1
1 <
+


CP
CP
R

Tiếp theo sẽ nghiên cứu chế độ của RC bằng biện pháp hàm nhạy
S
được chỉ ra
bởi:
CP
e
CP
RCP
e
S

sT
sT
P
+






+
−−

=


1
1
1
11
1

Tiếp theo tính toán tham số lọc học
R
đã được thiết kế trước và hoạt động tốt
ở các dải tần số và chỉ ra như sau:

1
1








+
=
CP
CP
R

Từ đó suy ra tham số
S
như sau:
( )
CP
eS
P
sT
+
−=

1
1
1
2.7.2. LFFC cho chuyển động lặp (
LFFC for
Repetitive
Motions)

Khi chuyển động lặp lại, tín hiệu Feed – forward cho ILC và RC coi như
là duy nhất là
( )
ruF
trở thành hàm thời gian trong khoảng
[ ]
p
Tt ,0
với
p
T
là chu kỳ
của chuyển động.

BSN
C
P
-
+ +
+
r
t
u
F
e
y
u
C
Luận văn thạc sĩ kỹ thuật 16 Chuyên ngành kỹ thuật điện tử
LFFC chỉ số thời gian

Sự phân bố B – spline này được biểu diễn như hình sau:
Chỉ số thời gian cho loại chuyển động lặp
2.8. Phân tích sự ổn định của LFFC chỉ số thời gian.
Lựa chọn độ rộng của B – spline
Trong một mô hình chính xác của hệ thống P và bộ điều khiển C là sẵn có, giá
trị của
n
a

n
ϕ
có thể được tính toán cho tất cả các tần số.
Thuật toán 2.8.1: Tính toán giá trị ổn định nhỏ nhất của d dựa trên mô hình
chi tiết của hệ thống điều khiển:
1. Chọn một khuôn dạng phân bố B-Spline bao gồm 3 B-Spline:
3=N

2. Xác định
n
a

n
ϕ
: điều này thực hiện được nhờ các bước sau:
- Bước 2.1: Chọn
1
=
n
;
- Bước 2.2: Tính

n
ω
- Bước 2.3: Nếu
0≈
n
a
chuyển sang bước 3, nếu không tăng
n
lên một đơn vị
và quay lại bước 2.2
3. kiểm tra xem
n
a

n
ϕ
đã tìm được trong bước trước cỏa thỏa mãn không.
Nếu thỏa mãn chuyển sang bước 4, nếu không chuyển sang bước 6
4. Tăng số lượng của B – spline lên một đơn vị:
1+= NN
5. Chuyển sang bước 2

Luận văn thạc sĩ kỹ thuật 17 Chuyên ngành kỹ thuật điện tử
6. Giá trị d được tính:
2
2

=
N
T

d
p

Các mô hình hình động học tần thấp có thể sử dụng thuật toán sau:
Thuật toán 2.8.2. (Tính toán giá trị ổn định nhỏ nhất của d với các giả thiết
trên mô hình động học của hệ thống điều khiển)
1. Sử dụng mô hình tần số thấp của hệ thống để tính toán
( )
( )
0
, 5,3
4
1
1


+


=

n
na
jT
Cos
ω
ϕ
;
2. Chọn một khuôn dạng phân bố B-Spline bao gồm 3 B-Spline: N=3
3. Tính toán

1
ω
theo công thức :
).(
2
1−
= srad
d
n
n
π
ω
;
4. Sử dụng mô hình để xác định a
1

1
ϕ
;
5. Kiểm tra a
n

n
ϕ
theo công thức trên sử dụng kết quả của bước 1, nếu thỏa
mãn chuyển sang bước 6, nếu không chuyển sang bước 8;
6. Tạo một khuôn dạng phân bố B-Spline bao gồm
1
+
N

B-Spline (hay
1:
+=
NN
);
7. Chuyển tới bước 3;
8. Giá trị nhỏ nhất d được cho bởi:
2
2

=
N
T
d
p
;
Thuật toán 2.8.3 (Tính toán giá trị ổn định của d với các giả thiết chặt chẽ về mô hình
động học của hệ thống)
1. Xác định
( )
n
jT
ω

từ mô hình vòng lặp kín.
2. Sử dụng đồ thị Bode của mô hình để xác định
( )
{ }
( )
n

R
jT
ω
ϕω

<∈ 0cos
min
.
3. Tìm giá trị nhỏ nhất của
1
ω
mà tại đó
( )( )
11
arg
ωϕ
jT−=
thỏa mãn:

Luận văn thạc sĩ kỹ thuật 18 Chuyên ngành kỹ thuật điện tử
( )
( )
{ }
( )











−=
≤∈

ω
ω
ϕ
ϕω
jT
jT
R 0cos
1
min
0147.0arccos

4. Giá trị nhỏ nhất của độ rộng mạng B – spline,
min
d
được cho bởi:

[ ]
1
1
min
.
2


= sradd
ω
π
2.8.2. Phân tích ổn định của LFFC
Sự ổn định của LFFC chỉ số thời gian có thể đảm bảo khi:
1. Chiều rộng của B – spline trong chu kỳ chuyển động,
d
lớn hơn rất nhiều
bề rộng tối thiều
[ ]
sd
min
.
2. Tốc độ học
γ
thỏa mãn:
( )



ω
γ
jT
2

Trong nghiên cứu này, tác giả sử dụng cách thứ 2. Ở đây sử dụng LFFC chỉ số
thời gian như một bộ lọc học.
LFFC với mạng quy chuẩn
Tín hiệu Feed – forward thích nghi của LFFC được thực hiện theo 2 bước sau:
Bước 1: Trọng số của BSN chỉ số thời gian theo

C
u
, BSN được huấn luyện
off-line sử dụng tốc độ học bằng 1. Điều này cho đầu ra
R
u

Luận văn thạc sĩ kỹ thuật 19 Chuyên ngành kỹ thuật điện tử
Huấn luyện BSN chỉ số thời gian
Bước 2: Sau đó trọng số của BSN chỉ số thời gian được thích nghi, LFFC
được huấn luyện sử dụng
R
u
như một tín hiệu học
Thích nghi trọng số của LFFC

Luận văn thạc sĩ kỹ thuật 20 Chuyên ngành kỹ thuật điện tử
Kết luận chương 2:
Như vậy trong chương 2 đã trình phân tích được các bộ điều khiển học
(learning control); Cơ sở mạng nơ ron; Các phương pháp luyện mạng nơ ron; phương
pháp quy chuẩn LFFC.
Ngoài ra trong chương còn trình bày tổng quát cách tính toán các tham số cơ
bản của hệ thống điều khiển LFFC trên cơ sở mạng nơ ron.
Từ những kiến thức cơ sở đã trình bày trong Chương 2 kết hợp với phương trình động
học trong Chương 1 có thể đi xây dựng mô hình điều khiển robot 2 bậc tự do dùng bộ
điều khiển Feedback kết hợp LFFC trên cơ sở mạng nơ ron.

Luận văn thạc sĩ kỹ thuật 21 Chuyên ngành kỹ thuật điện tử
CHƯƠNG 3. THIẾT KẾ ỨNG DỤNG
3.1. Giới thiệu chung

Trong các chương trước, một số khía cạnh của LFFC trên cơ sở mạng nơ ron
đã được đề cập, trong chương này, sẽ áp dụng những kiến thức đó để thiết kế ứng dụng
LFFC trên cơ sở mạng nơ ron để điều khiển cánh tay robot 2 bậc tự do. Để hoàn thành
nhiệm vụ này cần sơ lược các kết quả sau:
- Bộ điều khiển phản hồi (Feedback Control): Bộ điều khiển phản hồi để bù
các nhiễu ngẫu nhiên và tạo ra tín hiệu học cho bộ Feed – Forward. Bộ điều khiển
phản hồi cũng giúp xác định độ rộng của B – Spline.
- Lựa chọn đầu vào của Feed – Forward: Tín hiệu vào của feed – forward được
lựa chọn là vị trí, vận tốc, gia tốc tham chiếu
( )
θθθ

,,
.
- Cấu trúc của phần feed – forward: Kết quả nghiên cứu trong chương 2 cho
thấy việc lựa chọn feed – forward thường là nhiều đầu vào.
- Phân bố B – Spline: Việc lựa chọn độ rộng của B – spline trong LFFC chỉ số
thời gian có thể xác định từ đáp ứng tần số trong vòng phản hồi kín.
- Tốc độ học: Giá trị lớn nhất của tốc độ học mà hội thu được xác định từ đáp
ứng tần số của vòng lặp kín.
3.2. Xây dựng mô hình điều khiển robot 2 bậc tự do
3.2.1. LFFC tiết kiệm
Mô hình LFFC tiết kiệm được cho bởi sơ đồ sau:

Luận văn thạc sĩ kỹ thuật 22 Chuyên ngành kỹ thuật điện tử
a) cấu trúc LFFC đơn; b) Cấu trúc LFFC tiết kiệm
Trong cấu trúc LFFC tiết kiệm, mỗi BSN chỉ bao gồm một trong các tổ hợp
ddd
yyy


,,
. Việc lựa chọn đầu vào này sao cho mỗi BSN trong mạng BSNs tương
đương có số đầu vào là nhỏ nhất.
3.2.2. Mô hình LFFC tiết kiệm cho cánh tay robot 2 bậc tự do.
Robot 2 bậc tự do có 6 tín hiệu đầu vào Feed – forward đó là
( )
θθθ

,,
cho mỗi
khớp.
Trong robot 2 bậc tự do,
C
có thể bỏ qua khi tốc độ chuyển động thấp.












=
2
2
2

2
1
1
0
0
r
J
r
J
M
Tín hiệu feed – forward đầu ra mong muốn có dạng sau:

( )
( ) ( )
( )
( )
( )












++++

++++++







=
1,1,222,22,22,
2
2
2
211,11,1,221,11,1,1,
2
1
1
1,
cossgn
coscossgn
2
ddddd
dddddd
d
d
lgmsd
r
J
mmgllgmsd
r

J
u
u
u
θθθθθ
θθθθθθ



LFFC tiết kiệm được cho bởi sơ đồ sau.

Luận văn thạc sĩ kỹ thuật 23 Chuyên ngành kỹ thuật điện tử
LFFC tiết kiệm cho cánh tay robot 2 bậc tự do
Trong đó các hàm chức năng như sau:
BSN1: có 2 đầu vào,
{ }
2,1,
,
dd
θθ
và 2 đầu ra
{ }
2,1,
,
dd
uu
, hàm mục tiêu phải học
là:
( ) ( )
( )

( )






+
+++
=






=
1,1,22
211,11,1,22
2,
1,
cos
coscos
dd
ddd
d
d
d
lgm
mmgllgm

u
u
u
θθ
θθθ

BSN2 và BSN3 học để bù cho ma sát của mỗi khớp nối:
BSN2:
( )
2,22,22,
sgn
ddd
sdu
θθ

+=

BSN3:
( )
1,21,11,
sgn
ddd
sdu
θθ

+=

Cuối cùng, BSN4, BSN5 học để bù cho quán tính của robot.
BSN4:
2,

2
2
2
2, dd
r
J
u
θ

=
BSN5:
1,
2
1
2
1, dd
r
J
u
θ

=

3.2.3. Thiết kế LFFC cho robot
Bước 1: Thiết kế bộ điều khiển phản hồi:

Luận văn thạc sĩ kỹ thuật 24 Chuyên ngành kỹ thuật điện tử
Bộ điều khiển phản hồi sử dụng bộ điều khiển PI chuẩn đã được trình bày và
thiết lập bởi công thức sau[5]:
( )

sKKsC
DP
+=

Lựa chọn K
P
= 500; K
D
= 2
Bước 2: Lựa chọn đầu vào cho phần feed – forward:
( )
( )
u
J
J
FF
J
d
mfmC
m
m
m









+








−−
+















=







1
0
0
0
10
1
θθ
θ
θ
θ
θ





Với:
J
: Là quán tính, tỷ số truyền và sự bám dính.
d
: Là ma sát nhớt trong quá trình truyền động
( )
mC
F
θ
: Là lực cogging (đối với các hệ truyền động bằng động cơ tuyến tính)
( )

mf
F
θ

: Là ma sát Coulomb và bám dính
Tiếp theo, lựa chọn hệ số hiệu chỉnh C trong LFFC
-
C
Bao gồm một phần tử duy nhất,
j
C
, phần tử đó không tiến tới 0,
[ ]
10=C
, trạng thái đó là ổn định.
-
j
C
khả nghịch, với
1
2
=C
điều này đã được thỏa mãn.
-
n
B
khả nghịch, Với
J
B
1

2
=
,
n
B
khả nghịch khi
0
>
J
, Khi
0
>
J
hệ thống ổn
định.
Có thể kết luận rằng, LFFC có thể điều khiển được hệ thống tải. Tín hiệu feed
–forward yêu cầu được chỉ ra bởi:
( )
( )
( )
( )
dmfdmCdm
dmdmfdmCdmd
FFd
JFFdu
,,,
,,,,
θθθ
θθθθ



++≈
+++=

Bước 3: Lựa chọn cấu trúc của phần feed – forward: Mô hình LFFC được mô tả như
hình sau:

Luận văn thạc sĩ kỹ thuật 25 Chuyên ngành kỹ thuật điện tử
Cấu trúc LFFC cho CLS
Bước 4: Lựa chọn hệ số B- Spline.
Sự phân bố B – Spline lựa chọn trên quy tắc kinh nghiệm và những đặc điểm
cụ thể của tín hiệu cần phải triệt tiêu.
Chọn
809006405004215,0
909006405
23
+++−
−−
=−
SSs
T
Từ đó suy ra:
)(00185.0
min
sd =
Lựa chọn Số lượng B – Spline là 3
Bước 5: Lựa chọn tốc độ học:
Tốc độ học cho các B – Spline:
95,0≤
γ

;
Lựa chọn tốc độ học cho tất cả các B – Spline bằng 0.1
Bước 6. Luyện LFFC:
3.3. Mô phỏng khảo sát bộ điều khiển cánh tay robot 2 bậc tự do bằng LFFC trên
cơ sở mạng nơ ron
a. Xây dựng mô hình cho cánh tay robot 2 bậc tự do (P):
Từ phương trình cho cánh tay robot 2 bậc tự do:
( )
( ) ( )
( )
uGSDCM =++++
θθθθθθθθ

sgn,
Qua biến đổi thành:

×