Tuyển tập công trình Hội nghị Cơ điện tử toàn quốc lần thứ 6 19
Mã bài: 06
Điều khiển thích nghi dùng mạng nơ-ron mờ hồi qui
áp dụng để điều chỉnh áp suất không khí
Adaptive Control Using Recurrent Fuzzy Neural Network
Applied To Air Pressure Regulation
Nguyễn Chí Ngôn
1
và Đỗ Chí Tâm
2
1
Trường Đại học Cần Thơ,
2
Trường Đại học Tây Đô
e-Mail:
Tóm tắt
Nghiên cứu này nhằm xây dựng một bộ điều khiển thích nghi dùng mạng nơ-ron mờ hồi qui làm bộ nhận dạng
mô hình không tham số của đối tượng phi tuyến. Bộ điều khiển được tổ chức dưới dạng một nơ-ron tuyến tính
mà ở đó ba trọng số kết nối của ba ngõ vào tương ứng là bộ ba thông số của bộ điều khiển PID. Việc áp dụng
giải thuật huấn luyện trực tuyến nơ-ron này cho phép tự điều chỉnh thông số bộ điều khiển PID thích nghi theo
sự biến đổi đặc tính động của đối tượng. Giải thuật huấn luyện bộ điều khiển PID một nơ-ron cần thông tin về
độ nhạy của đối tượng, gọi là thông tin Jacobian, để tính toán các giá trị cập nhật các trọng số kết nối của nơ-
ron PID. Thông tin Jacobian này được xác định bằng một bộ nhận dạng không tham số mô hình đối tượng
thông qua một mạng nơ-ron mờ hồi qui, cũng được huấn luyện trực tuyến. Kết quả thực nghiệm trên hệ ổn
định áp suất RT030 của hãng Gunt-Hamburg cho thấy đáp ứng của đối tượng thỏa mãn các yêu cầu về chất
lượng điều khiển, không vọt lố, triệt tiêu được sai số xác lập với thời gian tăng đạt 8±0.2 giây.
Từ khóa: Điều khiển thích nghi, mạng nơ-ron mờ hồi qui, huấn luyện trực tuyến
Abstract
This study aims to develop an adaptive controller for a nonlinear system using a recurrent fuzzy neural
network non-parametric model identifier. The con-troller is constructed as a linear neuron that three in-put weights
work as three parameters of a PID con-troller. Applying an online training algorithm to this neuron allows self-
tuning the PID controller adapting to system dynamics. The algorithm needs the sensi-tivity of system output on the
controlled input, called Jacobican information, to calculate gradients for up-dating weights. Jacobian information is
estimated through a recurrent fuzzy neural network non-para-metric model identifier that is also updated by an on-
line training algorithm. Experimental results on Gunt-Hamburg RT030 Air Pressure Control Unit indicated that the
system response satisfies control performance without overshoot, steady-state error eliminated, and obtaining the
rise time within 8±0.2 seconds.
Keywords: Adaptive control, recurrent fuzzy neural networks, online training
1. Giới thiệu
Mặc dù bộ điều khiển PID được ứng dụng rộng rãi
trong công nghiệp nhờ tính đơn giản và bền vững
của nó[1], song quá trình chỉnh định bộ điều khiển
đòi hỏi nhiều công sức và kinh nghiệm, đặc biệt
khi chưa biết trước các tham số của đối tượng điều
khiển[2]. Vì vậy, những năm gần đây, các giải
thuật tự chỉnh định trực tuyến bộ điều khiển PID
được quan tâm nghiên cứu nhiều[3].
Trong quá trình phát triển các giải thuật điều khiển
thông minh, mạng nơ-ron nhân tạo tỏ ra hiệu quả
trong vai trò xấp xỉ hàm phi tuyến, nên được ứng
dụng trong việc nhận dạng mô hình của đối tượng.
Trên cơ sở đó, việc phát triển công cụ nhận dạng
không tham số mô hình đối tượng sử dụng mạng
nơ-ron mờ hồi qui RFNN (Recurrent Fuzzy Neural
Network) cũng được áp dụng. RFNN với thuật
huấn luyện trực tuyến đang là một công cụ mạnh
được sử dụng để thiết kế các bộ điều khiển[4-5].
Ngoài ra, với khả năng tự học trực tuyến mạng nơ-
ron hoàn toàn phù hợp trong việc ứng dụng để tự
chỉnh các thông số của bộ điều khiển PID[6-7].
Nghiên cứu này kết hợp bộ nhận dạng RFNN và
bộ điều khiển PID thích nghi một nơ-ron nhằm tạo
ra một công cụ hữu ích trong việc thiết kế bộ điều
khiển áp dụng cho các đối tượng phi tuyến. Mô
hình của đối tượng sẽ được nhận dạng bằng một
bộ nhận dạng RFNN. Từ đó độ nhạy của đáp ứng
của đối tượng đối với tín hiệu điều khiển, còn gọi
là thông tin Jacobian, sẽ được ước lượng thông
qua bộ nhận dạng. Thông tin Jacobian là cơ sở để
tính toán các gradient của giải thuật cập nhật trực
tuyến bộ trọng số của một nơ-ron tuyến tính, cấu
20 Nguyễn Chí Ngôn và Đỗ Chí Tâm
VCM2012
hình theo nguyên tắc của một bộ điều khiển PID.
Thông số của bộ điều khiển PID một nơ-ron sẽ
được điều chỉnh thích nghi trong quá trình điều
khiển nhờ giải thuật huấn luyện trực tuyến.
2. Thiết kế bộ điều khiển
2.1 Nguyên tắc điều khiển
Sơ đồ điều khiển vòng kín của hệ thống được xác
lập như hình H.1. Trong đó, đối tượng điều khiển
là phi tuyến và không biết trước cấu trúc cũng như
tham số của nó. Bộ nhận dạng không tham số mô
hình đối tượng dùng mạng nơ-ron mờ hồi qui được
xây dựng và huấn luyện trực tuyến trong quá trình
điều khiển để ước lượng độ nhạy của đối tượng
đối với tín hiệu vào, gọi là thông tin Jacobian. Dựa
trên thông tin Jacobian, bộ điều khiển PID một nơ-
ron sẽ được cập nhật trực tuyến 3 giá trị trọng số
kết nối, tương ứng là 3 tham số K
p
, K
i
và K
d
của
bộ điều khiển. Như vậy, với nguyên tắc này, bộ
điều khiển PID sẽ được tự động điều chỉnh thích
nghi với sự biến đổi của đối tượng, điều mà các
giải pháp điều khiển cổ điển khó đạt được.
H. 1 Sơ đồ điều khiển
2.2 Đối tượng điều khiển thực nghiệm
Để thuận lợi trong việc kiểm chứng giải thuật điều
khiển trên thiết bị thật, nghiên cứu này sử dụng hệ
ổn định áp suất RT030 của hãng Gunt-Hamburg
sẵn có làm đối tượng điều khiển[8]. Áp suất không
khí được nén vào bình chứa 7 bằng máy nén khí 1.
Không khí trong bình có thể xả ra bằng valve 3 và
4. Áp suất trong bình được đo bởi cảm biến 5 và
biểu kiến trên áp kế 6. Tình trạng hoạt động và các
nút điều khiển được bố trí trên bảng 2. Nhiệm vụ
của bộ điều khiển là kiểm soát công suất máy nén
1 để áp suất trong bình 7 được duy trì ở trạng thái
ổn định mà người vận hành đặt trước bù trừ được
với sự thất thoát khí do valve xả 3 và/hoặc 4 tác
động.
a) Giao tiếp giữa máy tính và thiết bị RT030
b) Mô tả RT030 - 1: máy nén khí, 2: bảng hiển thị
và điều khiển,
3: valve xả bằng tay, 4: valve xả có kiểm soát, 5:
cảm biến áp suất, 6: áp kế, 7: bình chứa
H. 2 Hệ ổn định áp suất RT030
RT030 là một hệ MISO có 2 ngõ vào, 1 ngõ ra có
thể giao tiếp với MATLAB/Simulimk nhờ công cụ
do nhóm nghiên cứu tự phát triển[9], được mô tả
trên hình H.3.
H. 3 Ngõ vào, ngõ ra của đối tượng điều khiển
Với ngõ vào Y là công suất máy nén khí, có giá trị
trong [0, 100%]. Z là tín hiệu điều khiển valve xả
4. Khi Z > 0 valve được mở, khi Z 0 valve đóng.
Công suất valve xả 3 và 4 phụ thuộc vào việc điều
chỉnh thủ công độ mở của các valve cơ khí. X là
áp suất không khí trong bình, có giá trị trong [0, 1
bar].
Nguyên tắc điều khiển trong nghiên cứu này
không cần quan tâm đến mô hình toán của đối
tượng, do vậy, việc giao tiếp được ngõ vào, ngõ ra
của RT030 đủ để kiểm nghiệm giải thuật.
Tuyển tập công trình Hội nghị Cơ điện tử toàn quốc lần thứ 6 21
Mã bài: 06
2.3 Thiết kế bộ điều khiển PID một nơ-ron
2.3.1 Cấu trúc bộ điều khiển PID một nơ-ron
Bộ điều khiển PID được xây dựng bằng một nơ-
ron tuyến tính 3 ngõ vào, ngưỡng kích hoạt zero
như hình H.4. Ngõ vào của nơ-ron nhận 3 giá trị
tương ứng là thành phần tỉ lệ, tích phân và vi phân
của sai biệt giữa đáp ứng và tín hiệu tham khảo
(1).
H. 4 Cấu trúc bộ điều khiển PID một nơ-ron
dk
kde
edkkeekee
3;2;1
0
(1)
Phương trình mô tả bộ điều khiển PID như sau:
321 eKeKeKkY
dip
(2)
trong đó, e(k) là sai biệt giữa tín hiệu tham khảo và
đáp ứng của hệ thống.
Với cấu trúc bộ điều khiển PID một nơ-ron hình
H.4, ngõ ra của nơ-ron cũng chính là ngõ ra của bộ
điều khiển PID, được biểu diễn lại như (3).
nnfkY
ewewewn
321
131211
(3)
Ở đó, w
1i
|
i=1,2,3
là các trọng số của nơ-ron, chính là
bộ thông số (K
p
, K
i
, K
d
) của bộ điều khiển PID và
chúng được cập nhật trực tuyến trong quá trình
điều khiển.
2.3.2 Huấn luyện trực tuyến bộ điều khiển
Mục tiêu của quá trình huấn luyện bộ điều khiển
PID một nơ-ron là điều chỉnh bộ trọng số w
1i
|
i=1,2,3
của mạng để cực tiểu hóa hàm chi phí (4).
2
2
2
1
2
1
kXkXkekE
ref
(4)
Để điều chỉnh trọng số w
1i
|
i=1,2,3
phương pháp
gradient descent được áp dụng:
kwkwkwK
kwkwkwK
kwkwkwK
d
i
p
131313
121212
111111
1
1
1
(5)
với
w
1,i
(k) |
i=1,2,3
là các gradient xác định bởi (6),
(7) và (8), được kiểm chứng thành công bởi [6].
1
11
11
11
e
kY
kX
ke
kw
kY
kY
kX
kX
kE
kw
kE
kw
Kp
Kp
Kp
(6)
2
12
12
12
e
kY
kX
ke
kw
kY
kY
kX
kX
kE
kw
kE
kw
Ki
Ki
Ki
(7)
3
13
13
13
e
kY
kX
ke
kw
kY
kY
kX
kX
kE
kw
kE
kw
Kd
Kd
Kd
(8)
với
dip
KKKk
k
,,|
là các hằng số tốc độ học;
e1,
e1 và
e3 xác định theo (1); )(/)( kYkX là độ
nhạy của đáp ứng đối với tín hiệu điều khiển, còn
gọi là thông tin Jacobian, được xác định thông qua
bộ nhận dạng mạng nơ-ron mờ hồi qui RFNN. Ở
đây, Y(k) và X(k) lần lượt là tín hiệu điều khiển và
đáp ứng của hệ thống tại thời điểm k như ký hiệu
trên hình H.1.
H. 5 Sơ đồ cấu trúc bộ nhận dạng RFNN
2.4 Nhận dạng không tham số mô hình đối
tượng
2.4.1 Cấu trúc bộ nhận dạng
Bộ nhận dạng đối tượng được sử dụng trong
nghiên cứu này là một hệ suy diễn mờ được thực
hiện bởi một mạng nơ-ron hồi qui nhiều lớp, gọi là
RFNN. Sơ đồ cấu trúc bộ nhận dạng RFNN được
cho trên hình H.5. Bộ nhận dạng RFNN có 4 lớp,
với lớp vào gồm gồm 2 nút, lớp mờ hóa gồm 10
nút, lớp luật mờ gồm 25 nút và lớp ra gồm 1 nút.
Gọi
k
i
O tương ứng là ngõ ra của nút thứ i thuộc lớp
22 Nguyễn Chí Ngôn và Đỗ Chí Tâm
VCM2012
thứ k, ta có thể mô tả cấu trúc bộ nhận dạng RFNN
như sau:
Lớp 1 – Lớp vào: Lớp này gồm 2 nút có nhiệm vụ
chuyển tải các giá trị ngõ vào đến lớp kế tiếp. Ở
đây các kết nối hồi tiếp được thêm vào để tăng khả
năng đáp ứng của mạng. Ngõ ra của nút thứ i ở lớp
vào được mô tả như (9):
2,1,1
111
ikOkxkO
k
iiii
(9)
với
1
i
là trọng số kết nối tại thời điểm hiện tại k.
Ngõ vào của bộ nhận dạng RFNN tương ứng là tín
hiệu điều khiển hiện tại và ngõ ra quá khứ của đáp
ứng:
1
1
2
1
1
kXkx
kYkx
(10)
Lớp 2 – Lớp mờ hóa: Lớp này gồm (2x5) nút, mỗi
nút thể hiện một hàm liên thuộc dạng Gauss với trị
trung bình m
ij
và độ lệch chuẩn σ
ij
xác định như
(11):
5, ,2,1;2,1,exp
2
2
1
2
ji
mkO
kO
ij
iji
ij
(11)
Ở mỗi nút trên lớp mờ hóa có 2 tham số được tự
động điều chỉnh trong quá trình huấn luyện trực
tuyến bộ nhận dạng RFNN, đó là m
ij
và σ
ij
.
Lớp 3 – Lớp luật: Lớp này gồm (5x5) nút. Ngõ ra
của nút thứ q trong lớp này được xác định như sau:
5, ,2,1;5, ,2,1,
23
i
i
iqq
qikOkO
i
(12)
Lớp 4 – Lớp ra: Gồm một nơ-ron tuyến tính với
ngõ ra xác định như (13):
25, ,2,1;1,
344
jikOwkO
j
jiji
(13)
Trong đó
4
ij
w là trọng số kết nối từ lớp luật lên lớp
ra. Ngõ ra của lớp thứ tư cũng là ngõ ra của bộ
nhận dạng RFNN:
1,
ˆ
,
ˆ
21
4
1
kykufkxkxfkOkX
m
(14)
2.4.2 Giải thuật huấn luyện trực tuyến bộ nhận
dạng
Mục tiêu của giải thuật huấn luyện trực tuyến bộ
nhận dạng RFNN là điều chỉnh các bộ trọng số của
mạng và các tham số của các hàm liên thuộc trên
lớp mờ hóa để đạt giá trị cực tiểu hàm chi phí (15):
2
4
1
2
2
1
2
1
kOkXkXkXkE
m
(15)
Sử dụng thuật học truyền ngược (back
propagration), bộ trọng số kết nối của RFNN sẽ
được điều chỉnh theo nguyên tắc xác định bởi (16).
W
kE
kWkWkWkW
1 (16)
Trong đó,
là hằng số tốc độ học và W là tham số
cần điều chỉnh trong quá trình huấn luyện bộ nhận
dạng RFNN. Gọi e(k)=X(k)-X
m
(k) và W=[
, m, σ,
w]
T
là sai số huấn luyện và véc-tơ trọng số kết nối
của bộ nhận dạng RFNN, thì gradient của E(.)
trong (16) theo W được xác định như sau:
W
kO
ke
W
kX
ke
W
kE
m
4
1
(17)
Với nguyên tắc này, trọng số ở từng lớp mạng
RFNN được cập nhật như sau:
34
4
44
1
i
w
ij
ij
w
ijij
Okekw
w
kE
kwkw
(18)
k
ij
ijij
kik
m
ij
ij
m
ijij
mkO
Owkekm
m
kE
kmkm
2
1
34
2
1
(19)
k
ij
ijij
kikij
ij
ijij
mkO
Owkek
kE
kk
3
2
1
34
2
1
(20)
k
ij
ijijij
kiki
i
ii
kOmkO
Owkek
kE
kk
2
11
341
1
11
12
1
(21)
Trong đó
,,,| mws
s
là các hằng số tốc độ học
tương ứng. Ngoài vai trò ước lượng ngõ ra của mô
hình đối tượng, bộ nhận dạng RFNN còn phải ước
lượng thông tin Jacobian để huấn luyện trực tuyến
bộ điều khiển PID. Thông tin này được xác định
theo [4-5], như sau:
s
ij
ijij
qs
q
q
ij
s
qs
qs
q
q
ij
q
q
ij
q
q
q
mkO
O
O
w
Y
O
O
O
w
Y
O
w
Y
O
O
O
u
O
kY
kX
2
1
2
3
4
2
2
3
4
3
25
1
4
25
1
3
3
44
1
2
.
.
(22)
3. Kết quả và thảo luận
Kết quả thực nghiệm trên thiết bị RT030 theo sơ
đồ điều khiển hình H.6 cho ngõ ra nhận dạng và
thông tin Jacobian trên hình H.7, các thông số của
Tuyển tập công trình Hội nghị Cơ điện tử toàn quốc lần thứ 6 23
Mã bài: 06
bộ điều khiển PID biến thiên trong quá trình điều
khiển trên hình H.8 và đáp ứng của hệ thống trên
hình H.9.
H. 6 Sơ đồ điều khiển trên thiết bị RT030
Trong thực nghiệm này, các hằng số tốc độ học
của bộ nhận dạng RFNN được chọn bằng nhau
giữa các lớp, tức
1.0
mw
; hằng số tốc
độ học của bộ điều khiển PID một nơ-ron được
chọn gồm
2.0,1.0
KdKiKp
. Nói chung, các
hằng số tốc độ học có ảnh hưởng đến khả năng hội
tụ của giải thuật huấn luyện trực tuyến gradient
descent. Nếu tốc độ học lớn, thời gian huấn luyện
nhanh nhưng khả năng hội tụ không được đảm bảo
và ngược lại.
H. 7 Ngõ ra của mô hình và thông tin Jacobian xác
đinh từ bộ nhận dạng RFNN
H. 8 Các thông PID thay đổi trong quá trình điều khiển
H. 9 Đáp ứng của RT030 và tín hiệu điều khiển
Không như các phương pháp thiết kế và hiệu chỉnh
off-line khác, ưu điểm của phương pháp này là
thiết kế và tự chỉnh bộ điều khiển một cách trực
tuyến và không cần quan tâm đến tham số của đối
tượng điều khiển. Với phương pháp này, bộ điều
khiển PID được chỉnh định thích nghi trong suốt
quá trình điều khiển, phù hợp cho các ứng dụng
mà ở đó đặc tính động của đối tượng có thay đổi.
Để minh chứng điều này, trong quá trình điều
khiển áp suất trên thiết bị RT030, thực nghiệm đã
điều chỉnh valve xả ở nhiều mức khác nhau, kết
quả cho thấy bộ điều khiển đã thích nghi tốt hơn
so với bộ PID kinh điển – hình H.10.
H. 10 So sánh đáp ứng của hệ RT030 với bộ điều khiển
thích nghi và với bộ điều khiển PID kinh điển.
Kết quả thực nghiệm cho thấy đáp ứng của hệ ổn
định áp suất không khí RT030 dưới tác động của
bộ điều khiển thích nghi đã xây dựng thỏa mãn các
yêu cầu về chất lượng điều khiển, cụ thể là không
xuất hiện vọt lố và triệt tiêu được sai số xác lập
với thời gian tăng đạt 8±0.2 giây, phù hợp với thực
tế.
4. Kết luận và đề nghị
Nghiên cứu này đã đề xuất một bộ điều khiển
thích nghi mà ở đó mô hình của đối tượng được
nhận dạng trực tuyến bởi một mạng nơ-ron mờ hồi
24 Nguyễn Chí Ngôn và Đỗ Chí Tâm
VCM2012
qui RFNN. Từ bộ nhận dạng RFNN, thông tin
Jacobian được tính toán để cung cấp cho giải thuật
gradient descent áp dụng để huấn luyện trực tuyến
bộ điều khiển PID một nơ-ron. Các tham số của bộ
điều khiển PID được tổ chức dưới dạng bộ trọng
số của một nơ-ron tuyến tính ba ngõ vào và được
điều chỉnh thích nghi trong quá trình điều khiển.
Kết quả thực nghiệm trên hệ ổn định áp suất
không khí RT030 của hãng Gunt-Hamburg cho
thấy bộ điều khiển đã đáp ứng được các yêu cầu
khắc khe về chất lượng điều khiển.
Giải thuật điều khiển này phù hợp với việc áp
dụng cho các đối tượng phi tuyến chưa biết trước
cấu trúc cũng như tham số. Bộ điều khiển sẽ tự
chỉnh định các thông số dựa theo tín hiệu vào, ra
của đối tượng nhờ các thuật huấn luyện trực tuyến.
Bước phát triển tiếp theo của nghiên cứu này là áp
dụng giải thuật Levenberg-Marquardt để đạt tốc độ
hội tụ bậc 2 trong quá trính huấn luyện trực tuyến
các mạng nơ-ron.
Cám ơn
Tác giả chân thành cám ơn Trường Đại học Cần
Thơ đã hỗ trợ kinh phí cho nghiên cứu này thông
qua đề tài cấp cơ sở mã số T2011-44, đồng thời
cán ơn các em sinh viên đại học và học viên cao
học đã hỗ trợ thực hiện nghiên cứu thông qua các
đề tài tốt nghiệp của mình.
Tài liệu tham khảo
[1] Åström, K.J. and T. Hägglund: PID
Controllers - Theory, Design and Tuning. 2
nd
Ed., Instrument Society of America, Research
Triangle Park, Carolina 27709, USA, 1995.
[2] Jones A.H. and P.B.M. Oliveira: Genetic
Auto-tuning of PID Controllers. IEEE Conf.
Publ. No. 414, 12-14 Sep 1995, pp. 141-145.
[3] Nguyễn Chí Ngôn: Bộ điều khiển PI mờ: Từ
thiết kế đến ứng dụng. Tạp chí Khoa học, ĐH
Cần Thơ, Số18a-2011, trang 82-92. ISSN:
1859-2333.
[4] Lee C.H. and C.C. Teng: Identification and
Control of Dynamic Systems using Recurrent
Fuzzy Neural Networks. IEEE Trans. Fuzzy
Systems. Vol.8, No.4, pp.349-366, 2000.
[5] Wei, S.; Z.Lujin; Z.Jinhai and M. Siyi:
Adaptive Control based on Neural Network.
Adaptive Control, Kwanho You (Ed.), ISBN:
978-953-7619-47-3, InTech., 2009.
[6] Zhang,M.;X.Wang;M.Liu: Adaptive PID
control Based on RBF Neural Network
Identification. Proc. 17
th
IEEE Inter. Conf. on
Tools with Artif. Intell., ICTAI'05, pp. 681-
683., 2005.
[7] Cong,S. and Y.Liang, PID-Like Neural
Network Nonlinear Adaptive Control For
Uncertain Multivariable Motion Montrol
Systems. IEEE Trans. Industrial Electronics,
Vol.56, No.10, pp. 3872-3879, 2009.
[8] G.u.n.t. Gerätebau GmbH: Experiment
Instruc-tions RT010-RT060 Principles of
Control Engi-neering. Barsbüttel Germany,
2004. Publication no.: 918.000 00 A 0X0 02
(A).
[9] Nguyễn Chí Ngôn: Bộ điều khiển PI mờ: từ
thiết kế đến ứng dụng. Tạp chí Khoa học ĐH
Cần Thơ, số18a-2011, trang 82-92.
ISSN:1859-2333.