Tải bản đầy đủ (.pdf) (13 trang)

Phương pháp điều khiển tối ưu, thích nghi cho hệ thống bốn bồn chứa

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (822.29 KB, 13 trang )

Phương pháp điều khiển
tối ưu, thích nghi
cho hệ thống bốn bồn chứa
Nhóm 6
Giảng viên hướng dẫn: TS. Hồng Đức Chính


1

Giới
thiệu
chung

2

3

Phương Phương
pháp điều pháp
khiển
điều
LQR
khiển
thích nghi Học lặp

4

5

Thử
nghiệm


phương
pháp

Kết
luận


1. Giới thiệu chung
Phương pháp điều khiển tuyến tính:Bộ điều khiển P, PI, PID
và các phương pháp chỉnh định tham số cho bộ điều khiển
• Ưu điểm: Đơn giản
• Nhược điểm: Kháng nhiễu kém

01

02

Phương pháp điều khiển phi tuyến: Kĩ thuật trượt, kĩ thuật
Backstepping,phương pháp điều khiển đa bề mặt trượt,…
• Ưu điểm: Nâng cao tính bền vững của hệ
• Nhược điểm: Phức tạp, phụ thuộc hệ thống

03

Phương pháp điều khiển tối ưu, thích nghi: Mạng Nơ-ron, hệ logic
mờ, điều khiển học lặp (ILC), điều khiển học tăng cường (RL),…
• Ưu điểm: chất lượng tốt, ít phụ thuộc vào mơ hình, tối ưu
• Nhược điểm: Khó thực hiện và khó áp dụng rộng rãi



1. Giới thiệu chung
• Được sử dụng rộng rãi
• Có nhiệm vụ chứa các loại chất
lỏng, các dung dịch, sản phẩm trong
q trình cơng nghiệp
• Đa dạng về thiết kế
• Yêu cầu cao về mặt ổn định và an
toàn trong q trình hoạt động

1

Mục đích điều khiển:
Giữ cho mực nước ở mỗi bồn chứa
đều ổn định theo giá trị đặt

2

Điều kiện ràng buộc:
• Mật độ lưu lượng khối lượng trong
các bồn bằng nhau và khơng đổi
• Bỏ qua tổn hao năng lượng trong
suốt q trình

3

Các biến q trình:
• : Chiều cao mực chất lỏng chứa
trong từng bồn tương ứng
• : Lưu lượng chất lỏng được bơm lên
từ bốn máy bơm

• : Tỉ lệ lưu lượng khối lượng chất
lỏng qua van 1 và van 2


1. Giới thiệu chung
Sử dụng khai triển Taylor để tuyến
tính hóa phương trình quanh điểm
làm việc
Thu được mơ hình có dạng

03
02
01

𝑨=

Dựa trên định luật cân bằng vật
chất, ta thu được phương trình
cân bằng mơ tả hệ thống

[

𝟏

𝑻𝟏
𝟎

𝟎

𝟎


𝟎

𝟎

𝑨 𝟒 𝒉𝟎
𝟒 𝟏
𝟎
𝟎
𝑨 𝟐 𝒉𝟐 𝑻 𝟒
𝟏
𝟎 −
𝟎
𝑻𝟑
𝟏
𝟎 𝟎 −
𝑻𝟒

𝟏

𝑻𝟐
𝟎

𝑨𝟑 𝒉𝟑 𝟏
𝟎
𝑨𝟏 𝒉𝟏 𝑻 𝟑

][

𝑨𝒊

𝑻 𝒊=
𝒂𝒊

𝑩=



𝟎

𝜸 𝟏 𝒒𝟏
𝟎
𝑨 𝟏 𝒉𝟎
𝟏
𝜸 𝟐 𝒒𝟎
𝟐
𝟎
𝑨𝟐 𝒉 𝟎
𝟐

𝟎

𝟎

𝟎

𝟎

𝟎
( 𝟏 −𝜸 𝟐 ) 𝒒 𝟎
𝟏 𝟏 𝒒𝟑

𝟐
𝟎

𝟎
𝟎
𝑨𝟑
𝑻 𝟑 𝑨𝟑 𝒉𝟎
𝒉𝟑
𝟑
𝟎
(𝟏 −𝜸 𝟏 ) 𝒒 𝟎
𝟏 𝒒𝟒
𝟏
𝟎 𝟎
𝑨𝟒
𝑨 𝟒 𝒉𝟎
𝒉𝟎
𝟒
𝟒

𝟐 𝒉𝟎
𝒊
𝒈

]


2. Phương pháp điều khiển tối ưu LQR
Bộ điều khiển tối ưu LQR


Mục tiêu
Bộ điều khiển phản hồi trạng thái sao
cho hàm chi phí đạt giá trị nhỏ nhất:


𝑻
𝑻
𝑽 ( 𝒙 ,𝒖 )=∫ ( 𝒙 𝑸 𝒙+𝒖 𝑹𝒖 ) 𝒅𝒕
𝒐

Cấu trúc bộ điều khiển
Bộ điều khiển có dạng: với
trong đó là nghiệm của:
Phương trình trên được gọi là phương
trình Riccati

Nghiệm của phương trình Riccati

o

Phương trình Riccati có thể có nhiều
nghiệm
Nếu là một nghiệm thì cũng là
nghiệm do đó ta có thể coi là một ma
trận đối xứng
Ưu tiên chọn các nghiệm đối xứng

Tính ổn định của hệ thống
Bộ điều khiển được xây dựng với mục
tiêu chứ không phải làm cho (A-BK)

là ma trận bền
Không đảm bảo hệ thống sẽ ổn định
tại gốc tọa độ


2. Phương pháp điều khiển tối ưu LQR
Thuật tốn tìm nghiệm xấp xỉ của Kleiman

01

• Viết lại hàm chi phí:
với
• Đặt , sau đó nhân với và thực hiện các bước biến đổi ta thu được:
• Phương trình này gọi là phương trình Lyapunov cho hệ LQR

02

• Khởi tạo k=0 chọn là luật điều khiển khởi tạo sao cho là ma
trận Hurwitz
• Giải phương trình Lyapunov (20) để tìm nghiệm đối xứng xác định dương :
• Cập nhập bộ điều khiển theo cơng thức:

03

Các tính chất:
• là Hurwitz
• và


3. Phương pháp điều khiển tối ưu LQR

Thuật tốn tìm nghiệm khi
khơng biết rõ mơ hình

• Điều khiện có nghiệm duy nhất:
• Điều kiện ngừng lặp:

• Để nâng cao tính thích nghi, nhiễu thăm dị được sử dụng và mơ hình hệ
thống trở thành:
• Lấy đạo hàm của và kết hợp với phương trình Lyapunov thu
được:
• Đặt , tích phân 2 vế phương trình trên suy ra:
• Kết hợp với ta thu được hệ phương trình

• Sử dụng tích Kronecker và tốn tử vecto hóa ma trận để giải hệ:
với là các vecto cột của A
• Đặt các biến , và

• Khi đó và sẽ được xác định thơng qua:


3. Phương pháp điều khiển học lặp
Thuật toán học lặp

Mục tiêu của học lặp là tìm hàm học dạng:

Nguyên
tắc

Hoặc tìm hàm học có dạng đơn giản hơn:
Đối với hệ tuyến tính có thể sử dụng hàm học dạng PD:

Sai lệch bám nếu , thỏa mản:

Xác định dựa vào và :

ới
Xác định và sao cho min thông qua xác định và như sau:

Xác định
tham số

Sử dụng phương pháp điểm trong hoặc phương pháp SQP thu được , từ đó và với
dương tùy ý


4. Thử nghiệm phương pháp
Phương pháp LQR thích nghi

Nhận xét:
• Tốc độ ổn định hệ thống nhanh.
• Hệ thống ổn định nhưng các tín hiệu đầu ra khơng bám giá trị đặt.
• Cần thực hiện cải tiến để giải quyết bài toán điều khiển bám.


4. Thử nghiệm phương pháp
Phương pháp LQR thích nghi kết hợp học lặp

Nhận xét:
• Thuật tốn học lặp cho tốc độ đáp ứng tốt và bám giá trị đặt.
• Khi kết hợp với bộ điều khiển LQR tối ưu thì số lần học sẽ giảm
đáng kể, chỉ còn khoảng 30 lần học so với 200 lần học trong trường

hợp không tối ưu


5. Tổng kết
Phương
pháp

Phương pháp điều khiển tối ưu LQR và phương pháp điều khiển
bám giá trị đặt dùng thuật toán học lặp đã được trình bày

Áp dụng

Cả hai phương pháp đều thể hiện được ưu điểm trong đó bộ điều
khiển LQR giúp tối thiểu hóa hàm chi phí và thuật toán học lặp
làm cho đầu ra của hệ bám giá trị đặt

Kết hợp

Việc kết hợp các phương pháp điều khiển với nhau giúp tận
dụng ưu điểm của từng phương pháp đồng thời các phương
pháp có thể hỗ trợ nhau để giảm thiểu khối lượng tính tốn

Phát
triển

Thay vì tuyến tính hóa, ta có thể sử dụng mạng Nơ-ron để xấp xỉ
mơ hình phi tuyến của hệ thống và áp dụng thuật tốn học lặp
cũng như học tăng cường cho chính hệ phi tuyến đó



Cảm ơn thầy và các bạn đã lắng
nghe



×