Tải bản đầy đủ (.docx) (15 trang)

(TIỂU LUẬN) phương pháp điều khiển tối ưu, thích nghi cho hệ thống bốn bồn chứa

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.27 MB, 15 trang )

Phương pháp điều khiển
tối ưu, thích nghi
cho hệ thống bốn bồn chứa
Nhóm 6
Giảng viên hướng dẫn: TS. Hồng Đức Chính


1

2

3

Giới
thiệu
chung

4

5


1. Giới thiệu chung

Phương pháp điều khiển tuyến tính:Bộ điều khiển P, PI, PID
và các phương pháp chỉnh định tham số cho bộ điều khiển

Ưu điểm: Đơn giản

Nhược điểm: Kháng nhiễu kém


01

02

Phương pháp điều khiển phi tuyến: Kĩ thuật trượt, kĩ thuật
Backstepping,phương pháp điều khiển đa bề mặt trượt,…

Ưu điểm: Nâng cao tính bền vững của hệ

Nhược điểm: Phức tạp, phụ thuộc hệ thống

03

Phương pháp điều khiển tối ưu, thích nghi: Mạng Nơ-ron, hệ logic
mờ, điều khiển học lặp (ILC), điều khiển học tăng cường (RL),…

Ưu điểm: chất lượng tốt, ít phụ thuộc vào mơ hình, tối ưu

Nhược điểm: Khó thực hiện và khó áp dụng rộng rãi


1. Giới thiệu chung
Được sử dụng rộng rãi

Có nhiệm vụ chứa các loại chất
lỏng, các dung dịch, sản phẩm trong
quá trình cơng nghiệp

Đa dạng về thiết kế


u cầu cao về mặt ổn định và
an tồn trong q trình hoạt động


1

Mục đích điều khiển:
Giữ cho mực nước ở mỗi bồn chứa
đều ổn định theo giá trị đặt

Điều kiện ràng buộc:
2

• Mật độ lưu lượng khối lượng trong các bồn
bằng nhau và khơng đổi



Bỏ qua tổn hao năng lượng trong
suốt q trình


3

Các biến q trình:




: Chiều cao mực chất lỏ

trong từng bồn tương ứ
: Lưu lượng chất lỏng đ
từ bốn máy bơm
: Tỉ lệ lưu lượng khối lư
lỏng qua van 1 và van 2


1. Giới thiệu chung
Sử dụng khai triển Taylor để tuyến
tính hóa phương trình quanh điểm
làm việc
Thu được mơ hình có dạng

03
02
01

Dựa trên định luật cân bằng
vật chất, ta thu được phương
trình cân bằng mơ tả hệ thống

=

=


=


2. Phương pháp điều khiển tối ưu LQR

Mục tiêu

Bộ điều khiển tối ưu LQR

Bộ điều khiển phản hồi trạng thái sao
cho hàm chi phí đạt giá trị nhỏ nhất:

Cấu trúc bộ điều khiển



(

,)=∫(

+

)

Bộ điều khiển có dạng: với
trong đó là nghiệm của:
Phương trình trên được gọi là
phương trình Riccati

Nghiệm của phương trình Riccati
Phương trình Riccati có thể có
nhiều nghiệm
Nếu là một nghiệm thì cũng là
nghiệm do đó ta có thể coi là một ma
trận đối xứng

Ưu tiên chọn các nghiệm đối xứng

Tính ổn định của hệ thống
Bộ điều khiển được xây dựng với mục
tiêu chứ không phải làm cho (A-BK)
là ma trận bền
Không đảm bảo hệ thống sẽ ổn định
tại gốc tọa độ


2. Phương pháp điều khiển tối ưu LQR
Thuật tốn tìm nghiệm xấp xỉ của Kleiman



Viết lại hàm chi
phí: với
Đặt , sau đó nhân với và thực hiện các bước biến đổi ta thu được:



Phương trình này gọi là phương trình Lyapunov cho hệ LQR



01

Khởi tạo k=0 chọn là luật điều khiển khởi tạo sao cho là ma
trận Hurwitz
• Giải phương trình Lyapunov (20) để tìm nghiệm đối xứng xác định dương :



02



03

Cập nhập bộ điều khiển theo cơng thức:

Các tính chất:
• là Hurwitz





3. Phương pháp điều khiển tối ưu LQR
• Điều khiện có nghiệm duy nhất:

Thuật tốn tìm nghiệm khi
khơng biết rõ mơ hình

• Điều kiện ngừng lặp:

Để nâng cao tính thích nghi, nhiễu thăm dị được sử dụng và mơ hình
hệ thống trở thành:
• Lấy đạo hàm của và kết hợp với phương trình Lyapunov thu
được:
• Đặt , tích phân 2 vế phương trình trên suy ra:





Kết hợp với ta thu được hệ phương trình

Sử dụng tích Kronecker và tốn tử vecto hóa ma trận để giải hệ:
với là các vecto cột của A
• Đặt các biến ,và
• Khi đó và sẽ được xác định thơng qua:





3. Phương pháp điều khiển học lặp
Thuật toán học lặp

Mục tiêu của học lặp là tìm hàm học dạng:
Hoặc tìm hàm học có dạng đơn giản hơn:
Đối với hệ tuyến tính có thể sử dụng hàm học dạng PD:

Ngun
tắc

Sai lệch bám nếu , thỏa mản:

Xác định dựa vào và :
ới
Xác định và sao cho min thông qua xác định và như sau:


Xác
định
tham số

Sử dụng phương pháp điểm trong hoặc phương pháp SQP thu được , từ đó và với
dương tùy ý


4. Thử nghiệm phương pháp
Phương pháp LQR thích nghi

Nhận xét:

Tốc độ ổn định hệ thống nhanh.

Hệ thống ổn định nhưng các tín hiệu đầu ra khơng bám giá trị đặt.

Cần thực hiện cải tiến để giải quyết bài toán điều khiển bám.


4. Thử nghiệm phương pháp
Phương pháp LQR thích nghi kết hợp học lặp

Nhận xét:

Thuật tốn học lặp cho tốc độ đáp ứng tốt và bám giá trị đặt.

Khi kết hợp với bộ điều khiển LQR tối ưu thì số lần học sẽ giảm
đáng kể, chỉ còn khoảng 30 lần học so với 200 lần học trong trường

hợp không tối ưu


5. Tổng kết
Phương
pháp

Phương pháp điều khiển tối ưu LQR và phương pháp điều khiển
bám giá trị đặt dùng thuật toán học lặp đã được trình bày

Áp dụng

Cả hai phương pháp đều thể hiện được ưu điểm trong đó bộ điều
khiển LQR giúp tối thiểu hóa hàm chi phí và thuật toán học lặp
làm cho đầu ra của hệ bám giá trị đặt

Kết hợp

Việc kết hợp các phương pháp điều khiển với nhau giúp tận
dụng ưu điểm của từng phương pháp đồng thời các phương
pháp có thể hỗ trợ nhau để giảm thiểu khối lượng tính tốn

Phát
triển

Thay vì tuyến tính hóa, ta có thể sử dụng mạng Nơ -ron để xấp
xỉ mơ hình phi tuyến của hệ thống và áp dụng thuật tốn học lặp
cũng như học tăng cường cho chính hệ phi tuyến đó



Cảm ơn thầy và các bạn đã
lắng nghe



×