BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
====o0o====
NGÔ THỊ THU TÌNH
GIẢI BÀI TOÁN TỐI ƢU TRONG ĐIỀU KHIỂN DỰ BÁO
CÓ ĐIỀU KIỆN RÀNG BUỘC BẰNG PHƢƠNG PHÁP
QUY HOẠCH NHIỀU THAM SỐ
LUẬN VĂN THẠC SỸ KĨ THUẬT
ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
Hà Nội - 2016
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
====o0o====
NGÔ THỊ THU TÌNH
GIẢI BÀI TOÁN TỐI ƢU TRONG ĐIỀU KHIỂN DỰ BÁO
CÓ ĐIỀU KIỆN RÀNG BUỘC BẰNG PHƢƠNG PHÁP
QUY HOẠCH NHIỀU THAM SỐ
Chuyên ngành: Điều khiển và Tự động hóa
LUẬN VĂN THẠC SỸ KỸ THUẬT
ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
NGƢỜI HƢỚNG DẪN KHOA HỌC
PGS.TS. HOÀNG MINH SƠN
Hà Nội - 2016
LỜI CAM ĐOAN
Tôi xin cam đoan bản luận văn tốt nghiệp: Giải bài toán tối ƣu trong điều khiển
dự báo có điều kiện ràng buộc bằng phƣơng pháp quy hoạch nhiều tham số do tôi tự
thực hiện dƣới sự hƣớng dẫn của PGS.TS. Hoàng Minh Sơn. Các số liệu và kết quả là
hoàn toàn đúng với thực tế.
Để hoàn thành luận văn này tôi chỉ sử dụng những tài liệu đƣợc ghi trong danh
mục tài liệu tham khảo và không sao chép hay sử dụng bất kỳ tài liệu nào khác. Nếu phát
hiện có sự sao chép tôi xin chịu hoàn toàn trách nhiệm.
Hà Nội, ngày 25 tháng 03 năm 2016
Học viên
Ngô Thị Thu Tình
i
MỤC LỤC
LỜI CAM ĐOAN ........................................................................................................i
MỤC LỤC .................................................................................................................. ii
DANH MỤC HÌNH VẼ .............................................................................................iv
DANH MỤC BẢNG SỐ LIỆU...................................................................................v
DANH MỤC TỪ VIẾT TẮT .....................................................................................vi
MỞ ĐẦU .....................................................................................................................1
Chƣơng 1: TỔNG QUAN VỀ ĐIỀU KHIỂN TỐI ƢU VÀ ĐIỀU KHIỂN DỰ BÁO 3
1.1 Giới thiệu chung về điều khiển dự báo ..............................................................3
1.1.1 Nguyên tắc chung của điều khiển dự báo dựa mô hình ..............................3
1.1.2 Cấu trúc cơ bản của MPC ............................................................................5
1.1.3 Điều kiện ràng buộc ....................................................................................6
1.2 Bài toán tối ƣu....................................................................................................7
1.3 Mối quan hệ giữa bài toán tối ƣu và bài toán điểm yên ngựa ...........................8
1.4 Phƣơng pháp Kuhn-Tucker ...............................................................................9
Chƣơng 2: PHƢƠNG PHÁP QUY HOẠCH NHIỀU THAM SỐ ...........................10
2.1 Bài toán MPC online .......................................................................................11
2.2 Bài toán quy hoạch toàn phƣơng đa tham số (Mp-QP) ...................................16
2.2.1 Cơ sở của thuật toán ..................................................................................16
2.2.2 Tính lồi và tính liên tục .............................................................................19
2.2.3 Thuật toán Off-line cho mp-QP và bộ điều khiển MPC tƣờng minh ........22
2.2.4 Định nghĩa CRrest .......................................................................................23
2.3 Nghiệm phản hồi trạng thái cho bộ điều khiển toàn phƣơng tuyến tính có ràng
buộc ........................................................................................................................25
Chƣơng 3: MULTI-PARAMETRIC TOOLBOX .....................................................27
3.1 Mô hình hệ thống .............................................................................................27
3.1.1 Hệ thống tuyến tính – dừng (LTI) .............................................................27
3.1.2 Hệ thống affine từng phần (PWA) ............................................................28
3.1.3 Nhập mô hình từ các nguồn bên ngoài ......................................................29
3.2 Các ràng buộc ..................................................................................................30
ii
3.3 Thiết kế điều khiển ..........................................................................................31
3.3.1 Tính toán bộ điều khiển .............................................................................31
3.3.2 Trƣờng của đối tƣợng mptctrl ...................................................................32
3.3.3 Một số hàm đƣợc sử dụng cho đối tƣợng mptctrl .....................................33
3.4 Thực thi luật điều khiển ...................................................................................35
3.4.1 Tính toán luật điều khiển tƣờng minh .......................................................35
3.4.2 Thực thi .....................................................................................................36
3.5 Xuất bộ điều khiển dƣới dạng code C .............................................................37
3.6 Biểu diễn tín hiệu và các miền trạng thái dƣới dạng hình ảnh ........................38
3.6.1 Đồ thị của các polyhedral partition ...........................................................38
3.6.2 Biểu diễn quỹ đạo hệ hở và hệ kín ............................................................38
3.6.3 Quan sát hàm PWA, PWQ ........................................................................38
CHƢƠNG 4 CÁC VÍ DỤ VỀ QUY HOẠCH NHIỀU THAM SỐ SỬ DỤNG
TOOLBOX MPT ......................................................................................................40
4.1 Bài toán ............................................................................................................40
4.1.1 Mô tả bài toán ............................................................................................40
4.1.2 Nhiệm vụ ...................................................................................................40
4.1.3 Yêu cầu ......................................................................................................40
4.1.4 Trình bày ...................................................................................................41
4.2 Thực hiện .........................................................................................................42
4.2.1 Công cụ......................................................................................................42
4.2.2 Ví dụ minh họa cụ thể ...............................................................................42
KẾT LUẬN ...............................................................................................................54
TÀI LIỆU THAM KHẢO .........................................................................................55
PHỤ LỤC ..................................................................................................................56
iii
DANH MỤC HÌNH VẼ
Hình 1.1: Điều khiển dự báo trong trƣờng hợp không có trễ......................................4
Hình 1.2: Điều khiển dự báo dựa mô hình trong trƣờng hợp có trễ (d>0) .................5
Hình 1.3: Cấu trúc cơ bản của MPC ...........................................................................6
Hình 2.1 Tối ƣu online ..............................................................................................11
Hình 2.2: Tối ƣu online thông qua quy hoạch nhiều tham số ...................................11
Hình 2.3: Các vùng giới hạn X và CR0 .....................................................................23
Hình 2.4: Lấy ngƣợc dấu của bất phƣơng trình C1 thu đƣợc
..........................24
Hình 2.5: Các miền đƣợc chia trong X ....................................................................25
Hình 4.1: Vùng không gian trạng thái sau khi đƣợc chia .........................................43
Hình 4.2: Vùng không gian trạng thái sau khi đƣợc tối giản ....................................43
Hình 4.3: Đồ thị của tín hiệu điều khiển ...................................................................44
Hình 4.4: Quỹ đạo hệ kín với giá trị trạng thái ban đầu khác nhau ..........................45
Hình 4.5: Quỹ đạo của biến trạng thái ......................................................................45
Hình 4.6: Quỹ đạo tín hiệu điều khiển ......................................................................46
Hình 4.7: Quỹ đạo đầu ra ..........................................................................................46
Hình 4.8: Mô hình xe ô tô đi lên dốc ........................................................................46
Hình 4.9: Các miền đƣợc chia trong không gian trạng thái ......................................51
Hình 4.10: Tín hiệu điều khiển u ..............................................................................51
Hình 4.11: Quỹ đạo của biến trạng thái ....................................................................52
Hình 4.12: Quỹ đạo của đầu ra..................................................................................52
Hình 4.13: Quỹ đạo của biến điều khiển ...................................................................53
iv
DANH MỤC BẢNG SỐ LIỆU
Bảng 2.1: Giới hạn của các vùng
................................................................... 24
Bảng 3.1: Chiều của các ma trận trong mô hình hệ PWA........................................ 28
Bảng 3.2: Các hàm tính toán bộ điều khiển cho các bài toán tối ƣu khác nhau ....... 32
Bảng 3.3: Các trƣờng của đối tƣợng bộ điều khiển MPC ........................................ 32
Bảng 4.1: Thời gian tính toán bộ điều khiển ............................................................ 44
v
DANH MỤC TỪ VIẾT TẮT
MPC
Model Predictive Control
Điều khiển dự báo theo mô hình
MPP
Multi-Parametric Programming
Quy hoạch nhiều tham số
MPT
Multi-Parametric Toolbox
Toolbox đa tham số
LP
Linear Programming
Quy hoạch tuyến tính
QP
Quadratic Programming
Quy hoạch toàn phƣơng
MP-QP
Multi-Parametric Quadratic
Quy hoạch toàn phƣơng nhiều tham
Programming
số
KKT
Karush – Kuhn –Tucker
Điều kiện Karush – Kuhn –Tucker
LTI
Linear Time-Invariant
Hệ tuyến tính dừng
PWA
Piecewise Affine
Hàm affine từng phần
PWQ
Piecewise Quadratic
Toàn phƣơng từng phần
CFTOC
Constrained Finite-Time Optimal
Điều khiển tối ƣu thời gian hữu hạn
Control
có ràng buộc
Constrained Infinite Time Optimal
Điều khiển tối ƣu thời gian vô hạn
Control
có ràng buộc
Constrained Minimum Time
Điều khiển tối ƣu thời gian tối thiểu
Optimal Control
có ràng buộc
CITOC
CMTOC
vi
Mở đầu
MỞ ĐẦU
Điều khiển dự báo theo mô hình là phƣơng pháp điều khiển hiện đại, ra đời
cách đây vài thập niên nhƣng trong những năm gần đây mới phát triển mạnh mẽ và
có nhiều ứng dụng trong công nghiệp. Điều khiển dự báo theo mô hình (MPC) đƣợc
biết tới với khả năng giải quyết các bài toán trong hệ thống đa biến có ràng buộc,
các quá trình có động học phức tạp (tƣơng tác mạnh, có trễ…), có khả năng tự bù
thời gian chết, đƣa ra phƣơng pháp điều khiển vƣợt trƣớc…Ngoài ra nó còn dễ dàng
cài đặt trên nền máy tính điều khiển số.
MPC là giải pháp tối ƣu có ràng buộc online dựa vào lý thuyết tính lùi, sử
dụng một mô hình quá trình rõ để dự báo đáp ứng tƣơng lai của đối tƣợng. Bộ tối
ƣu hóa giải quyết một bài toán tối ƣu, trong mỗi chu kì lấy mẫu của hệ thống điều
khiển thông qua việc tính toán điều chỉnh chuỗi biến điều khiển tƣơng lai, nhằm tối
ƣu hóa hoạt động của đối tƣợng ở mỗi một chu kì. Giá trị đầu tiên của chuỗi tối ƣu
đƣợc đƣa tới điều khiển đối tƣợng, quá trình tính toán này sẽ đƣợc lặp lại trong mỗi
chu kỳ tiếp.
Lợi ích của MPC là rất to lớn, có nhiều tiềm năng, thỏa mãn điều kiện ràng
buộc và tối ƣu hóa nhƣng ứng dụng của nó còn bị hạn chế trong thực tế do yêu cầu
về khả năng tính toán online. Việc lặp lại giải bài toán tối ƣu hóa trong những
khoảng thời gian xác định (mỗi chu kỳ trích mẫu của đối tƣợng) yêu cầu khối lƣợng
tính toán lớn và hiệu quả thực thi của bộ tối ƣu online lại dựa vào việc tính toán
nhanh tác động điều khiển tối ƣu của bộ tính toán online. Vấn đề trên yêu cầu năng
lực thiết bị phần cứng điều khiển và giải thuật tối ƣu phải thích hợp.
Để giải quyết bài toán trên tác giả đã chọn đề tài: “GIẢI BÀI TOÁN TỐI ƢU
TRONG ĐIỀU KHIỂN DỰ BÁO CÓ ĐIỀU KIỆN RÀNG BUỘC BẰNG PHƢƠNG
PHÁP QUY HOẠCH NHIỀU THAM SỐ”. Với hƣớng tiếp cận này, biến điều khiển là
một hàm tƣờng minh của biến trạng thái, bộ tối ƣu online chia ra ƣớc lƣợng các
hàm đơn giản trong khoảng thời gian xác định, tính toán tác động điều khiển tƣơng
ứng cho mỗi vùng trạng thái của đối tƣợng. Phƣơng pháp này đƣợc biết tới là “Tối
ƣu hóa online thông qua tối ƣu tham số offline”. Mục tiêu chính của đề tài: Thực
1
Mở đầu
thi, kiểm chứng, đánh giá đƣợc khả năng áp dụng của phƣơng pháp đƣa bài toán tối
ƣu online trong điều khiển dự báo về bài toán tối ƣu offline để xây dựng luật điều
khiển phản hồi trạng thái
Luận văn đƣợc bố cục thành bốn chƣơng:
Chƣơng 1: Trình bày các kiến thức cơ sở về điều khiển tối ƣu và điều khiển
dự báo liên quan đến đề tài nhƣ : nguyên tắc, cấu trúc chung của MPC, các điều
kiện ràng buộc, bài toán điều khiển tối ƣu, phƣơng pháp Kuhn-Tucker
Chƣơng 2: Nghiên cứu cở sở phƣơng pháp quy hoạch nhiều tham số (MultiParametric Programming)
Chƣơng 3: Trình bày về Toolbox mô phỏng MPT
Chƣơng 4: Xây dựng ví dụ mô phỏng kiểm chứng phƣơng pháp quy hoạch
nhiều tham số trên MATLAB
Qua đây tác giả xin chân thành cảm ơn PGS.TS. Hoàng Minh Sơn đã tận tình
hƣớng dẫn, tạo điều kiện cho tác giả trong toàn bộ quá trình nghiên cứu và hoàn
thiện luận văn. Đồng thời tác giả cũng xin bảy tỏ lòng trân trọng biết ơn tới các thầy
cô giảng viên bộ môn Điều khiển tự động, Viện Điện đã hỗ trợ, giúp đỡ tác giả
trong suốt thời gian qua.
Hà Nội, ngày 22 tháng 3 năm 2016
Học viên
Ngô Thị Thu Tình
2
Chƣơng 1: Tổng quan về điều khiển tối ƣu và điều khiển dự báo
Chƣơng 1: TỔNG QUAN VỀ ĐIỀU KHIỂN TỐI ƢU VÀ
ĐIỀU KHIỂN DỰ BÁO
1.1 Giới thiệu chung về điều khiển dự báo
Điều khiển dự báo tựa mô hình MPC là phƣơng pháp sử dụng mô hình của đối
tƣợng và tối ƣu hóa hàm mục tiêu để đƣa ra một tín hiệu điều khiển tối ƣu. Thập
niên 70 của thế kỷ trƣớc, MPC mới chỉ đƣợc sử dụng đối với các đối tƣợng biến đổi
chậm, vì thủ tục tối ƣu hóa sẽ đƣợc lặp đi lặp lại ở mọi bƣớc ảnh hƣởng tới tốc độ
tính toán và phần cứng điều khiển. Cho tới thập niên 90, khi tốc độ tính toán của
máy tính nhanh hơn thì MPC đƣợc áp dụng với nhiều loại đối tƣợng mà đặc tính
động học nhanh nhƣ máy bay, robot, vệ tinh nhân tạo, máy móc tự động … Nó có
các ƣu điểm nổi trội nhƣ: trực quan, dễ thực hiện, có thể áp dụng trên nhiều loại đối
tƣợng điều khiển nhƣ SISO, MISO, MIMO, điều khiển đối tƣợng có trễ khi đã biết
trƣớc tín hiệu đầu ra mong muốn, đồng thời nó cũng là một hƣớng nghiên cứu mới,
có tính mở cao. Hiện nay đây là phƣơng pháp điều khiển phi tuyến thông dụng nhất
cho các hệ tuyến tính có ràng buộc và đã trở thành chuẩn cho các bài toán điều
khiển đa biến có ràng buộc trong các quá trình công nghiệp.
1.1.1 Nguyên tắc chung của điều khiển dự báo dựa mô hình
Theo tài liệu [10] (trang 3-6), ta có điều khiển dự báo dựa mô hình có nguyên
tắc chung nhƣ sau
1. Dựa trên mô hình quá trình, biểu diễn dãy giá trị đầu ra (biến đƣợc điều
khiển) trong tƣơng lai phụ thuộc dãy giá trị đầu vào (biến điều khiển) và
đầu ra đo đƣợc
2. Xác định hàm mục tiêu dựa trên tác động điều khiển trong tƣơng lai và
sai lệch điều khiển dự báo (tín hiệu chủ đạo trong tƣơng lai có thể biết
trƣớc)
3. Tìm dãy giá trị điều khiển tối ƣu trong tƣơng lai để tối thiểu hóa hàm mục
tiêu, với một số điều kiện ràng buộc
4. Đƣa ra tác động điều khiển sử dụng giá trị đầu tiên trong dãy tìm đƣợc
5. Trong chu kỳ điều khiển tiếp theo: Đo giá trị đầu ra và lặp lại quy trình từ
bƣớc 3.
3
Chƣơng 1: Tổng quan về điều khiển tối ƣu và điều khiển dự báo
r, y, u
Tầm dự báo Ny
𝑦̂(t+2|t)
r
y(t-2)
𝑦̂(t+Ny)
𝑦̂(t+1|t)
y(t)
y(t-1)
Tầm điều khiển Nu
u(t)
u(t+2)
u(t+1)
u(t-2)
u(t+Nu)
u(t-1)
t-2
t-1
t+1
t
t+2
t+Ny
t+Nu
Hình 1.1: Điều khiển dự báo trong trƣờng hợp không có trễ
Trong nguyên tắc điều khiển dự báo hình 1.1 có phiếm hàm mục tiêu dạng
J(t,u) = ∑
( ), (
)
)- + ∑
̂(
Số gia điều khiển
( )
( )
(
)
Nu là tầm điều khiển và Ny là tầm dự báo
4
( ),
(
)-
Chƣơng 1: Tổng quan về điều khiển tối ƣu và điều khiển dự báo
r, y, u
Tầm dự báo Ny
r
y(t-2)
𝑦̂(t+Ny)
𝑦̂(t+d|t)
y(t)
y(t-1)
Tầm điều khiển Nu
u(t)
u(t+1)
u(t-2)
u(t+Nu)
u(t-1)
t-2
t-1
t
t+1
t+2
t+Ny
t+Nu
Hình 1.2: Điều khiển dự báo dựa mô hình trong trƣờng hợp có trễ (d>0)
Trong trƣờng hợp có trễ, hàm mục tiêu có dạng
J(t,u) = ∑
( ), (
)
̂(
)- + ∑
( ),
(
)- .
1.1.2 Cấu trúc cơ bản của MPC
Cấu trúc cơ bản của MPC đƣợc mô tả nhƣ hình 1.3 trong đó đầu vào của mô
hình dự báo là các dữ liệu trong quá khứ và tƣơng lai sau đó thu đƣợc đầu ra dự
báo. MPC dựa vào các bộ dữ liệu vào – ra trong quá khứ và dự báo trong tƣơng lai,
căn cứ vào giá trị hàm mục tiêu thỏa mãn bộ điều kiện ràng buộc của bài toán điều
khiển, tiến hành bài toán tối ƣu, từ đó tính toán tín hiệu điều khiển đầu ra sao cho
sai lệch điều khiển đạt cực tiểu, tức là khi đó tín hiệu ra dự báo có thể bám theo
đƣợc tín hiệu đầu ra mong muốn.
5
Chƣơng 1: Tổng quan về điều khiển tối ƣu và điều khiển dự báo
Đầu vào và đầu ra quá khứ
(Past Input and Outputs)
Mô hình
(Model)
Đầu ra dự báo
(Predicted Outputs)
Quỹ đạo đặt
(Reference
Trafectory )
(-)
Đầu vào tƣơng lai
(Future Inputs)
Bộ tối ƣu
(Optimizer)
Hàm mục tiêu
(Cost Function)
Sai lệch dự báo
(Future Error)
Điều kiện ràng
buộc
Hình 1.3: Cấu trúc cơ bản của MPC
1.1.3 Điều kiện ràng buộc
Vấn đề ràng buộc là yếu tố quan trọng, đặc biệt trong những bộ điều khiển
công nghiệp. Khi điều khiển hệ thống phải luôn đảm bảo tín hiệu điều khiển, trạng
thái hệ thống không vi phạm các giới hạn cho phép, tức là luôn phải nằm trong vùng
an toàn. Ví dụ khi điều khiển các thông số nhiệt độ, áp suất, mực chất lỏng phải
luôn có giới hạn cực tiểu, giới hạn về lƣu lƣợng nƣớc chảy trong ống dẫn, độ mở
của van…
Một hệ thống điều khiển sau khi đƣợc thiết kế, nếu hiệu chỉnh tốt thì các tín
hiệu sẽ luôn giữ đƣợc khoảng cách an toàn đối với các điều kiện ràng buộc. Trong
cùng loại hệ thống điều khiển, hệ thống nào giữ đƣợc khoảng cách này tốt thì giá sẽ
càng cao. Tuy nhiên, vì lý do kinh tế nên các hệ thống công nghiệp có khuynh
hƣớng các tín hiệu sẽ bám theo điều kiện ràng buộc để giảm bớt công sức điều
chỉnh và giá thành.
Trong điều khiển dự báo, kỹ thuật tối ƣu hóa đƣợc sử dụng để đảm bảo các
ràng buộc không bị vi phạm. Đối với hệ tuyến tính, các phƣơng pháp tối ƣu hóa LP
6
Chƣơng 1: Tổng quan về điều khiển tối ƣu và điều khiển dự báo
(Linear Programming), QP (Quadratic Programming) thƣờng đƣợc sử dụng. Trong
các hệ thống phi tuyến các phƣơng pháp phân nhánh giới hạn (Branch and Bound),
phƣơng pháp Newton, phƣơng pháp Lenvenberg-Marquardt…thƣờng đƣợc sử
dụng.
Trong hầu hết các trƣờng hợp, ràng buộc thƣờng đƣợc thể hiện bởi các giới
hạn trên tín hiệu điều khiển, trạng thái và tín hiệu ra của hệ thống
umin
( )
umax
hoặc
umin
( )
umax
ymin
( )
ymax
hoặc
ymin
( )
ymax
Ràng buộc nhƣ trên gọi là ràng buộc bất đẳng thức. Bên cạnh đó còn có ràng
buộc phƣơng trình giúp cho bộ điều khiển tự cải thiện chất lƣợng điều khiển
+ Ràng buộc bất đẳng thức
̃ (k)
̃ (k)
̃ (k) không phụ thuộc vào tƣơng lai của hệ thống, ̃ (k) là một vectơ.
Trƣờng hợp điều kiện ràng buộc giới hạn bởi hai giá trị cận trên và cận dƣới
nhƣ sau:
̃ *min
̃ *(k)
̃ *max
Ta có thể đƣa về dạng tổng quát sau:
̃ (k)
[
̃ ( )
]
̃ ( )
[
̃
̃
]
̃ (k)
+ Ràng buộc phƣơng trình
̃ (k) = 0, ̃ (k) là một vectơ.
Phƣơng pháp điều khiển dự báo giải quyết tốt bài toán điều khiển có ràng
buộc, và đây cũng chính là lý do mà phƣơng pháp điều khiển này đƣợc sử dụng
ngày càng phổ biến
1.2 Bài toán tối ƣu
Điều khiển dự báo có nguồn gốc từ điều khiển tối ƣu và giải bài toán tối ƣu là
phần quan trọng của điều khiển dự báo. Các bài toán tối ƣu hay gặp trong thực tế đó
là:
-
Bài toán điều khiển tối ƣu tĩnh: là bài toán chọn các tham số điều khiển trong
7
Chƣơng 1: Tổng quan về điều khiển tối ƣu và điều khiển dự báo
số các tham số thích hợp sao cho hệ thống đạt đƣợc chất lƣợng một cách tốt
nhất.
-
Bài toán tối ƣu động: nhiệm vụ trọng tâm là tìm tín hiệu điều khiển tối ƣu
(t) để chất lƣợng quá trình chuyển đổi trạng thái từ điểm đầu đến điểm cuối
là tốt nhất.
1.3 Mối quan hệ giữa bài toán tối ƣu và bài toán điểm yên ngựa
Từ tài liệu [9] trang 31- 34, ta có
Xét bài toán tối ƣu
*
= argmin Q( )
P={
Trong đó m
(1.1a)
+
| gi ( )
(1.1b)
n. Từ bài toán tối ƣu trên ta lập một hàm chung
( )
f(p,λ) = Q( ) +
T
( ) với ( ) =
(
Định nghĩa 1: Điểm ( *,
điểm cực tiểu của f ( ,
f ( *, )
f ( *,
*
)
( ))
(
) đƣợc gọi là điểm yên ngựa của hàm (1.2) nếu
*
(1.2)
)
*
) và
*
và λi
,
*
là
là điểm cực đại của f ( *, ). Nói cách khác:
*
f( ,
)
(1.3)
Định lý 1: Xét bài toán tối ƣu (1.1) và hàm (1.2).
a. (Điều kiện đủ): Nếu ( *,
thì
*
*
) là điểm yên ngựa của hàm f ( , ) tính theo (1.2)
là nghiệm tối ƣu của bài toán (1.1).
b. (Điều kiện cần và đủ): Giả sử Q( ), gi ( )
là các hàm lồi, tức
là bài toán (1.1) là bài toán tối ƣu lồi, và tập P có ít nhất một điểm trong, tức
là tồn tại ít nhất một điểm
( *,
để có gi ( )
*
) là điểm yên ngựa của hàm f ( , ) khi và chỉ khi
của bài toán tối ƣu lồi (1.1).
8
. Khi đó điểm
*
là nghiệm tối ƣu
Chƣơng 1: Tổng quan về điều khiển tối ƣu và điều khiển dự báo
1.4 Phƣơng pháp Kuhn-Tucker
Định lý 1 cho thấy việc xác định nghiệm
*
thay bằng việc xác định điểm yên ngựa ( *,
*
của bài toán tối ƣu (1.1) có thể đƣợc
) của hàm (1.2). Ƣu điểm chính của
cách giải này là ta đã chuyển hoàn toàn bài toán tối ƣu thành bài toán giải hệ các bất
phƣơng trình và phƣơng trình.
Công cụ hỗ trợ việc xác định điểm yên ngựa ( *,
*
) của hàm (1.2) là định lý
Kuhn-Tucker:
Định lý 2: Cho bài toán tối ƣu (1.1) có Q( ), gi ( )
là các hàm
khả vi. Lập hàm f ( , ) theo (1.2). Khi đó:
a) (Điều kiện cần): Nếu ( *,
*
) là điểm yên ngựa của f ( , ) thì nó sẽ thỏa mãn
hệ n hệ các bất phƣơng trình và phƣơng trình:
.
/
.
/
.
{( )
/
Trong đó
.
/
(
)
.
/
(
)
b) (Điều kiện cần và đủ): Nếu (1.1) còn là bài toán tối ƣu lồi và tập P có ít nhất
một điểm trong thì phát biểu a) sẽ là điều kiện cần và đủ.
9
Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số
Chƣơng 2: PHƢƠNG PHÁP QUY HOẠCH NHIỀU THAM SỐ
Hệ thống tuyến tính với đầu vào, đầu ra hoặc ràng buộc trạng thái là lớp hệ
thống quan trọng trong thực tiễn và nghiên cứu. Có rất nhiều phƣơng pháp điều
khiển khác nhau đƣợc thiết kế cho hệ tuyến tính đã thu đƣợc chất lƣợng tốt và độ ổn
định cao, đặc biệt trong điều kiện có ràng buộc đƣợc đảm bảo với luật điều khiển
phi tuyến. Phƣơng pháp điều khiển phi tuyến thông dụng nhất cho các hệ tuyến tính
có ràng buộc là điều khiển dự báo dựa mô hình (MPC) và hiện nay đã trở thành
chuẩn cho các bài toán điều khiển đa biến có ràng buộc trong các quá trình công
nghiệp. Nhƣng hạn chế của phƣơng pháp này là khối lƣợng tính toán online lớn làm
ảnh hƣởng tới thời gian đƣa ra tác động điều khiển nhất là khi tầm dự báo tăng lên.
Một kỹ thuật đƣợc đƣa ra để giải quyết vấn đề trên là quy hoạch nhiều tham số
(Multi-Parametric Program).
MPP là kỹ thuật để giải quyết bài toán tối ƣu hóa với hàm mục tiêu đƣợc tối
đa hoặc tối thiểu một chỉ tiêu chất lƣợng nào đó với giới hạn cho trƣớc và một số
tham số khác nhau thay đổi giữa cận trên và cận dƣới. Tƣ tƣởng của phƣơng pháp
này sẽ là chia miền trạng thái thành các miền lồi, mỗi miền này tƣơng ứng sẽ cho
cùng một dạng biến điều khiển u = f(x). Việc tính toán tối ƣu đƣợc thực hiện offline
tạo thành một bảng các giá trị có sẵn. Do đó công việc tính toán online rất dễ dàng.
Bản chất bài toán đã đƣợc chuyển từ tối ƣu online về offline. Đặc trƣng của phƣơng
pháp quy hoạch nhiều tham số là khả năng thu đƣợc:
(i)
Hàm mục tiêu và tín hiệu điều khiển tối ƣu là hàm tƣờng minh của
biến trạng thái
(ii)
Các vùng trong không gian của tham số nơi mà các hàm này có giá trị
Hình 2.1 và 2.2 dƣới đây mô tả cấu trúc chung của hệ thống sử dụng phƣơng pháp
tối ƣu online và phƣơng pháp quy hoạch nhiều tham số
10
Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số
BỘ TỐI ƢU
Tác động
điều khiển
Biến trạng
thái
Nhiễu
đầu vào
Đầu ra
quá trình
ĐỐI TƢỢNG
Hình 2.1 Tối ƣu online
Parametric Profile
Biến điều khiển
Biến trạng thái
Biến
trạng thái
Tác động
điều khiển
Đầu ra
quá trình
Nhiễu
đầu vào
ĐỐI TƢỢNG
Ƣớc lƣợng hàm online
Quy hoạch
nhiều tham
số (offline)
Bộ quy hoạch
đa tham số
Hình 2.2: Tối ƣu online thông qua quy hoạch nhiều tham số
2.1 Bài toán MPC online
Theo tài liệu [8] từ trang 45 - 51
Xét bài toán điều khiển về gốc tọa độ hệ tuyến tính dừng sau:
(2.1)
với ( )
ra; các ma trận
( )
; tƣơng ứng là biến trạng thái và biến đầu vào, biến đầu
. Cả x(k) và u(k) đƣợc giới hạn bởi:
11
Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số
( )
( )
{
*
*
+
+
, và vectơ
Giả thiết ma trận
(2.2)
là hằng số với
.
Bài toán có hàm mục tiêu sau:
( ( ))
,
-
*∑
+
∑
(2.3)
{
( )
Với
và
tƣơng ứng là trạng thái và đầu vào dự báo,
R
Rm×m and R > 0.
N ≥ 1 là tầm dự báo.
Điều kiện của Q và R đảm bảo hàm mục tiêu là lồi. Tất cả các trị riêng của Q
đều không âm và tất cả các trị riêng của R phải dƣơng để đảm bảo nghiệm tối ƣu là
duy nhất. Rõ ràng thành phần
trong khi thành phần
thể hiện độ sai lệch trạng thái x so với gốc
biểu thị năng lƣợng sử dụng cho tín hiệu điều khiển ở
đầu vào. Việc lựa chọn Q lớn có nghĩa trạng thái
phải gần gốc nhất có thể. Mặt
khác việc lựa chọn R lớn có nghĩa tín hiệu điều khiển
phải nhỏ để đảm bảo hàm
mục tiêu có giá trị nhỏ.
Một phƣơng án khác ta có thể xem xét chất lƣợng dựa vào chuẩn bậc 1: l1-norm
,
-
*∑
+
∑
(2.4)
Hoặc chuẩn vô cùng
,
-
*∑
∑
+
(2.5)
Từ mô hình (2.1) ta có thể biểu diễn giá trị của biến trạng thái đƣợc dự báo nhƣ sau:
{
(2.6)
12
Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số
Ta có thể viết gọn lại (2.6) nhƣ sau:
( )
,
Với
[
]
(2.7)
,
,
-
[
,
]
Hàm mục tiêu của bài toán tối ƣu (2.3) có thể viết lại dƣới dạng
( ( ))
*
+
(2.8)
Với
[
]
[
,
]
Thay (2.7) vào (2.8) thu đƣợc
( ( ))
*
Với
+
( )
,
( )
( )+
(2.9)
,
(2.10)
Xét ràng buộc (2.2) ta thấy ràng buộc trạng thái và đầu vào dự báo nhƣ sau:
{
(2.11)
Với
[
],
[
] ,
[
] ,
[
]
Từ (2.7) ràng buộc trạng thái có thể đƣợc viết dạng
*
( )
+
Hay tƣơng đƣơng
( )
(2.12)
Kết hợp giữa (2.11) và (2.12) ta đƣợc
( )
(2.13)
Với
13
Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số
[
] ,
[
]
[
,
]
Từ (2.7) và (2.13) bài toán MPC có thể viết lại dạng
( ( ))
*
( )
+
(2.14)
Điều kiện
( )
Thành phần
( )
( ) đƣợc bỏ qua do không ảnh hƣởng tới điều kiện tối
ƣu. Hàm mục tiêu ban đầu đƣợc biểu diễn
( ( ))
( ( ))
( )
( )
Luật điều khiển thu đƣợc sau khi giải bải toán tối ƣu online (2.14) đƣợc gọi
là luật điều khiển dự báo nội suy.
Tính khả vi đệ quy của bài toán tối ƣu và sự ổn định của hệ kín là hai vấn đề
quan trọng khi thiết kế bộ điều khiển MPC. Tính khả thi đệ quy của bài toán quy
hoạch toàn phƣơng (2.14) có nghĩa là nếu (2.14) khả vi tại thời điểm k, nó cũng sẽ
khả vi tại thời điểm k+1. Nói cách khác tồn tại tín hiệu điều khiển giữ cho hệ thống
nằm trong phạm vi ràng buộc cho phép. Bài toán về tính khả vi có thể bị ảnh hƣởng
bởi sai lệch mô hình, các nhiễu hoặc sự lựa chọn hàm mục tiêu. Còn việc phân tích
tính ổn định cần sử dụng lý thuyết Lyapunov do sự có mặt của các ràng buộc làm hệ
thống kín là phi tuyến. Thêm vào đó hệ thống ràng buộc đầu vào không ổn định thì
không thể ổn định toàn cục. Luật điều khiển thu đƣợc từ bài toán quy hoạch toàn
phƣơng (2.14) là luật phản hồi trạng thái affine từng phần.
Tính khả vi đệ quy của bài toán tối ƣu và sự ổn định có thể đƣợc đảm bảo
bằng việc thêm vào hàm giá trị điểm cuối trong hàm mục tiêu (2.3) và bao gồm
trạng thái cuối trong tập các giá trị trạng thái cuối bất biến. Xét ma trận P
Rnxn là
nghiệm duy nhất của phƣơng trình đại số Riccati sau:
P = AT PA - AT PB (BT PB+R)-1 BT PA + Q
Ma trận K
(2.15)
Rmxn đƣợc xác định
K = - (BT PB+R)-1 BT PA
(2.16)
Khi bài toán không có ràng buộc, tầm dự báo bằng vô cùng, hàm mục tiêu có
14
Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số
dạng:
*∑
V(x(0))
+=∑
*
(
)
= x 0 P x0
Xét hàm mục tiêu của bài toán MPC có dạng
(
)=
+∑
P
Q
+
R
(2.17)
Với các ràng buộc:
k = 1,…, Nc,
,
,
k = 1,…, Nc,
+B
k≥0
=
=A
=C
,
=K
trong đó U
,
{ ut, …,
k≥0
Nu k Ny,
}, Q = Q’ ≥ 0; R= R’≥ 0; P≥0. Nu, Ny, Nc là phạm
vi đầu vào, phạm vi đầu ra và phạm vi điều kiện ràng buộc sao cho Ny ≥ Nu và Nc ≤
Ny −1; K là ma trận phản hồi trạng thái. Đa số các ứng dụng MPC trong công
nghiệp sử dụng các mô hình thực nghiệm tuyến tính, vì vậy hầu hết các sản phẩm
MPC và các thuật toán tối ƣu đều dựa trên loại mô hình này.
Giải bài toán (2.1), tiến hành lặp ở mỗi thời điểm t đối với giá trị đo đƣợc
hiện thời
ở các bƣớc thời gian t + 1,
và biến trạng thái dự báo
…, t + k và thu đƣợc các tín hiệu điều khiển tối ƣu tƣơng ứng U* ={
}. Đầu vào dự báo đầu tiên đƣợc đƣa vào hệ thống cụ thể là ut =
tự, lặp lại với các bƣớc ở thời điểm t + 1 dựa trên trạng thái mới
, …,
. Tƣơng
. Việc điều
khiển ma trận hàm mục tiêu P và hệ số phản hồi trạng thái K thƣờng đƣợc sử dụng
để đảm bảo ổn định vòng kín của hệ thống (2.1). Giải pháp đại số của hệ thống phụ
thuộc vào việc tìm kiếm các giá trị của ma trận P và Q. Một phƣơng án đƣợc đề
xuất là chọn K = 0 và P thu đƣợc từ phƣơng trình Lyapunov:
P = A’ PA + Q
(2.18)
Tuy nhiên giải pháp này chỉ áp dụng đƣợc cho các hệ ổn định vòng hở, tác
15
Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số
động điều khiển dừng sau Nu bƣớc. Một giải pháp khác là chọn K và P theo giải
pháp bộ điều khiển LQR.
Giả sử bài toán không ràng buộc, tầm vô hạn, nghĩa là Nu = Ny = Nc = ∞, hệ
số phản hồi trạng thái K bằng việc giải phƣơng trình Ricatti nhƣ trong (2.15) và
(2.16). Giải phƣơng trình Lyapunov và các phƣơng trình Ricatti là phƣơng pháp phổ
biến nhất để xác định K và P.
Hàm mục tiêu (2.17) có thể viết dƣới dạng
( )=
{
( )3
(2.19)
GU W + E
Điều kiện
U
2
}’ Rs, s
, …,
(2.20)
mNu là véc tơ biến tối ƣu; H = H’ > 0.
Vậy bài toán QP-MPC (2.19) lặp lại tại mỗi khoảng thời gian t
trị hiện tại của biến
. Tác động điều khiển
cho giá
đƣợc tính
= [ I 0 … 0 ] u*( )
(2.21)
Bài toán QP là giải đƣợc nhƣng việc tính toán đầu vào
trực tuyến phụ
thuộc rất nhiều vào tốc độ tính toán
2.2 Bài toán quy hoạch toàn phƣơng đa tham số (Mp-QP)
Chúng ta cần một thuật toán để thu đƣợc U*(x) và hàm mục tiêu V(x) =
J(U*(x)) là một hàm tƣờng minh của tham số x. Đặc biệt U*(x) là một hàm affine
từng phần, liên tục theo x. Từ tài liệu [2] trang 7-11 ta có
Định nghĩa 1: Một hàm ( )
, với
là một tập đa diện, affine từng
phần nếu có thể chia X ra thành các vùng đa diện lồi CRi và
( )
Hàm toàn phƣơng từng phần đƣợc định nghĩa tƣơng tự với ( )
2.2.1 Cơ sở của thuật toán
Chuyển từ bài toán quy hoạch toàn phƣơng sang bài toán quy hoạch nhiều
tham số toàn phƣơng bằng phƣơng pháp biến đổi tuyến tính
Z
(2.22)
16
Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số
U
(2.23)
thay vào (2.19) thu đƣợc hàm mục tiêu dƣới dạng
(
)=
Điều kiện Gz
(2.24)
W+S
là vectơ biến tối ƣu,
Với
(2.25)
là vectơ biến tham số và
S= E+G
(2.26)
Ta thấy trong (2.19) và (2.20) vectơ trạng thái
xuất hiện trong cả hàm
mục tiêu và vế phải của ràng buộc nhƣng trong (2.24), (2.15) chỉ còn xuất hiện
trong vế phải của ràng buộc. Ƣu điểm chính của cách viết (2.19) trong (2.24) là biến
z (và vì thế U) thu đƣợc là một hàm affine của x trong toàn bộ không gian khả vi
của x.
Để bắt đầu giải bài toán mp-QP, chọn vectơ x0 bên trong tập đa diện
*
+ là tập các tham số sao cho bài toán khả vi tại x = x0. Một cách chọn x0
là tâm hình cầu lớn nhất trong X sao cho tồn tại z khả vi, xác định từ
(2.27)
Gz - Sx
Nếu
W
0 thì bài toán (2.24) sẽ không khả vi với tất cả
nằm trong tập X.
Mặt khác khi cố định x = x0 và giải bài toán (2.24) sẽ thu đƣợc giá trị z0 tƣơng ứng.
Nghiệm này là duy nhất vì H > 0 và do đó loại một ràng buộc phƣơng trình
̃
̃
̃ ra khỏi các ràng buộc trong (2.25).
Định lý 2.1 Cho H > 0. Xét tổ hợp các ràng buộc phƣơng trình ̃ ̃ ̃ và giả
thiết rằng các hàng của ̃ là độc lập tuyến tính. CR0 là tập tất các vectơ x với chúng
là tổ hợp phƣơng trình ở điều kiện tối ƣu (CR0 là vùng tới hạn). Khi đó biến tối ƣu z
và vectơ nhân tử Lagrange
là hàm affine của x trên CR0.
Chứng minh
Từ điều kiện tối ƣu KKT trong phƣơng pháp Kuhn-Tucker cho mp-QP ta thu
đƣợc
17