Tải bản đầy đủ (.pdf) (66 trang)

Giải bài toán tối ưu trong điều khiển dự báo có điều kiện ràng buộc bằng phương pháp quy hoạch nhiều tham số

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.24 MB, 66 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
====o0o====

NGÔ THỊ THU TÌNH

GIẢI BÀI TOÁN TỐI ƢU TRONG ĐIỀU KHIỂN DỰ BÁO
CÓ ĐIỀU KIỆN RÀNG BUỘC BẰNG PHƢƠNG PHÁP
QUY HOẠCH NHIỀU THAM SỐ

LUẬN VĂN THẠC SỸ KĨ THUẬT
ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA

Hà Nội - 2016


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
====o0o====

NGÔ THỊ THU TÌNH

GIẢI BÀI TOÁN TỐI ƢU TRONG ĐIỀU KHIỂN DỰ BÁO
CÓ ĐIỀU KIỆN RÀNG BUỘC BẰNG PHƢƠNG PHÁP
QUY HOẠCH NHIỀU THAM SỐ
Chuyên ngành: Điều khiển và Tự động hóa

LUẬN VĂN THẠC SỸ KỸ THUẬT
ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA

NGƢỜI HƢỚNG DẪN KHOA HỌC


PGS.TS. HOÀNG MINH SƠN

Hà Nội - 2016


LỜI CAM ĐOAN
Tôi xin cam đoan bản luận văn tốt nghiệp: Giải bài toán tối ƣu trong điều khiển
dự báo có điều kiện ràng buộc bằng phƣơng pháp quy hoạch nhiều tham số do tôi tự
thực hiện dƣới sự hƣớng dẫn của PGS.TS. Hoàng Minh Sơn. Các số liệu và kết quả là
hoàn toàn đúng với thực tế.
Để hoàn thành luận văn này tôi chỉ sử dụng những tài liệu đƣợc ghi trong danh
mục tài liệu tham khảo và không sao chép hay sử dụng bất kỳ tài liệu nào khác. Nếu phát
hiện có sự sao chép tôi xin chịu hoàn toàn trách nhiệm.
Hà Nội, ngày 25 tháng 03 năm 2016
Học viên

Ngô Thị Thu Tình

i


MỤC LỤC
LỜI CAM ĐOAN ........................................................................................................i
MỤC LỤC .................................................................................................................. ii
DANH MỤC HÌNH VẼ .............................................................................................iv
DANH MỤC BẢNG SỐ LIỆU...................................................................................v
DANH MỤC TỪ VIẾT TẮT .....................................................................................vi
MỞ ĐẦU .....................................................................................................................1
Chƣơng 1: TỔNG QUAN VỀ ĐIỀU KHIỂN TỐI ƢU VÀ ĐIỀU KHIỂN DỰ BÁO 3
1.1 Giới thiệu chung về điều khiển dự báo ..............................................................3

1.1.1 Nguyên tắc chung của điều khiển dự báo dựa mô hình ..............................3
1.1.2 Cấu trúc cơ bản của MPC ............................................................................5
1.1.3 Điều kiện ràng buộc ....................................................................................6
1.2 Bài toán tối ƣu....................................................................................................7
1.3 Mối quan hệ giữa bài toán tối ƣu và bài toán điểm yên ngựa ...........................8
1.4 Phƣơng pháp Kuhn-Tucker ...............................................................................9
Chƣơng 2: PHƢƠNG PHÁP QUY HOẠCH NHIỀU THAM SỐ ...........................10
2.1 Bài toán MPC online .......................................................................................11
2.2 Bài toán quy hoạch toàn phƣơng đa tham số (Mp-QP) ...................................16
2.2.1 Cơ sở của thuật toán ..................................................................................16
2.2.2 Tính lồi và tính liên tục .............................................................................19
2.2.3 Thuật toán Off-line cho mp-QP và bộ điều khiển MPC tƣờng minh ........22
2.2.4 Định nghĩa CRrest .......................................................................................23
2.3 Nghiệm phản hồi trạng thái cho bộ điều khiển toàn phƣơng tuyến tính có ràng
buộc ........................................................................................................................25
Chƣơng 3: MULTI-PARAMETRIC TOOLBOX .....................................................27
3.1 Mô hình hệ thống .............................................................................................27
3.1.1 Hệ thống tuyến tính – dừng (LTI) .............................................................27
3.1.2 Hệ thống affine từng phần (PWA) ............................................................28
3.1.3 Nhập mô hình từ các nguồn bên ngoài ......................................................29
3.2 Các ràng buộc ..................................................................................................30
ii


3.3 Thiết kế điều khiển ..........................................................................................31
3.3.1 Tính toán bộ điều khiển .............................................................................31
3.3.2 Trƣờng của đối tƣợng mptctrl ...................................................................32
3.3.3 Một số hàm đƣợc sử dụng cho đối tƣợng mptctrl .....................................33
3.4 Thực thi luật điều khiển ...................................................................................35
3.4.1 Tính toán luật điều khiển tƣờng minh .......................................................35

3.4.2 Thực thi .....................................................................................................36
3.5 Xuất bộ điều khiển dƣới dạng code C .............................................................37
3.6 Biểu diễn tín hiệu và các miền trạng thái dƣới dạng hình ảnh ........................38
3.6.1 Đồ thị của các polyhedral partition ...........................................................38
3.6.2 Biểu diễn quỹ đạo hệ hở và hệ kín ............................................................38
3.6.3 Quan sát hàm PWA, PWQ ........................................................................38
CHƢƠNG 4 CÁC VÍ DỤ VỀ QUY HOẠCH NHIỀU THAM SỐ SỬ DỤNG
TOOLBOX MPT ......................................................................................................40
4.1 Bài toán ............................................................................................................40
4.1.1 Mô tả bài toán ............................................................................................40
4.1.2 Nhiệm vụ ...................................................................................................40
4.1.3 Yêu cầu ......................................................................................................40
4.1.4 Trình bày ...................................................................................................41
4.2 Thực hiện .........................................................................................................42
4.2.1 Công cụ......................................................................................................42
4.2.2 Ví dụ minh họa cụ thể ...............................................................................42
KẾT LUẬN ...............................................................................................................54
TÀI LIỆU THAM KHẢO .........................................................................................55
PHỤ LỤC ..................................................................................................................56

iii


DANH MỤC HÌNH VẼ
Hình 1.1: Điều khiển dự báo trong trƣờng hợp không có trễ......................................4
Hình 1.2: Điều khiển dự báo dựa mô hình trong trƣờng hợp có trễ (d>0) .................5
Hình 1.3: Cấu trúc cơ bản của MPC ...........................................................................6
Hình 2.1 Tối ƣu online ..............................................................................................11
Hình 2.2: Tối ƣu online thông qua quy hoạch nhiều tham số ...................................11
Hình 2.3: Các vùng giới hạn X và CR0 .....................................................................23

Hình 2.4: Lấy ngƣợc dấu của bất phƣơng trình C1 thu đƣợc

..........................24

Hình 2.5: Các miền đƣợc chia trong X ....................................................................25
Hình 4.1: Vùng không gian trạng thái sau khi đƣợc chia .........................................43
Hình 4.2: Vùng không gian trạng thái sau khi đƣợc tối giản ....................................43
Hình 4.3: Đồ thị của tín hiệu điều khiển ...................................................................44
Hình 4.4: Quỹ đạo hệ kín với giá trị trạng thái ban đầu khác nhau ..........................45
Hình 4.5: Quỹ đạo của biến trạng thái ......................................................................45
Hình 4.6: Quỹ đạo tín hiệu điều khiển ......................................................................46
Hình 4.7: Quỹ đạo đầu ra ..........................................................................................46
Hình 4.8: Mô hình xe ô tô đi lên dốc ........................................................................46
Hình 4.9: Các miền đƣợc chia trong không gian trạng thái ......................................51
Hình 4.10: Tín hiệu điều khiển u ..............................................................................51
Hình 4.11: Quỹ đạo của biến trạng thái ....................................................................52
Hình 4.12: Quỹ đạo của đầu ra..................................................................................52
Hình 4.13: Quỹ đạo của biến điều khiển ...................................................................53

iv


DANH MỤC BẢNG SỐ LIỆU
Bảng 2.1: Giới hạn của các vùng

................................................................... 24

Bảng 3.1: Chiều của các ma trận trong mô hình hệ PWA........................................ 28
Bảng 3.2: Các hàm tính toán bộ điều khiển cho các bài toán tối ƣu khác nhau ....... 32
Bảng 3.3: Các trƣờng của đối tƣợng bộ điều khiển MPC ........................................ 32

Bảng 4.1: Thời gian tính toán bộ điều khiển ............................................................ 44

v


DANH MỤC TỪ VIẾT TẮT
MPC

Model Predictive Control

Điều khiển dự báo theo mô hình

MPP

Multi-Parametric Programming

Quy hoạch nhiều tham số

MPT

Multi-Parametric Toolbox

Toolbox đa tham số

LP

Linear Programming

Quy hoạch tuyến tính


QP

Quadratic Programming

Quy hoạch toàn phƣơng

MP-QP

Multi-Parametric Quadratic

Quy hoạch toàn phƣơng nhiều tham

Programming

số

KKT

Karush – Kuhn –Tucker

Điều kiện Karush – Kuhn –Tucker

LTI

Linear Time-Invariant

Hệ tuyến tính dừng

PWA


Piecewise Affine

Hàm affine từng phần

PWQ

Piecewise Quadratic

Toàn phƣơng từng phần

CFTOC

Constrained Finite-Time Optimal

Điều khiển tối ƣu thời gian hữu hạn

Control

có ràng buộc

Constrained Infinite Time Optimal

Điều khiển tối ƣu thời gian vô hạn

Control

có ràng buộc

Constrained Minimum Time


Điều khiển tối ƣu thời gian tối thiểu

Optimal Control

có ràng buộc

CITOC

CMTOC

vi


Mở đầu

MỞ ĐẦU
Điều khiển dự báo theo mô hình là phƣơng pháp điều khiển hiện đại, ra đời
cách đây vài thập niên nhƣng trong những năm gần đây mới phát triển mạnh mẽ và
có nhiều ứng dụng trong công nghiệp. Điều khiển dự báo theo mô hình (MPC) đƣợc
biết tới với khả năng giải quyết các bài toán trong hệ thống đa biến có ràng buộc,
các quá trình có động học phức tạp (tƣơng tác mạnh, có trễ…), có khả năng tự bù
thời gian chết, đƣa ra phƣơng pháp điều khiển vƣợt trƣớc…Ngoài ra nó còn dễ dàng
cài đặt trên nền máy tính điều khiển số.
MPC là giải pháp tối ƣu có ràng buộc online dựa vào lý thuyết tính lùi, sử
dụng một mô hình quá trình rõ để dự báo đáp ứng tƣơng lai của đối tƣợng. Bộ tối
ƣu hóa giải quyết một bài toán tối ƣu, trong mỗi chu kì lấy mẫu của hệ thống điều
khiển thông qua việc tính toán điều chỉnh chuỗi biến điều khiển tƣơng lai, nhằm tối
ƣu hóa hoạt động của đối tƣợng ở mỗi một chu kì. Giá trị đầu tiên của chuỗi tối ƣu
đƣợc đƣa tới điều khiển đối tƣợng, quá trình tính toán này sẽ đƣợc lặp lại trong mỗi
chu kỳ tiếp.

Lợi ích của MPC là rất to lớn, có nhiều tiềm năng, thỏa mãn điều kiện ràng
buộc và tối ƣu hóa nhƣng ứng dụng của nó còn bị hạn chế trong thực tế do yêu cầu
về khả năng tính toán online. Việc lặp lại giải bài toán tối ƣu hóa trong những
khoảng thời gian xác định (mỗi chu kỳ trích mẫu của đối tƣợng) yêu cầu khối lƣợng
tính toán lớn và hiệu quả thực thi của bộ tối ƣu online lại dựa vào việc tính toán
nhanh tác động điều khiển tối ƣu của bộ tính toán online. Vấn đề trên yêu cầu năng
lực thiết bị phần cứng điều khiển và giải thuật tối ƣu phải thích hợp.
Để giải quyết bài toán trên tác giả đã chọn đề tài: “GIẢI BÀI TOÁN TỐI ƢU
TRONG ĐIỀU KHIỂN DỰ BÁO CÓ ĐIỀU KIỆN RÀNG BUỘC BẰNG PHƢƠNG
PHÁP QUY HOẠCH NHIỀU THAM SỐ”. Với hƣớng tiếp cận này, biến điều khiển là

một hàm tƣờng minh của biến trạng thái, bộ tối ƣu online chia ra ƣớc lƣợng các
hàm đơn giản trong khoảng thời gian xác định, tính toán tác động điều khiển tƣơng
ứng cho mỗi vùng trạng thái của đối tƣợng. Phƣơng pháp này đƣợc biết tới là “Tối
ƣu hóa online thông qua tối ƣu tham số offline”. Mục tiêu chính của đề tài: Thực

1


Mở đầu

thi, kiểm chứng, đánh giá đƣợc khả năng áp dụng của phƣơng pháp đƣa bài toán tối
ƣu online trong điều khiển dự báo về bài toán tối ƣu offline để xây dựng luật điều
khiển phản hồi trạng thái
Luận văn đƣợc bố cục thành bốn chƣơng:
Chƣơng 1: Trình bày các kiến thức cơ sở về điều khiển tối ƣu và điều khiển
dự báo liên quan đến đề tài nhƣ : nguyên tắc, cấu trúc chung của MPC, các điều
kiện ràng buộc, bài toán điều khiển tối ƣu, phƣơng pháp Kuhn-Tucker
Chƣơng 2: Nghiên cứu cở sở phƣơng pháp quy hoạch nhiều tham số (MultiParametric Programming)
Chƣơng 3: Trình bày về Toolbox mô phỏng MPT

Chƣơng 4: Xây dựng ví dụ mô phỏng kiểm chứng phƣơng pháp quy hoạch
nhiều tham số trên MATLAB
Qua đây tác giả xin chân thành cảm ơn PGS.TS. Hoàng Minh Sơn đã tận tình
hƣớng dẫn, tạo điều kiện cho tác giả trong toàn bộ quá trình nghiên cứu và hoàn
thiện luận văn. Đồng thời tác giả cũng xin bảy tỏ lòng trân trọng biết ơn tới các thầy
cô giảng viên bộ môn Điều khiển tự động, Viện Điện đã hỗ trợ, giúp đỡ tác giả
trong suốt thời gian qua.
Hà Nội, ngày 22 tháng 3 năm 2016
Học viên

Ngô Thị Thu Tình

2


Chƣơng 1: Tổng quan về điều khiển tối ƣu và điều khiển dự báo

Chƣơng 1: TỔNG QUAN VỀ ĐIỀU KHIỂN TỐI ƢU VÀ
ĐIỀU KHIỂN DỰ BÁO
1.1 Giới thiệu chung về điều khiển dự báo
Điều khiển dự báo tựa mô hình MPC là phƣơng pháp sử dụng mô hình của đối
tƣợng và tối ƣu hóa hàm mục tiêu để đƣa ra một tín hiệu điều khiển tối ƣu. Thập
niên 70 của thế kỷ trƣớc, MPC mới chỉ đƣợc sử dụng đối với các đối tƣợng biến đổi
chậm, vì thủ tục tối ƣu hóa sẽ đƣợc lặp đi lặp lại ở mọi bƣớc ảnh hƣởng tới tốc độ
tính toán và phần cứng điều khiển. Cho tới thập niên 90, khi tốc độ tính toán của
máy tính nhanh hơn thì MPC đƣợc áp dụng với nhiều loại đối tƣợng mà đặc tính
động học nhanh nhƣ máy bay, robot, vệ tinh nhân tạo, máy móc tự động … Nó có
các ƣu điểm nổi trội nhƣ: trực quan, dễ thực hiện, có thể áp dụng trên nhiều loại đối
tƣợng điều khiển nhƣ SISO, MISO, MIMO, điều khiển đối tƣợng có trễ khi đã biết
trƣớc tín hiệu đầu ra mong muốn, đồng thời nó cũng là một hƣớng nghiên cứu mới,

có tính mở cao. Hiện nay đây là phƣơng pháp điều khiển phi tuyến thông dụng nhất
cho các hệ tuyến tính có ràng buộc và đã trở thành chuẩn cho các bài toán điều
khiển đa biến có ràng buộc trong các quá trình công nghiệp.
1.1.1 Nguyên tắc chung của điều khiển dự báo dựa mô hình
Theo tài liệu [10] (trang 3-6), ta có điều khiển dự báo dựa mô hình có nguyên
tắc chung nhƣ sau
1. Dựa trên mô hình quá trình, biểu diễn dãy giá trị đầu ra (biến đƣợc điều
khiển) trong tƣơng lai phụ thuộc dãy giá trị đầu vào (biến điều khiển) và
đầu ra đo đƣợc
2. Xác định hàm mục tiêu dựa trên tác động điều khiển trong tƣơng lai và
sai lệch điều khiển dự báo (tín hiệu chủ đạo trong tƣơng lai có thể biết
trƣớc)
3. Tìm dãy giá trị điều khiển tối ƣu trong tƣơng lai để tối thiểu hóa hàm mục
tiêu, với một số điều kiện ràng buộc
4. Đƣa ra tác động điều khiển sử dụng giá trị đầu tiên trong dãy tìm đƣợc
5. Trong chu kỳ điều khiển tiếp theo: Đo giá trị đầu ra và lặp lại quy trình từ
bƣớc 3.

3


Chƣơng 1: Tổng quan về điều khiển tối ƣu và điều khiển dự báo

r, y, u

Tầm dự báo Ny
𝑦̂(t+2|t)

r


y(t-2)

𝑦̂(t+Ny)

𝑦̂(t+1|t)

y(t)

y(t-1)

Tầm điều khiển Nu

u(t)
u(t+2)

u(t+1)

u(t-2)

u(t+Nu)

u(t-1)
t-2

t-1

t+1

t


t+2

t+Ny

t+Nu

Hình 1.1: Điều khiển dự báo trong trƣờng hợp không có trễ
Trong nguyên tắc điều khiển dự báo hình 1.1 có phiếm hàm mục tiêu dạng
J(t,u) = ∑

( ), (

)

)- + ∑

̂(

Số gia điều khiển
( )

( )

(

)

Nu là tầm điều khiển và Ny là tầm dự báo

4


( ),

(

)-


Chƣơng 1: Tổng quan về điều khiển tối ƣu và điều khiển dự báo

r, y, u

Tầm dự báo Ny

r

y(t-2)

𝑦̂(t+Ny)
𝑦̂(t+d|t)

y(t)

y(t-1)

Tầm điều khiển Nu

u(t)
u(t+1)


u(t-2)

u(t+Nu)

u(t-1)
t-2

t-1

t

t+1

t+2

t+Ny

t+Nu

Hình 1.2: Điều khiển dự báo dựa mô hình trong trƣờng hợp có trễ (d>0)
Trong trƣờng hợp có trễ, hàm mục tiêu có dạng
J(t,u) = ∑

( ), (

)

̂(

)- + ∑


( ),

(

)- .

1.1.2 Cấu trúc cơ bản của MPC
Cấu trúc cơ bản của MPC đƣợc mô tả nhƣ hình 1.3 trong đó đầu vào của mô
hình dự báo là các dữ liệu trong quá khứ và tƣơng lai sau đó thu đƣợc đầu ra dự
báo. MPC dựa vào các bộ dữ liệu vào – ra trong quá khứ và dự báo trong tƣơng lai,
căn cứ vào giá trị hàm mục tiêu thỏa mãn bộ điều kiện ràng buộc của bài toán điều
khiển, tiến hành bài toán tối ƣu, từ đó tính toán tín hiệu điều khiển đầu ra sao cho
sai lệch điều khiển đạt cực tiểu, tức là khi đó tín hiệu ra dự báo có thể bám theo
đƣợc tín hiệu đầu ra mong muốn.

5


Chƣơng 1: Tổng quan về điều khiển tối ƣu và điều khiển dự báo

Đầu vào và đầu ra quá khứ
(Past Input and Outputs)
Mô hình
(Model)

Đầu ra dự báo
(Predicted Outputs)

Quỹ đạo đặt

(Reference
Trafectory )

(-)
Đầu vào tƣơng lai
(Future Inputs)
Bộ tối ƣu
(Optimizer)

Hàm mục tiêu
(Cost Function)

Sai lệch dự báo
(Future Error)

Điều kiện ràng
buộc

Hình 1.3: Cấu trúc cơ bản của MPC
1.1.3 Điều kiện ràng buộc
Vấn đề ràng buộc là yếu tố quan trọng, đặc biệt trong những bộ điều khiển
công nghiệp. Khi điều khiển hệ thống phải luôn đảm bảo tín hiệu điều khiển, trạng
thái hệ thống không vi phạm các giới hạn cho phép, tức là luôn phải nằm trong vùng
an toàn. Ví dụ khi điều khiển các thông số nhiệt độ, áp suất, mực chất lỏng phải
luôn có giới hạn cực tiểu, giới hạn về lƣu lƣợng nƣớc chảy trong ống dẫn, độ mở
của van…
Một hệ thống điều khiển sau khi đƣợc thiết kế, nếu hiệu chỉnh tốt thì các tín
hiệu sẽ luôn giữ đƣợc khoảng cách an toàn đối với các điều kiện ràng buộc. Trong
cùng loại hệ thống điều khiển, hệ thống nào giữ đƣợc khoảng cách này tốt thì giá sẽ
càng cao. Tuy nhiên, vì lý do kinh tế nên các hệ thống công nghiệp có khuynh

hƣớng các tín hiệu sẽ bám theo điều kiện ràng buộc để giảm bớt công sức điều
chỉnh và giá thành.
Trong điều khiển dự báo, kỹ thuật tối ƣu hóa đƣợc sử dụng để đảm bảo các
ràng buộc không bị vi phạm. Đối với hệ tuyến tính, các phƣơng pháp tối ƣu hóa LP

6


Chƣơng 1: Tổng quan về điều khiển tối ƣu và điều khiển dự báo

(Linear Programming), QP (Quadratic Programming) thƣờng đƣợc sử dụng. Trong
các hệ thống phi tuyến các phƣơng pháp phân nhánh giới hạn (Branch and Bound),
phƣơng pháp Newton, phƣơng pháp Lenvenberg-Marquardt…thƣờng đƣợc sử
dụng.
Trong hầu hết các trƣờng hợp, ràng buộc thƣờng đƣợc thể hiện bởi các giới
hạn trên tín hiệu điều khiển, trạng thái và tín hiệu ra của hệ thống
umin

( )

umax

hoặc

umin

( )

umax


ymin

( )

ymax

hoặc

ymin

( )

ymax

Ràng buộc nhƣ trên gọi là ràng buộc bất đẳng thức. Bên cạnh đó còn có ràng
buộc phƣơng trình giúp cho bộ điều khiển tự cải thiện chất lƣợng điều khiển
+ Ràng buộc bất đẳng thức
̃ (k)

̃ (k)

̃ (k) không phụ thuộc vào tƣơng lai của hệ thống, ̃ (k) là một vectơ.
Trƣờng hợp điều kiện ràng buộc giới hạn bởi hai giá trị cận trên và cận dƣới
nhƣ sau:
̃ *min

̃ *(k)

̃ *max


Ta có thể đƣa về dạng tổng quát sau:
̃ (k)

[

̃ ( )
]
̃ ( )

[

̃
̃

]

̃ (k)

+ Ràng buộc phƣơng trình
̃ (k) = 0, ̃ (k) là một vectơ.
Phƣơng pháp điều khiển dự báo giải quyết tốt bài toán điều khiển có ràng
buộc, và đây cũng chính là lý do mà phƣơng pháp điều khiển này đƣợc sử dụng
ngày càng phổ biến
1.2 Bài toán tối ƣu
Điều khiển dự báo có nguồn gốc từ điều khiển tối ƣu và giải bài toán tối ƣu là
phần quan trọng của điều khiển dự báo. Các bài toán tối ƣu hay gặp trong thực tế đó
là:
-

Bài toán điều khiển tối ƣu tĩnh: là bài toán chọn các tham số điều khiển trong


7


Chƣơng 1: Tổng quan về điều khiển tối ƣu và điều khiển dự báo

số các tham số thích hợp sao cho hệ thống đạt đƣợc chất lƣợng một cách tốt
nhất.
-

Bài toán tối ƣu động: nhiệm vụ trọng tâm là tìm tín hiệu điều khiển tối ƣu
(t) để chất lƣợng quá trình chuyển đổi trạng thái từ điểm đầu đến điểm cuối
là tốt nhất.

1.3 Mối quan hệ giữa bài toán tối ƣu và bài toán điểm yên ngựa
Từ tài liệu [9] trang 31- 34, ta có
Xét bài toán tối ƣu
*

= argmin Q( )

P={
Trong đó m

(1.1a)
+

| gi ( )

(1.1b)


n. Từ bài toán tối ƣu trên ta lập một hàm chung
( )

f(p,λ) = Q( ) +

T

( ) với ( ) =
(

Định nghĩa 1: Điểm ( *,
điểm cực tiểu của f ( ,
f ( *, )

f ( *,

*

)

( ))

(

) đƣợc gọi là điểm yên ngựa của hàm (1.2) nếu
*

(1.2)


)

*

) và

*

và λi

,

*



là điểm cực đại của f ( *, ). Nói cách khác:
*

f( ,

)

(1.3)

Định lý 1: Xét bài toán tối ƣu (1.1) và hàm (1.2).
a. (Điều kiện đủ): Nếu ( *,
thì

*


*

) là điểm yên ngựa của hàm f ( , ) tính theo (1.2)

là nghiệm tối ƣu của bài toán (1.1).

b. (Điều kiện cần và đủ): Giả sử Q( ), gi ( )

là các hàm lồi, tức

là bài toán (1.1) là bài toán tối ƣu lồi, và tập P có ít nhất một điểm trong, tức
là tồn tại ít nhất một điểm
( *,

để có gi ( )

*

) là điểm yên ngựa của hàm f ( , ) khi và chỉ khi

của bài toán tối ƣu lồi (1.1).

8

. Khi đó điểm
*

là nghiệm tối ƣu



Chƣơng 1: Tổng quan về điều khiển tối ƣu và điều khiển dự báo

1.4 Phƣơng pháp Kuhn-Tucker
Định lý 1 cho thấy việc xác định nghiệm

*

thay bằng việc xác định điểm yên ngựa ( *,

*

của bài toán tối ƣu (1.1) có thể đƣợc
) của hàm (1.2). Ƣu điểm chính của

cách giải này là ta đã chuyển hoàn toàn bài toán tối ƣu thành bài toán giải hệ các bất
phƣơng trình và phƣơng trình.
Công cụ hỗ trợ việc xác định điểm yên ngựa ( *,

*

) của hàm (1.2) là định lý

Kuhn-Tucker:
Định lý 2: Cho bài toán tối ƣu (1.1) có Q( ), gi ( )

là các hàm

khả vi. Lập hàm f ( , ) theo (1.2). Khi đó:
a) (Điều kiện cần): Nếu ( *,


*

) là điểm yên ngựa của f ( , ) thì nó sẽ thỏa mãn

hệ n hệ các bất phƣơng trình và phƣơng trình:
.

/

.

/
.

{( )

/

Trong đó

.

/

(

)

.


/

(

)

b) (Điều kiện cần và đủ): Nếu (1.1) còn là bài toán tối ƣu lồi và tập P có ít nhất
một điểm trong thì phát biểu a) sẽ là điều kiện cần và đủ.

9


Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số

Chƣơng 2: PHƢƠNG PHÁP QUY HOẠCH NHIỀU THAM SỐ
Hệ thống tuyến tính với đầu vào, đầu ra hoặc ràng buộc trạng thái là lớp hệ
thống quan trọng trong thực tiễn và nghiên cứu. Có rất nhiều phƣơng pháp điều
khiển khác nhau đƣợc thiết kế cho hệ tuyến tính đã thu đƣợc chất lƣợng tốt và độ ổn
định cao, đặc biệt trong điều kiện có ràng buộc đƣợc đảm bảo với luật điều khiển
phi tuyến. Phƣơng pháp điều khiển phi tuyến thông dụng nhất cho các hệ tuyến tính
có ràng buộc là điều khiển dự báo dựa mô hình (MPC) và hiện nay đã trở thành
chuẩn cho các bài toán điều khiển đa biến có ràng buộc trong các quá trình công
nghiệp. Nhƣng hạn chế của phƣơng pháp này là khối lƣợng tính toán online lớn làm
ảnh hƣởng tới thời gian đƣa ra tác động điều khiển nhất là khi tầm dự báo tăng lên.
Một kỹ thuật đƣợc đƣa ra để giải quyết vấn đề trên là quy hoạch nhiều tham số
(Multi-Parametric Program).
MPP là kỹ thuật để giải quyết bài toán tối ƣu hóa với hàm mục tiêu đƣợc tối
đa hoặc tối thiểu một chỉ tiêu chất lƣợng nào đó với giới hạn cho trƣớc và một số
tham số khác nhau thay đổi giữa cận trên và cận dƣới. Tƣ tƣởng của phƣơng pháp

này sẽ là chia miền trạng thái thành các miền lồi, mỗi miền này tƣơng ứng sẽ cho
cùng một dạng biến điều khiển u = f(x). Việc tính toán tối ƣu đƣợc thực hiện offline
tạo thành một bảng các giá trị có sẵn. Do đó công việc tính toán online rất dễ dàng.
Bản chất bài toán đã đƣợc chuyển từ tối ƣu online về offline. Đặc trƣng của phƣơng
pháp quy hoạch nhiều tham số là khả năng thu đƣợc:
(i)

Hàm mục tiêu và tín hiệu điều khiển tối ƣu là hàm tƣờng minh của
biến trạng thái

(ii)

Các vùng trong không gian của tham số nơi mà các hàm này có giá trị

Hình 2.1 và 2.2 dƣới đây mô tả cấu trúc chung của hệ thống sử dụng phƣơng pháp
tối ƣu online và phƣơng pháp quy hoạch nhiều tham số

10


Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số

BỘ TỐI ƢU
Tác động
điều khiển

Biến trạng
thái

Nhiễu

đầu vào

Đầu ra
quá trình

ĐỐI TƢỢNG
Hình 2.1 Tối ƣu online

Parametric Profile
Biến điều khiển

Biến trạng thái

Biến
trạng thái

Tác động
điều khiển

Đầu ra
quá trình

Nhiễu
đầu vào

ĐỐI TƢỢNG

Ƣớc lƣợng hàm online

Quy hoạch

nhiều tham
số (offline)

Bộ quy hoạch
đa tham số

Hình 2.2: Tối ƣu online thông qua quy hoạch nhiều tham số
2.1 Bài toán MPC online
Theo tài liệu [8] từ trang 45 - 51
Xét bài toán điều khiển về gốc tọa độ hệ tuyến tính dừng sau:
(2.1)
với ( )
ra; các ma trận

( )

; tƣơng ứng là biến trạng thái và biến đầu vào, biến đầu
. Cả x(k) và u(k) đƣợc giới hạn bởi:

11


Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số

( )
( )

{

*

*

+
+

, và vectơ

Giả thiết ma trận

(2.2)

là hằng số với

.

Bài toán có hàm mục tiêu sau:
( ( ))

,

-

*∑

+



(2.3)


{
( )
Với



tƣơng ứng là trạng thái và đầu vào dự báo,


 R

Rm×m and R > 0.

 N ≥ 1 là tầm dự báo.
Điều kiện của Q và R đảm bảo hàm mục tiêu là lồi. Tất cả các trị riêng của Q
đều không âm và tất cả các trị riêng của R phải dƣơng để đảm bảo nghiệm tối ƣu là
duy nhất. Rõ ràng thành phần
trong khi thành phần

thể hiện độ sai lệch trạng thái x so với gốc

biểu thị năng lƣợng sử dụng cho tín hiệu điều khiển ở

đầu vào. Việc lựa chọn Q lớn có nghĩa trạng thái

phải gần gốc nhất có thể. Mặt

khác việc lựa chọn R lớn có nghĩa tín hiệu điều khiển

phải nhỏ để đảm bảo hàm


mục tiêu có giá trị nhỏ.
Một phƣơng án khác ta có thể xem xét chất lƣợng dựa vào chuẩn bậc 1: l1-norm
,

-

*∑

+



(2.4)

Hoặc chuẩn vô cùng
,

-

*∑



+
(2.5)

Từ mô hình (2.1) ta có thể biểu diễn giá trị của biến trạng thái đƣợc dự báo nhƣ sau:
{


(2.6)

12


Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số

Ta có thể viết gọn lại (2.6) nhƣ sau:
( )
,

Với

[

]

(2.7)
,

,

-

[

,

]


Hàm mục tiêu của bài toán tối ƣu (2.3) có thể viết lại dƣới dạng
( ( ))

*

+

(2.8)

Với
[

]

[

,

]

Thay (2.7) vào (2.8) thu đƣợc
( ( ))

*

Với

+

( )

,

( )

( )+

(2.9)

,

(2.10)

Xét ràng buộc (2.2) ta thấy ràng buộc trạng thái và đầu vào dự báo nhƣ sau:
{

(2.11)

Với
[

],

[

] ,

[

] ,


[

]

Từ (2.7) ràng buộc trạng thái có thể đƣợc viết dạng
*

( )

+

Hay tƣơng đƣơng
( )

(2.12)

Kết hợp giữa (2.11) và (2.12) ta đƣợc
( )

(2.13)

Với

13


Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số

[


] ,

[

]

[

,

]

Từ (2.7) và (2.13) bài toán MPC có thể viết lại dạng
( ( ))

*

( )

+

(2.14)

Điều kiện
( )
Thành phần

( )

( ) đƣợc bỏ qua do không ảnh hƣởng tới điều kiện tối


ƣu. Hàm mục tiêu ban đầu đƣợc biểu diễn
( ( ))

( ( ))

( )

( )

Luật điều khiển thu đƣợc sau khi giải bải toán tối ƣu online (2.14) đƣợc gọi
là luật điều khiển dự báo nội suy.
Tính khả vi đệ quy của bài toán tối ƣu và sự ổn định của hệ kín là hai vấn đề
quan trọng khi thiết kế bộ điều khiển MPC. Tính khả thi đệ quy của bài toán quy
hoạch toàn phƣơng (2.14) có nghĩa là nếu (2.14) khả vi tại thời điểm k, nó cũng sẽ
khả vi tại thời điểm k+1. Nói cách khác tồn tại tín hiệu điều khiển giữ cho hệ thống
nằm trong phạm vi ràng buộc cho phép. Bài toán về tính khả vi có thể bị ảnh hƣởng
bởi sai lệch mô hình, các nhiễu hoặc sự lựa chọn hàm mục tiêu. Còn việc phân tích
tính ổn định cần sử dụng lý thuyết Lyapunov do sự có mặt của các ràng buộc làm hệ
thống kín là phi tuyến. Thêm vào đó hệ thống ràng buộc đầu vào không ổn định thì
không thể ổn định toàn cục. Luật điều khiển thu đƣợc từ bài toán quy hoạch toàn
phƣơng (2.14) là luật phản hồi trạng thái affine từng phần.
Tính khả vi đệ quy của bài toán tối ƣu và sự ổn định có thể đƣợc đảm bảo
bằng việc thêm vào hàm giá trị điểm cuối trong hàm mục tiêu (2.3) và bao gồm
trạng thái cuối trong tập các giá trị trạng thái cuối bất biến. Xét ma trận P

Rnxn là

nghiệm duy nhất của phƣơng trình đại số Riccati sau:
P = AT PA - AT PB (BT PB+R)-1 BT PA + Q

Ma trận K

(2.15)

Rmxn đƣợc xác định

K = - (BT PB+R)-1 BT PA

(2.16)

Khi bài toán không có ràng buộc, tầm dự báo bằng vô cùng, hàm mục tiêu có

14


Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số

dạng:
*∑

V(x(0))

+=∑

*

(

)


= x 0 P x0

Xét hàm mục tiêu của bài toán MPC có dạng
(

)=

+∑

P

Q

+

R

(2.17)

Với các ràng buộc:






k = 1,…, Nc,

,




,

k = 1,…, Nc,

+B

k≥0

=
=A
=C

,

=K
trong đó U

,

{ ut, …,

k≥0
Nu  k  Ny,
}, Q = Q’ ≥ 0; R= R’≥ 0; P≥0. Nu, Ny, Nc là phạm

vi đầu vào, phạm vi đầu ra và phạm vi điều kiện ràng buộc sao cho Ny ≥ Nu và Nc ≤
Ny −1; K là ma trận phản hồi trạng thái. Đa số các ứng dụng MPC trong công
nghiệp sử dụng các mô hình thực nghiệm tuyến tính, vì vậy hầu hết các sản phẩm

MPC và các thuật toán tối ƣu đều dựa trên loại mô hình này.
Giải bài toán (2.1), tiến hành lặp ở mỗi thời điểm t đối với giá trị đo đƣợc
hiện thời

ở các bƣớc thời gian t + 1,

và biến trạng thái dự báo

…, t + k và thu đƣợc các tín hiệu điều khiển tối ƣu tƣơng ứng U* ={
}. Đầu vào dự báo đầu tiên đƣợc đƣa vào hệ thống cụ thể là ut =
tự, lặp lại với các bƣớc ở thời điểm t + 1 dựa trên trạng thái mới

, …,
. Tƣơng

. Việc điều

khiển ma trận hàm mục tiêu P và hệ số phản hồi trạng thái K thƣờng đƣợc sử dụng
để đảm bảo ổn định vòng kín của hệ thống (2.1). Giải pháp đại số của hệ thống phụ
thuộc vào việc tìm kiếm các giá trị của ma trận P và Q. Một phƣơng án đƣợc đề
xuất là chọn K = 0 và P thu đƣợc từ phƣơng trình Lyapunov:
P = A’ PA + Q

(2.18)

Tuy nhiên giải pháp này chỉ áp dụng đƣợc cho các hệ ổn định vòng hở, tác

15



Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số

động điều khiển dừng sau Nu bƣớc. Một giải pháp khác là chọn K và P theo giải
pháp bộ điều khiển LQR.
Giả sử bài toán không ràng buộc, tầm vô hạn, nghĩa là Nu = Ny = Nc = ∞, hệ
số phản hồi trạng thái K bằng việc giải phƣơng trình Ricatti nhƣ trong (2.15) và
(2.16). Giải phƣơng trình Lyapunov và các phƣơng trình Ricatti là phƣơng pháp phổ
biến nhất để xác định K và P.
Hàm mục tiêu (2.17) có thể viết dƣới dạng
( )=

{

( )3

(2.19)

GU  W + E

Điều kiện
U

2

}’  Rs, s

, …,

(2.20)
mNu là véc tơ biến tối ƣu; H = H’ > 0.


Vậy bài toán QP-MPC (2.19) lặp lại tại mỗi khoảng thời gian t
trị hiện tại của biến

. Tác động điều khiển

cho giá

đƣợc tính

= [ I 0 … 0 ] u*( )

(2.21)

Bài toán QP là giải đƣợc nhƣng việc tính toán đầu vào

trực tuyến phụ

thuộc rất nhiều vào tốc độ tính toán
2.2 Bài toán quy hoạch toàn phƣơng đa tham số (Mp-QP)
Chúng ta cần một thuật toán để thu đƣợc U*(x) và hàm mục tiêu V(x) =
J(U*(x)) là một hàm tƣờng minh của tham số x. Đặc biệt U*(x) là một hàm affine
từng phần, liên tục theo x. Từ tài liệu [2] trang 7-11 ta có
Định nghĩa 1: Một hàm ( )

, với

là một tập đa diện, affine từng

phần nếu có thể chia X ra thành các vùng đa diện lồi CRi và


( )

Hàm toàn phƣơng từng phần đƣợc định nghĩa tƣơng tự với ( )
2.2.1 Cơ sở của thuật toán
Chuyển từ bài toán quy hoạch toàn phƣơng sang bài toán quy hoạch nhiều
tham số toàn phƣơng bằng phƣơng pháp biến đổi tuyến tính
Z

(2.22)

16


Chƣơng 2: Phƣơng pháp quy hoạch nhiều tham số

U

(2.23)

thay vào (2.19) thu đƣợc hàm mục tiêu dƣới dạng
(

)=

Điều kiện Gz

(2.24)
W+S


là vectơ biến tối ƣu,

Với

(2.25)
là vectơ biến tham số và

S= E+G

(2.26)

Ta thấy trong (2.19) và (2.20) vectơ trạng thái

xuất hiện trong cả hàm

mục tiêu và vế phải của ràng buộc nhƣng trong (2.24), (2.15) chỉ còn xuất hiện
trong vế phải của ràng buộc. Ƣu điểm chính của cách viết (2.19) trong (2.24) là biến
z (và vì thế U) thu đƣợc là một hàm affine của x trong toàn bộ không gian khả vi
của x.
Để bắt đầu giải bài toán mp-QP, chọn vectơ x0 bên trong tập đa diện
*

+ là tập các tham số sao cho bài toán khả vi tại x = x0. Một cách chọn x0

là tâm hình cầu lớn nhất trong X sao cho tồn tại z khả vi, xác định từ

(2.27)
Gz - Sx
Nếu


W
0 thì bài toán (2.24) sẽ không khả vi với tất cả

nằm trong tập X.

Mặt khác khi cố định x = x0 và giải bài toán (2.24) sẽ thu đƣợc giá trị z0 tƣơng ứng.
Nghiệm này là duy nhất vì H > 0 và do đó loại một ràng buộc phƣơng trình
̃

̃

̃ ra khỏi các ràng buộc trong (2.25).

Định lý 2.1 Cho H > 0. Xét tổ hợp các ràng buộc phƣơng trình ̃ ̃ ̃ và giả
thiết rằng các hàng của ̃ là độc lập tuyến tính. CR0 là tập tất các vectơ x với chúng
là tổ hợp phƣơng trình ở điều kiện tối ƣu (CR0 là vùng tới hạn). Khi đó biến tối ƣu z
và vectơ nhân tử Lagrange

là hàm affine của x trên CR0.

Chứng minh
Từ điều kiện tối ƣu KKT trong phƣơng pháp Kuhn-Tucker cho mp-QP ta thu
đƣợc

17


×