Tải bản đầy đủ (.pdf) (74 trang)

nghiên cứu giải thuật di truyền để tối ưu hóa tham số bộ điều khiển lqr trong điều khiển hệ chuyển động

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (819.19 KB, 74 trang )

Số hóa bởi Trung tâm Học liệu – ĐHTN











ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP
o0o




LUẬN VĂN THẠC SỸ KỸ THUẬT
NGÀNH: TỰ ĐỘNG HÓA



NGHIÊN CỨU GIẢI THUẬT DI TRUYỀN ĐỂ TỐI ƢU HOÁ
THAM SỐ BỘ ĐIỀU KHIỂN LQR TRONG ĐIỀU KHIỂN HỆ
CHUYỂN ĐỘNG



KHƢƠNG TRỌNG NGHĨA









THÁI NGUYÊN 2011
Số hóa bởi Trung tâm Học liệu – ĐHTN
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP





LUẬN VĂN THẠC SỸ KỸ THUẬT
NGÀNH: TỰ ĐỘNG HÓA


NGHIÊN CỨU GIẢI THUẬT DI TRUYỀN ĐỂ TỐI ƢU
HOÁTHAM SỐ BỘ ĐIỀU KHIỂN LQR TRONG ĐIỀU KHIỂN
HỆ CHUYỂN ĐỘNG




Học viên : Khƣơn Trọng Nghĩa
Ngƣời HD Khoa Học: TS Đỗ Trung Hải








THÁI NGUYÊN 2011
Số hóa bởi Trung tâm Học liệu – ĐHTN
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP
***
CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc Lập - Tƣ Do - Hạnh Phúc
o0o

THUYẾT MINH
LUẬN VĂN THẠC SỸ KỸ THUẬT

ĐỀ TÀI: NGHIÊN CỨU GIẢI THUẬT DI TRUYỀN ĐỂ TỐI ƢU
HOÁ THAM SỐ BỘ ĐIỀU KHIỂN LQR TRONG ĐIỀU KHIỂN
HỆ CHUYỂN ĐỘNG

Học viên
: Khƣơng Trọng Nghĩa
Lớp
: CH-K12
Chuyên ngành
: Tự động hoá
Ngƣời hƣớng dẫn
: TS Đỗ Trung Hải

Ngày giao đề tài
: 2/2011
Ngày hoàn thành đề tài
: 8/2011

KHOA ĐT SAU ĐẠI HỌC
NGƢỜI HƢỚNG DẪN


TS Đõ Trung Hải
BAN GIÁM HIỆU
HỌC VIÊN


Khƣơng Trọng Nghĩa
Số hóa bởi Trung tâm Học liệu – ĐHTN
LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu,
kết quả trong luận văn là hoàn toàn trung thực theo tài liệu tham khảo và chƣa
từng đƣợc ai công bố trong bất kỳ công trình nào khác.

Thái Nguyên, ngày 30 tháng 9 năm 2011
Tác giả luận văn


Khƣơng Trọng Nghĩa





Số hóa bởi Trung tâm Học liệu – ĐHTN
LỜI CẢM ƠN

Trong quá trình làm luận văn, tôi đã nhận đƣợc nhiều ý kiến đóng góp từ các
thầy, cô giáo, các anh chị và các bạn đồng nghiệp.
Tôi xin bày tỏ lòng biết ơn đến TS Đỗ Trung Hải, Ngƣời đã tận tình
hƣớng dẫn tôi hoàn thành luận văn này, đến Khoa Sau Đại học - Trƣờng Đại
học Kỹ thuật công nghiệp đã tạo điều kiện để tôi hoàn thành khóa học.
Tôi xin chân thành cảm ơn Trƣờng Đại học Kỹ thuật Công nghiệp,
Phòng Hành chính Tài vụ, Trung tâm thí nghiệm đã tạo những điều kiện để
tôi hoàn thành khóa học.
Tôi xin chân thành cảm ơn các thầy hiệu trƣởng, ban giám hiệu, cùng
với các đồng nghiệp nhà trƣờng TCN Hermann Gmainer Việt Trì, cùng với
gia đình, các bạn bè, đã giúp đỡ và tạo những điều kiện thuận lợi nhất về mọi
mặt để tôi hoàn thành khóa học.

Tác giả luận văn


Khương Trọng Nghĩa








Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

Số hóa bởi Trung tâm Học liệu – ĐHTN

1
MỤC LỤC
Mục lục …………………………………………………….…………………………….
1
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TĂT……………………….
4
DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ……………………………………
4
MỞ ĐẦU………………………………………………………………………………
5
1. Tính cấp thiết của đề tài………………………………………………………….
5
2. Mục đích nghiên cứu……………………………………………………………
5
3. Đối tƣợng và phƣơng pháp nghiên cứu……………………………………
5
4. Ý nghĩa khoa học và thực tiễn của đề tài…………………………………….
6
5. Kết cấu luận văn……………………………………………………………………
6
CHƢƠNG 1 TỔNG QUAN VỀ ĐIỀU KHIỂN TỐI ƢU, ĐIỀU
KHIỂN LQR……………………………………………………………………………
7
1.1 CHẤT LƢỢNG TỐI ƢU …………………………………………………….
7
1.1.1 Đặc điểm của bài toán tối ƣu ………………………………………
7
1.1.1.1. Khái niệm ………………………………………………………………

7
1.1.1.2. Điều kiện thành lập bài toán tối ƣu ……………………………
9
1.1.1.3. Tối ƣu hoá tĩnh và động……………………………………………
9
1.1.2.Xây dụng bài toán tối ƣu………………………………………………
10
1.1.2.1. Tối ƣu hóa không có điều kiện ràng buộc………………………
10
1.1.2.2. Tối ƣu hóa với các điều kiện ràng buộc…………………………
11
1.2 CÁC PHƢƠNG PHÁP ĐIỀU KHIỂN TỐI ƢU……………………….
16
1.2.1. Phƣơng pháp biến phân cổ điển Euler_Lagrange…………………
16
1.2.1.1. Giới thiệu ………………………………………………………………
16
1.2.2. Phƣơng pháp quy hoạch động Bellman……………………………….
21
1.2.2.1. Giới thiệu…………………………………………………………………
21
1.2.2.2. Hệ rời rạc…………………………………………………………………
21
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

2
1.2.2.3. Phƣơng pháp điều khiển số…………………………………………
22
1.2.3. Nguyên lý cực tiểu Pontryagin _ Hamilton………………………….

25
1.2.3.1. Nguyên lý cực tiểu của Pontryagin. ………………………………
25
1.2.3.2. Điều khiển Bang-Bang ………………………………………………
26
1.2.4 Kết luận …………………………………………………………………………
30
1.3 ĐIỀU KHIỂN TỐI ƢU CÁC HỆ TUYẾN TÍNH VỚI PHIẾM
HÀM DẠNG TOÀN PHƢƠNG LQR………………………………………….
31
1.3.1 Ổn định Lyapunov đối với hệ thống tuyến tính……………………
31
1.3.2 Điều khiển tối ƣu hệ tuyến tính với chỉ tiêu chất lƣợng dạng
toàn phƣơng _ Phƣơng trình Riccati đối với hệ liên tục……………………
32
1.3.3 Phƣơng trình Riccati đối với hệ rời rạc………………………………
35
1.3.4 Các bƣớc giải bài toán toàn phƣơng tuyến tính………………………
36
1.3.5 Kết luận…………………………………………………………………………
37
CHƢƠNG 2. THUẬT TOÁN DI TRUYỀN (GA) VÀ ỨNG DỤNG
TRONG VIỆC XÁC ĐỊNH THAM SỐ TỐI ƢU BỘ ĐIỀU KHIỂN.
LQR………………………………………………………………………………….
38

2.1 KHÁI QUÁT………………………………………………………………
38
2.2 CÁC NGUYÊN LÝ TRONG THUẬT GIẢI DI TRUYỀN………
41

2.2.1 Nguyên lý về xác định cấu trúc dữ liệu. ……………………………
41
2.2.1.1. Mảng byte………………………………………………………………
42
2.2.1.2 Mảng byte nén…………………………………………………………
43
2.2.1.3. Mảng INTEGER nén để tối ƣu truy xuất………………………
47
2.2.1.4. Biểu diễn số thực bằng chuỗi nhị phân…………………………
48
2.2.2. Biễu diễn gen bằng chuỗi số thực ………………………………………
49
2.2.3. Cấu trúc cây………………………………………………………………
50
2.2.4. Độ thích nghi tiêu chuẩn………………………………………………
51
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

3
2.2.5. Độ thích nghi xếp hạng (rank method) ……………………………
51
2.3. CÁC PHÉP TOÁN CỦA THUẬT TOÁN DI TRUYỀN……………
52
2.3.1. Tái sinh (Reproduction) ………………………………………………
52
2.3.2. Lai ghép (Crossover) ……………………………………………………
53
2.3.3. Đột biến (Mutation) ……………………………………………………
54

2.4 CẤU TRÚC CỦA THUẬT TOÁN DI TRUYỀN TÔNG QUÁT…
55
2.5 Ứng dụng của GA trong thiết kế bộ đều khiển LQR………………
54
2.6 Kết luận………………………………………………………………………….
58
CHƢƠNG 3. MÔ PHỎNG KIỂM CHỨNG BẰNG PHẦN MỀM
MATLAB- SIMULINK ……………………………
59
3.1. Mô hình động của hệ thống con lắc ngƣợc
59
3.2. Mô phỏng
60
3.2.1. Cấu trúc điều khiển
61
3.2.2 Kết quả mô phỏng
62
KÊT LUẬN…………………………………………………………………………
65
Tài liệu tham khảo………
66
Phụ lục………
67










Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

4

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
LQR
Tuyến tính bậc hai
(Linear quadratic legulator)
GA
Giải thuật di truyền
(Gentic Algorithm)
IPS
Hệ thống con lắc ngƣợc
(Inverted Pendulum system)
CTDL
Cấu trúc dữ liệu
DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ
Hình 1.1 Sơ đồ hệ thống điều khiển
8
Hình 1.2 Tối ƣu cục bộ và tối ƣu toàn cục
9
Hình 1.3 Hàm chuyển đổi mẫu và bộ điều khiển tối ƣu
30
Hình 2.1 Sơ đồ tổng quát của thuật giải di truyền
42
Hình 2.2 Thông số có trong gen trong hệ nhiễm sắc thể
56

Hình 3.1 (a) Hệ thống con lắc ngƣợc; (b) Sơ đồ tách rời của hệ thống……
59
Hình 3.2 Sơ đồ cấu trúc điều khiển LQR dùng Matlab-simulink
61
Hình 3.3: Sơ đồ cấu trúc cho con lắc ngƣợc dùng matlab-simulink
62
Hình 3.4 Đồ thị sai lệch góc của con lắc
63
Hình 3.5 Đồ thị sai lệch vị trí của xe đẩy
63
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

5


Mở Đầu
1. Tính cấp thiết của đề tài
Việc nghiên cứu và ứng dụng lý thuyết điều khiển thông minh vào thực
tế với mục đích giải phóng sức lao động, tăng năng suất và hạ giá thành sản
phẩm; đồng thời sản phẩm tạo ra đáp ứng đƣợc các yêu cầu ngày càng cao
(chất lƣợng, hình thức, …) của xã hội là việc làm cần thiết.
Bộ điều khiển tối ƣu tuyến tính dạng toàn phƣơng LQR (Linear
Quadratic regulator) là thuật toán điều khiển đƣợc xây dựng dựa trên cơ sở
nguyên lý phản hồi trạng thái. Tham số của bộ điều khiển đƣợc xác định nhờ
việc giải phƣơng trình RICATI khi biết mô hình toán tuyến tính của đối
tƣợng. Khi không có đƣợc mô hình toán tuyến tính của đối tƣợng thì không
thể có lời giải cho bài toán điều khiển tối ƣu LQR theo các biểu thức giải tích
thông thƣờng. Trong trƣờng hợp này ta có thể dùng thuật toán di truyền để
tìm lời giải tối ƣu và đây cũng là hƣớng nghiên cứu chính của bản luận van.

2. Mục đích nghiên cứu
Việc điều khiển hệ chuyển động theo mong muốn là vấn đề tồn tại thực
tế cần nghiên cứu giải quyết. Hiện nay phƣơng tiện lý thuyết và thực nghiệm
cho phép thực hiện đƣợc các bài toán phức tạp để tìm đƣợc thông số điều
khiển tối ƣu nhằm nâng cao đƣợc các các chỉ tiêu chất lƣợng của hệ.
Mục tiêu của luận văn là nghiên cứu điều khiển tối ƣu, điều khiển
LQR, thuật toán di truyền và ứng dụng để xác định tham số tối ƣu của bộ điều
khiển LQR trong điều khiển hệ chuyển động.
3. Đối tƣợng và phạm vi nghiên cứu
Đối tƣợng nghiên cứu:
- Xây dựng đƣợc thuật toán di truyền để xác định tham số tối ƣu của bộ
điều khiển LQR. Ứng dụng kết quả cho một hệ chuyển động thực tế.
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

6
Phạm vi nghiên cứu:
- Khai thác các nghiên cứu lý thuyết về điều khiển tối ƣu, giải thuật di
truyền, điều khiển LQR từ đó tìm đƣợc tham số tối ƣu để điều khiển hệ
chuyển động.
- Xây dựng mô hình mô phỏng bằng phần mềm Matlab – Simulink.
4. Ý nghĩa khoa học và thực tiễn của đề tài
Đây là vấn đề khoa học, đang đƣợc các nhà khoa học trên thế giới và
trong nƣớc quan tâm nghiên cứu.
Vấn đề nghiên cứu có tính ứng dụng thực tiễn vì điều khiển hệ chuyển
động là hệ phổ biến hiện nay. Đồng thời, với sự phát triển về mặt công nghệ
đã tạo ra các thiết bị kỹ thuật cho phép tính toán các thuật toán phức tạp với
khối lƣợng tính toán lớn mà trƣớc đây khó thực hiện đƣợc.
5. Nội dung nghiên cứu
Mở đầu

Chƣơng 1: Tổng quan về điều khiển tối ƣu, điều khiển LQR
Chƣơng 2: Thuật toán di truyền và ứng dụng trong việc xác định tham
số tối ƣu bộ điều khiển LQR.
Chƣơng 3: Mô phỏng kiểm chứng bằng phần mềm Matlab – Simulink.
Kết luận








Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

7

CHƢƠNG 1
TỔNG QUAN VỀ ĐIỀU KHIỂN TỐI ƢU, ĐIỀU KHIỂN LQR
1.1 CHẤT LƢỢNG TỐI ƢU
1.1.1 Đặc điểm của bài toán tối ƣu
1.1.1.1. Khái niệm
Một hệ điều khiển đƣợc thiết kế ở chế độ làm việc tốt nhất là hệ luôn ở
trạng thái tối ƣu theo một tiêu chuẩn chất lƣợng nào đó ( đạt đƣợc giá trị cực
trị ). Trạng thái tối ƣu có đạt đƣợc hay không tùy thuộc vào yêu cầu chất
lƣợng đặt ra, vào sự hiểu biết về đối tƣợng và các tác động lên đối tƣợng, vào
điều kiện làm việc của hệ điều khiển …

Hình 1.1: Sơ đồ hệ thống điều khiển

Hệ thống điều khiển nhƣ hình trên bao gồm các phần tử chủ yếu: đối
tƣợng điều khiển ( ĐTĐK ), cơ cấu điều khiển ( CCĐK ) và vòng hồi tiếp
( K ). Với các ký hiệu:
x
0
: tín hiệu đầu vào
u: tín hiệu điều khiển
x: tín hiệu đầu ra

= x
0
– x: tín hiệu sai lệch
f: tín hiệu nhiễu
Chỉ tiêu chất lƣợng J của một hệ thống có thể đƣợc đánh giá theo sai
lệch của đại lƣợng đƣợc điều khiển x so với trị số mong muốn x
0
, lƣợng quá
điều khiển ( trị số cực đại x
max
so với trị số xác lập
 
x 
tính theo phần trăm ),
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

8
thời gian quá độ … hay theo một chỉ tiêu hỗn hợp trong điều kiện làm việc
nhất định nhƣ hạn chế về công suất, tốc độ, gia tốc … Do đó việc chọn một
luật điều khiển và cơ cấu điều khiển để đạt đƣợc chế độ làm việc tối ƣu còn

tùy thuộc vào lƣợng thông tin ban đầu mà ta có đƣợc.
Ở đây chúng ta có thể thấy đƣợc sự khác biệt của chất lƣợng tối ƣu khi
lƣợng thông tin ban đầu thay đổi ( Hình 1.2 ).

Hình 1.2: Tối ƣu cục bộ và tối ƣu toàn cục.
Khi tín hiệu điều khiển u giới hạn trong miền [u
1
,u
2
], ta có đƣợc giá trị
tối ƣu cực đại
1
J

của chỉ tiêu chất lƣợng J ứng với tín hiệu điều khiển
1
u

.
Khi tín hiệu điều khiển u không bị ràng buộc bởi điều kiện
12
u u u
, ta
có đƣợc giá trị tối ƣu
21
JJ


ứng với
2

u

. Nhƣ vậy giá trị tối ƣu thực sự bây
giờ là
2
J

.
Tổng quát hơn, khi ta xét bài toán trong một miền
 
,
mn
uu
nào đó và tìm
đƣợc giá trị tối ƣu
i
J

thì đó là giá trị tối ƣu cục bộ. Nhƣng khi bài toán không
có điều kiện ràng buộc đối với u thì giá trị tối ƣu là
()
i
J extremum J


với
i
J



các giá trị tối ƣu cục bộ, giá trị
J

chính là giá trị tối ƣu toàn cục.
Điều kiện tồn tại cực trị:
 Đạo hàm bậc một của J theo u phải bằng 0:
0


u
J

 Xét giá trị đạo hàm bậc hai của J theo u tại điểm cực trị:
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

9
0
2
2



u
J
: điểm cực trị là cực tiểu
0
2
2




u
J
: điểm cực trị là cực đại
1.1.1.2. Điều kiện thành lập bài toán tối ƣu
Để thành lập bài toán tối ƣu thì yêu cầu đầu tiên là hệ thống phải có đặc
tính phi tuyến có cực trị.
Bƣớc quan trọng trong việc thành lập một hệ tối ƣu là xác định chỉ tiêu
chất lƣợng J. Nhiệm vụ cơ bản ở đây là bảo đảm cực trị của chỉ tiêu chất
lƣợng J. Ví dụ nhƣ khi xây dựng hệ tối ƣu tác động nhanh thì yêu cầu đối với
hệ là nhanh chóng chuyển từ trạng thái này sang trạng thái khác với thời gian
quá độ nhỏ nhất, nghĩa là cực tiểu hóa thời gian quá độ. Hay khi tính toán
động cơ tên lửa thì chỉ tiêu chất lƣợng là vƣợt đƣợc khoảng cách lớn nhất với
lƣợng nhiên liệu đã cho.
Chỉ tiêu chất lƣợng J phụ thuộc vào tín hiệu ra x(t), tín hiệu điều khiển
u(t) và thời gian t. Bài toán điều khiển tối ƣu là xác định tín hiệu điều khiển
u(t) làm cho chỉ tiêu chất lƣợng J đạt cực trị với những điều kiện hạn chế nhất
định của u và x.
Chỉ tiêu chất lƣợng J thƣờng có dạng sau:
0
[ ( ), ( ), ]
T
J L x t u t t dt


Trong đó L là một phiếm hàm đối với tín hiệu x, tín hiệu điều khiển u
và thời gian t.
1.1.1.3. Tối ƣu hoá tĩnh và động
Chúng ta cần phân biệt hai dạng bài toán tối ƣu hoá tĩnh và tối ƣu hóa

động. Tối ƣu hóa tĩnh là bài toán không phụ thuộc vào thời gian. Còn đối với
tối ƣu hóa động thì thời gian cũng là một biến mà chúng ta cần phải xem xét
đến.
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

10


1.1.2. Xây dựng bài toán tối ƣu
1.1.2.1. Tối ƣu hóa không có điều kiện ràng buộc
Một hàm chỉ tiêu chất lƣợng vô hƣớng
 
0uL
đƣợc cho trƣớc là một
hàm của một vector điều khiển hay một vector quyết định
m
Ru
. Chúng ta
cần chọn giá trị của u sao cho L(u) đạt giá trị nhỏ nhất.
Để giải bài toán tối ƣu, ta viết chuỗi Taylor mở rộng cho độ biến thiên
của L(u) nhƣ sau:
)3(
2
1
OduLduduLdL
uu
TT
u


(1.1)
Với O(3) có thể coi là số hạng thứ 3. Grad của L theo u là một vector m
cột:



















m
u
uL
uL
uL
u
L
L

/
/
/
2
1

(1.2)
và đạo hàm cấp 2 của L theo u là một ma trận m x m ( còn gọi là ma
trận Hessian ):














ji
uu
uu
L
u
L
L

2
2
2
(1.3)
L
uu
đƣợc gọi là ma trận uốn.
Một điểm cực trị hoặc điểm dừng xuất hiện khi sự biến thiên dL với
thành phần thứ nhất tiến về 0 với mọi biến thiên du trong quá trình điều
khiển. Vì vậy, để có điểm cực trị thì:
0
u
L
(1.4)
Giả sử đang ở tại điểm cực trị, có L
u
= 0 nhƣ (1.4). Để điểm cực trị trở
thành điểm cực tiểu, chúng ta cần có:
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

11
)3(
2
1
OduLdudL
uu
T

(1.5)

là xác định dƣơng với mọi sự biến thiên du. Điều này đƣợc đảm bảo
nếu ma trận uốn L
uu
là xác định dương:
0
uu
L
(1.6)
Nếu L
uu
là xác định âm thì điểm cực trị chính là điểm cực đại; còn nếu
L
uu
là không xác định thì điểm cực trị chính là điểm yên ngựa. Nếu L
uu
là bán
xác định thì chúng ta sẽ xét đến thành phần bậc cao hơn trong (1.1) để xác
định được loại của điểm cực trị.
Nhắc lại: L
uu
là xác định dƣơng ( hoặc âm ) nếu nhƣ các giá trị riêng
của nó là dƣơng ( hoặc âm ), không xác định nếu các giá trị riêng của nó vừa
có dƣơng vừa có âm nhƣng khác 0, và sẽ là bán xác định nếu tồn tại giá trị
riêng bằng 0. Vì thế nếu
0
uu
L
, thì thành phần thứ hai sẽ không hoàn toàn
chỉ ra đƣợc loại của điểm cực trị.
1.1.2.2. Tối ƣu hóa với các điều kiện ràng buộc

Cho hàm chỉ tiêu chất lƣợng vô hƣớng
 
uxL ,
, với vector điều khiển
m
Ru
và vector trạng thái
n
Rx
. Bài toán đƣa ra là chọn u sao cho hàm chỉ
tiêu chất lƣợng L(x,u) đạt giá trị nhỏ nhất và thỏa mãn đồng thời các phƣơng
trình điều kiện ràng buộc.
 
0, uxf
(1.7)
Vector trạng thái x đƣợc xác định từ một giá trị u cho trƣớc bằng mối
quan hệ (1.7), vì thế f là một hệ gồm n phƣơng trình vô hƣớng,
n
Rf 
.

Để tìm điều kiện cần và đủ của giá trị cực tiểu, đồng thời thỏa mãn
 
0, uxf
, ta cần làm chính xác nhƣ trong phần trƣớc. Đầu tiên ta khai triển
dL dƣới dạng chuỗi Taylo, sau đó xác định số hạng thứ nhất và thứ hai.
Thừa số Lagrange và hàm Hamilton.
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN


12
Tại điểm cực trị, dL với giá trị thứ nhất bằng 0 với mọi sự biến thiên
của du khi df bằng 0. Nhƣ vậy chúng ta cần có:
0 dxLduLdL
T
x
T
u
(1.8)
và:
0 dxfdufdf
xu
(1.9)
Từ (1.7) ta xác định đƣợc x từ giá trị u đã có, độ biến thiên dx đƣợc xác
định bởi (1.9) từ giá trị biến thiên du đã có. Nhƣ vậy, ma trận Jacobi f
x
không
kỳ dị và:
duffdx
ux
1

(1.10)
Thay dx vào (1.8) ta đƣợc:
duffLLdL
ux
T
x
T
u

)(
1

(1.11)
Đạo hàm riêng của L theo u chứa hằng số f đƣợc cho bởi phƣơng trình:
 
x
T
x
T
uu
T
ux
T
x
T
u
df
LffLffLL
u
L





1
0
(1.12)
với

 
T
x
T
x
ff
1

. Lƣu ý rằng:
u
dx
L
u
L



0
(1.13)
Để thành phần thứ nhất của dL bằng không với giá trị du tùy ý khi
0df
, ta cần có:
0

x
T
x
T
uu
LffL

(1.14)
Đây là điều kiện cần để có giá trị cực tiểu. Trƣớc khi đi tìm điều kiện
đủ, chúng ta hãy xem xét thêm một vài phƣơng pháp để có đƣợc (1.14).
Viết (1.8) và (1.9) dƣới dạng:
0



















du
dx
ff
LL
df
dL

ux
T
u
T
x
(1.15)
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

13
Hệ phƣơng trình tuyến tính này xác định một điểm dừng, và phải có
một kết quả
 
T
TT
dudx
. Điều này chỉ xảy ra nếu ma trận hệ số
   
mnn 1

có hạng nhỏ hơn n+. Có nghĩa là các hàng của ma trận tuyến tính với nhau để
tồn tại một vector

có n số hạng nhƣ sau:
 
0.1 







ux
T
u
T
x
T
ff
LL

(1.16)
Hay:
0
x
TT
x
fL

(1.17)
0
u
TT
u
fL

(1.18)
Giải (1.17) ta đƣợc

:

1

x
T
x
T
fL

(1.19)
và thay vào (1.18) để có đƣợc (1.14).
Vector
n
R

được gọi là thừa số Lagrange, và nó sẽ là công cụ hữu
ích cho chúng ta sau này. Để hiểu thêm ý nghĩa của thừa số Lagrange ta xét
du = 0, từ (1.8) và (1.9) ta khử dx để đƣợc:
dffLdL
x
T
x
1

(1.20)
Vì vậy:
 







T
x
T
x
du
fL
f
L
1
0
(1.21)
Do đó -

là đạo hàm riêng của L với biến điều khiển u là hằng số. Điều
này nói lên tác dụng của hàm chỉ tiêu chất lƣợng với biến điều khiển không
đổi khi điều kiện thay đổi.
Nhƣ là một cách thứ ba để tìm đƣợc (1.14), ta phát triển thêm để sử
dụng cho các phân tích trong những phần sau. Kết hợp điều kiện và hàm chỉ
tiêu chất lƣợng để tìm ra hàm Hamilton.
     
uxfuxLuxH
T
,,,,


(1.22)
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN


14
Với
n
R

là thừa số Lagrange chƣa xác định. Muốn chọn x, u,

để có
đƣợc điểm dừng, ta tiến hành các bƣớc sau.
Độ biến thiên của H theo các độ biến thiên của x, u,

đƣợc viết nhƣ
sau:


dHduHdxHdH
TT
u
T
x

(1.23)
Lƣu ý rằng:
),( uxf
H
H 






(1.24)
Giả sử chúng ta chọn các giá trị của u thỏa mãn:
0

H
(1.25)
Sau đó ta xác định x với giá trị của u đã có bằng phƣơng trình điều kiện
ràng buộc
 
0, uxf
. Trong trƣờng hợp này hàm Hamilton tƣơng đƣơng với
hàm chỉ tiêu chất lƣợng:
LH
f

0
(1.26)
Nhắc lại: nếu f = 0, ta sẽ tìm đƣợc dx theo du từ (1.10). Ta không nên
xét mối quan hệ giữa du và dx để thuận tiện trong việc chọn

sao cho:
0
x
H
(1.27)
Sau đó, từ (1.23), độ biến thiên dH không chứa thành phần dx. Điều
này mang lại kết quả


:
0



T
xx
fL
x
H
(1.28)
hay
1

x
T
x
T
fL

.
Nếu giữ nguyên (1.25) và (1.27) thì:
duHdHdL
T
u

(1.29)
Vì H = L, để có đƣợc điểm dừng ta phải áp đặt điều kiện:
0
u

H
(1.30)
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

15
Tóm lại, điều kiện cần để có được điểm cực tiểu của L(x,u) thỏa mãn
điều kiện ràng buộc f(x,u) = 0 gồm có:
0


f
H

(1.31a)
0



T
xx
fL
x
H
(1.31b)
0



T

uu
fL
u
H
(1.31c)
Với
 

,,uxH
xác định bởi (1.22). Cách thƣờng dùng là từ 3 phƣơng
trình đã cho xác định x,

, và u theo thứ tự tƣơng ứng. So sánh 2 phƣơng trình
(1.31b) và (1.31c) ta thấy chúng tƣơng ứng với 2 phƣơng trình (1.17) và
(1.18).
Trong nhiều ứng ụng, chúng ta không quan tâm đến giá trị của

, tuy
nhiên ta vẫn phải đi tìm giá trị của nó vì đó là một biến trung gian cho phép
chúng ta xác định các đại lƣợng cần tìm là u, x và giá trị nhỏ nhất của L.
Ƣu điểm của thừa số Lagrange có thể tóm tắt nhƣ sau: trên thực tế, hai
đại lƣợng dx và du không phải là hai đại lƣợng biến thiên độc lập với nhau,
theo (1.10). Bằng cách đƣa ra một thừa số bất định

, chúng ta chọn

sao cho
dx và du có thể đƣợc xem là hai đại lƣợng biến thiên độc lập với nhau. Lấy
đạo hàm riêng của H lần lƣợt theo các biến nhƣ trong (1.31), nhƣ thế ta sẽ có
đƣợc điểm dừng.

Khi đưa ra thừa số Lagrange, chúng ta có thể thay thế bài toán tìm giá
trị nhỏ nhất của L(x,u) với điều kiện ràng buộc f(x,u) = 0, thành bài toán tìm
giá trị nhỏ nhất của hàm Hamilton H(x,u,

) không có điều kiện ràng buộc.
Điều kiện đã (1.31) xác định một điểm dừng. Ta sẽ tiếp tục chứng minh
đây là điểm cực tiểu nhƣ đã thực hiện trong phần trƣớc.
Viết chuỗi Taylor mở rộng cho độ biến thiên của L và f nhƣ sau:
   
)3(
2
1
O
du
dx
LL
LL
dudx
du
dx
LLdL
uuux
xuxx
TTT
u
T
x






















(1.32)
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

16
 
 
)3(
2
1
O
du

dx
ff
ff
dudx
du
dx
ffdf
uuux
xuxx
TT
ux






















(1.33)
Với:
xu
f
f
xu




2

Để đƣa ra hàm Hamilton, ta sử dụng các phƣơng trình sau:
     
)3(
2
1
1 O
du
dx
HH
HH
dudx
du
dx
HH
df
dL

uuux
xuxx
TTT
u
T
x
T





























(1.34)
Bây giờ, để có đƣợc điểm dừng ta cần có
0f
, và đồng thời thành
phần thứ nhất của dL bằng 0 với mọi sự biến thiên của dx và du. Vì
0f

nên
0df
, và điều này đòi hỏi
0
x
H

0
u
H
nhƣ trong (1.31).
Để tìm điều kiện đủ cho điểm cực tiểu, chúng ta xét đến thành phần thứ
hai. Đầu tiên, ta cần xem mối quan hệ giữa dx và du trong (1.34). Giả sử rằng
chúng ta đang ở điểm cực trị nên
0
x
H
,

0
u
H

0df
. Sau đó, từ (1.33)
ta có:
)2(
1
Oduffdx
ux


(1.35)
Thay vào (1.34) ta đƣợc:
 
)3(
2
1
1
Odu
I
ff
HH
HH
IffdudL
ux
uuux
xuxx
T

x
T
u
T

















(1.36)
Để đảm bảo đây là điểm cực tiểu, dL trong (1.36) phải dương với mọi
sự biến thiên của du. Điều này được đảm bảo nếu như ma trận uốn với f luôn
bằng 0 là xác định dương.
 
uxxx
T
x
T

uuxuxxu
T
x
T
uuu
ux
uuux
xuxx
T
x
T
u
f
uu
f
uu
ffHffffHHffH
I
ff
HH
HH
IffLL
11
1




















(1.37)
Lƣu ý rằng nếu điều kiện ràng buộc
 
0, uxf
với mọi x và u thì (1.37)
đƣợc rút lại thành L
uu
ở phƣơng trình (1.6).
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

17
Nếu (1.37) là xác định âm ( hoặc không xác định ) thì điểm dừng sẽ là
điểm cực đại ( hoặc điểm yên ngựa ).
1.2. CÁC PHƢƠNG PHÁP ĐIỀU KHIỂN TỐI ƢU
1.2.1. Phƣơng pháp biến phân cổ điển Euler_Lagrange
1.2.1.1. Giới thiệu

Nhiệm vụ của điều khiển tối ƣu là giải bài toán tìm cực trị của phiếm
hàm
[ ( ), ( )]L x t u t
bằng cách chọn tín hiệu điều khiển u(t) với những điều kiện
hạn chế của đại lƣợng điều khiển và tọa độ pha. Một trong những công cụ
toán học để xác định cực trị là phƣơng pháp biến phân cổ điển
Euler_Lagrange.
Đƣờng cực trị là những hàm trơn còn phiếm hàm cùng các điều kiện
hạn chế là những hàm phi tuyến. Do đó phƣơng pháp này không thể áp dụng
cho những trƣờng hợp mà tín hiệu điều khiển có thể là các hàm gián đoạn.
Trƣờng hợp không có điều kiện ràng buộc
Cho u(t) là hàm thuộc lớp hàm có đạo hàm bậc nhất liên tục. Trong mặt
phẳng (u,t) cho hai điểm (t
0
,u
0
) và (t
1
,u
1
). Cần tìm quỹ đạo nối hai điểm này
sao cho tích phân theo quỹ đạo
)(tuu


cho bởi:
1
0
( ) ( , , )
t

t
J u L u u t dt


(1.38)
có cực trị.
L là hàm có đạo hàm riêng bậc một và bậc hai liên tục với mọi biến của
nó. Để thống nhất, ở đây ta lấy t
0
= 0 và t
1
= T.
Biến đổi của J do

u tạo nên là:
)()()( uJuuJuuJ 



 

T T
dttuuLdttuuuuL
0 0
),,(),,(



Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN


18

dttuuLtuuuuL
T


0
)],,(),,([


(1.39)
Phân tích (1.39) theo chuỗi Taylor và chỉ khảo sát thành phần bậc một
của J ta đƣợc:
dtu
u
tuuL
u
u
tuuL
uuJ
T
])
),,(
()
),,(
([),(
0












(1.40)


u và
u


liên hệ nhau bởi:
)0()()(
0
udttutu
T





Xem

u là hàm biến đổi độc lập, biểu thức (1.40) có thể biến đổi để chỉ
chứa


u bằng cách lấy tích phân những thành phần chứa
u


:
]
),,(),,(
[
),,(
),(
0
0
udt
u
tuuL
dt
d
u
tuuL
u
u
tuuL
uuJ
T
T
















(1.41)
Từ điều kiện đã cho

u(0) =

(T) = 0, phần đầu của vế phải ở biểu thức
(1.41) bằng 0.
Nếu gia số

J của chỉ tiêu chất lƣợng J tồn tại và nếu J có cực trị đối
với u
*
thì:
0),(
*
 uuJ

(1.42)
Đó là điều kiện cơ bản của phép tính biến phân.

Từ các biểu thức (1.41), (1.42) ta có:
0]
),,(),,(
[),(
****
0
*








udt
u
tuuL
dt
d
u
tuuL
uuJ
T



(1.43)
Từ đó có thể rút ra phƣơng trình Euler_Lagrange:
( , , ) ( , , )

0
L u u t d L u u t
u dt u





(1.44a)
Hoặc có thể viết đơn giản:
0
L d L
u dt u




(1.44b)
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

19
Trƣờng hợp có điều kiện ràng buộc
Nếu ngoài chỉ tiêu chất lƣợng (1.38) còn có các điều kiện ràng buộc
dạng:
0),,( tuu
i




[0, ]tT
,
1,in
(1.45)
thì chỉ tiêu chất lƣợng J có dạng:




T
i
n
i
iia
dttuuttuuLuJ
0
1
)],,()(),,([),(


(1.46)


i
(t) với i = 1,2,…,n là hàm Lagrange.Vì giới hạn thỏa mãn với mọi
t nên hàm Lagrange phụ thuộc thời gian.
Tƣơng tự nhƣ trên ta có phƣơng trình Euler_Lagrange tổng quát:
( , , , ) ( , , , )
0
aa

L u u t L u u t
d
u dt u






(1.47)

),,()(),,(),,,(
1
tuuttuuLtuuL
i
n
i
ia





(1.48)
Khi điều kiện ràng buộc có dạng:


T
ii
qdttuu

0
),,(


(1.49)
thì phƣơng trình Euler_Lagrange tổng quát (1.47) có phiếm hàm:
1
( , , , ) ( , , ) ( , , )
n
ai
i
L u u t L u u t u u t
 



  
(1.50)
Trong trƣờng hợp này,

i
là các hệ số không phụ thuộc thời gian.
Khi có điều kiện ràng buộc dạng (1.45) hoặc (1.49) phải giải (n+1)
phƣơng trình để xác định y*(t) và

i
*(t) với i=1,2,…,n.
Phƣơng trình Euler_Lagrange với tín hiệu điều khiển bị hạn chế
Trong phần trên ta chỉ đề cập tới bài toán mà trong đó tín hiệu điều
khiển không có giới hạn nào ràng buộc. Trong thực tế, thƣờng gặp tín hiệu

điều khiển có ràng buộc dạng
1u
.
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN

20
Điều kiện cần để có cực trị: khi u(t) là đƣờng cực trị thì u+

u và u-

u
là những hàm cho phép. Bây giờ ta so sánh trị số phiếm hàm ở đƣờng cực trị
với trị số của nó ở hàm u+

u và u-

u. Nếu miền biến đổi của u(t) là kín và
u(t) ở ngoài biên thì một trong các hàm u+

u hoặc u-

u sẽ ra ngoài miền cho
phép.
Một trong các biện pháp khắc phục khó khăn trên là đƣờng cực trị ở
biên và:
)(tu


(1.51)

Ví dụ, nếu
1u
, điều kiện
)(tu


nghĩa là
1)( t

. Đổi biến ta có:
2
zu


(1.52)
thì biến mới z sẽ không có điều kiện hạn chế và biên giới của biến u
tƣơng đƣơng với z = 0. Bây giờ chỉ tiêu chất lƣợng


T
dttuuLuJ
0
),,()(

có biến
mới u = z
2
+

, từ đó:

2u zz






và chỉ tiêu chất lƣợng J có dạng:


T
dttzzzLJ
0
2
],2,[



(1.53)
Vì không có điều kiện hạn chế nên phƣơng trình Euler_Lagrange có
dạng:
0





z
L
dt

d
z
L

(1.54)
Ở đây
z
u
L
z
u
L
z
u
u
L
z
u
u
L
z
L




22





















z
u
L
z
u
u
L
z
u
u
L
z
L

2






















z
u
L
u
L
dt
d

z
z
L
dt
d



2)(2









×