Tải bản đầy đủ (.pdf) (74 trang)

Nghiên cứu giải thuật di truyền để tối ưu hóa tham số bộ điều khiển lqr trong điều khiển hệ chuyển động

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (915.25 KB, 74 trang )

..

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP
-------------------o0o------------------

LUẬN VĂN THẠC SỸ KỸ THUẬT
NGÀNH: TỰ ĐỘNG HÓA

NGHIÊN CỨU GIẢI THUẬT DI TRUYỀN ĐỂ TỐI ƢU HOÁ
THAM SỐ BỘ ĐIỀU KHIỂN LQR TRONG ĐIỀU KHIỂN HỆ
CHUYỂN ĐỘNG

KHƢƠNG TRỌNG NGHĨA

THÁI NGUYÊN 2011
Số hóa bởi Trung tâm Học liệu – ĐHTN




ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP
--------------------------------------

LUẬN VĂN THẠC SỸ KỸ THUẬT
NGÀNH: TỰ ĐỘNG HÓA

NGHIÊN CỨU GIẢI THUẬT DI TRUYỀN ĐỂ TỐI ƢU
HOÁTHAM SỐ BỘ ĐIỀU KHIỂN LQR TRONG ĐIỀU KHIỂN
HỆ CHUYỂN ĐỘNG



Học viên

: Khƣơn Trọng Nghĩa

Ngƣời HD Khoa Học: TS Đỗ Trung Hải

THÁI NGUYÊN 2011
Số hóa bởi Trung tâm Học liệu – ĐHTN




ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP

***

CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc Lập - Tƣ Do - Hạnh Phúc
--------------o0o--------------

THUYẾT MINH
LUẬN VĂN THẠC SỸ KỸ THUẬT

ĐỀ TÀI: NGHIÊN CỨU GIẢI THUẬT DI TRUYỀN ĐỂ TỐI ƢU

HOÁ THAM SỐ BỘ ĐIỀU KHIỂN LQR TRONG ĐIỀU KHIỂN
HỆ CHUYỂN ĐỘNG


Học viên

: Khƣơng Trọng Nghĩa

Lớp

: CH-K12

Chuyên ngành

: Tự động hoá

Ngƣời hƣớng dẫn

: TS Đỗ Trung Hải

Ngày giao đề tài

: 2/2011

Ngày hoàn thành đề tài

: 8/2011

KHOA ĐT SAU ĐẠI HỌC

NGƢỜI HƢỚNG DẪN

TS Đõ Trung Hải
BAN GIÁM HIỆU


HỌC VIÊN

Khƣơng Trọng Nghĩa

Số hóa bởi Trung tâm Học liệu – ĐHTN




LỜI CAM ĐOAN

Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi. Các số liệu,
kết quả trong luận văn là hoàn toàn trung thực theo tài liệu tham khảo và chƣa
từng đƣợc ai công bố trong bất kỳ cơng trình nào khác.

Thái Ngun, ngày 30 tháng 9 năm 2011
Tác giả luận văn

Khƣơng Trọng Nghĩa

Số hóa bởi Trung tâm Học liệu – ĐHTN




LỜI CẢM ƠN

Trong q trình làm luận văn, tơi đã nhận đƣợc nhiều ý kiến đóng góp từ các
thầy, cơ giáo, các anh chị và các bạn đồng nghiệp.

Tôi xin bày tỏ lòng biết ơn đến TS Đỗ Trung Hải, Ngƣời đã tận tình
hƣớng dẫn tơi hồn thành luận văn này, đến Khoa Sau Đại học - Trƣờng Đại
học Kỹ thuật cơng nghiệp đã tạo điều kiện để tơi hồn thành khóa học.
Tơi xin chân thành cảm ơn Trƣờng Đại học Kỹ thuật Cơng nghiệp,
Phịng Hành chính Tài vụ, Trung tâm thí nghiệm đã tạo những điều kiện để
tơi hồn thành khóa học.
Tơi xin chân thành cảm ơn các thầy hiệu trƣởng, ban giám hiệu, cùng
với các đồng nghiệp nhà trƣờng TCN Hermann Gmainer Việt Trì, cùng với
gia đình, các bạn bè, đã giúp đỡ và tạo những điều kiện thuận lợi nhất về mọi
mặt để tơi hồn thành khóa học.

Tác giả luận văn

Khương Trọng Nghĩa

Số hóa bởi Trung tâm Học liệu – ĐHTN




Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

MỤC LỤC
Mục lục …………………………………………………….…………………………….

1

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TĂT……………………….

4


DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ……………………………………

4

MỞ ĐẦU………………………………………………………………………………..

5

1. Tính cấp thiết của đề tài………………………………………………………….

5

2. Mục đích nghiên cứu……………………………………………………………..

5

3. Đối tƣợng và phƣơng pháp nghiên cứu……………………………………..

5

4. Ý nghĩa khoa học và thực tiễn của đề tài…………………………………….

6

5. Kết cấu luận văn……………………………………………………………………

6

CHƢƠNG 1 TỔNG QUAN VỀ ĐIỀU KHIỂN TỐI ƢU, ĐIỀU

KHIỂN LQR……………………………………………………………………………
1.1 CHẤT LƢỢNG TỐI ƢU …………………………………………………….

7

1.1.1 Đặc điểm của bài toán tối ƣu ………………………………………

7
7

1.1.1.1. Khái niệm ………………………………………………………………

7

1.1.1.2. Điều kiện thành lập bài toán tối ƣu ……………………………

9

1.1.1.3. Tối ƣu hoá tĩnh và động……………………………………………

9

1.1.2.Xây dụng bài tốn tối ƣu………………………………………………

10

1.1.2.1. Tối ƣu hóa khơng có điều kiện ràng buộc………………………

10


1.1.2.2. Tối ƣu hóa với các điều kiện ràng buộc…………………………

11

1.2 CÁC PHƢƠNG PHÁP ĐIỀU KHIỂN TỐI ƢU……………………….

16

1.2.1. Phƣơng pháp biến phân cổ điển Euler_Lagrange…………………..

16

1.2.1.1. Giới thiệu ………………………………………………………………..

16

1.2.2. Phƣơng pháp quy hoạch động Bellman……………………………….

21

1.2.2.1. Giới thiệu…………………………………………………………………

21

1.2.2.2. Hệ rời rạc…………………………………………………………………

21

Số hóa bởi Trung tâm Học liệu – ĐHTN


1




Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

1.2.2.3. Phƣơng pháp điều khiển số…………………………………………

22

1.2.3. Nguyên lý cực tiểu Pontryagin _ Hamilton………………………….

25

1.2.3.1. Nguyên lý cực tiểu của Pontryagin. ………………………………

25

1.2.3.2. Điều khiển Bang-Bang ………………………………………………..
1.2.4 Kết luận …………………………………………………………………………
1.3 ĐIỀU KHIỂN TỐI ƢU CÁC HỆ TUYẾN TÍNH VỚI PHIẾM

26
30
31

HÀM DẠNG TỒN PHƢƠNG LQR………………………………………….
1.3.1 Ổn định Lyapunov đối với hệ thống tuyến tính……………………


31

1.3.2 Điều khiển tối ƣu hệ tuyến tính với chỉ tiêu chất lƣợng dạng
tồn phƣơng _ Phƣơng trình Riccati đối với hệ liên tục……………………
1.3.3 Phƣơng trình Riccati đối với hệ rời rạc………………………………

32

1.3.4 Các bƣớc giải bài tốn tồn phƣơng tuyến tính………………………

36

1.3.5 Kết luận…………………………………………………………………………

37

CHƢƠNG 2. THUẬT TOÁN DI TRUYỀN (GA) VÀ ỨNG DỤNG
TRONG VIỆC XÁC ĐỊNH THAM SỐ TỐI ƢU BỘ ĐIỀU KHIỂN.
LQR………………………………………………………………………………….
2.1 KHÁI QUÁT………………………………………………………………

38

2.2 CÁC NGUYÊN LÝ TRONG THUẬT GIẢI DI TRUYỀN………

41

2.2.1 Nguyên lý về xác định cấu trúc dữ liệu. ……………………………

41


2.2.1.1. Mảng byte………………………………………………………………

42

2.2.1.2 Mảng byte nén…………………………………………………………

43

2.2.1.3. Mảng INTEGER nén để tối ƣu truy xuất………………………

47

2.2.1.4. Biểu diễn số thực bằng chuỗi nhị phân…………………………

48

35

38

2.2.2. Biễu diễn gen bằng chuỗi số thực ………………………………………

49

2.2.3. Cấu trúc cây………………………………………………………………

50

2.2.4. Độ thích nghi tiêu chuẩn………………………………………………


51

Số hóa bởi Trung tâm Học liệu – ĐHTN

2




Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

2.2.5. Độ thích nghi xếp hạng (rank method) ……………………………

51

2.3. CÁC PHÉP TOÁN CỦA THUẬT TOÁN DI TRUYỀN……………

52

2.3.1. Tái sinh (Reproduction) ………………………………………………

52

2.3.2. Lai ghép (Crossover) ……………………………………………………

53

2.3.3. Đột biến (Mutation) ……………………………………………………


54

2.4 CẤU TRÚC CỦA THUẬT TỐN DI TRUYỀN TƠNG QT…

55

2.5 Ứng dụng của GA trong thiết kế bộ đều khiển LQR………………

54

2.6 Kết luận………………………………………………………………………….

58

CHƢƠNG 3. MÔ PHỎNG KIỂM CHỨNG BẰNG PHẦN MỀM

59

MATLAB- SIMULINK ……………………………
3.1. Mơ hình động của hệ thống con lắc ngƣợc

59

3.2. Mơ phỏng

60

3.2.1. Cấu trúc điều khiển

61


3.2.2 Kết quả mô phỏng

62

KÊT LUẬN…………………………………………………………………………..

65

Tài liệu tham khảo……….........................................................................................

66

Phụ lục………................................................................................................................

67

Số hóa bởi Trung tâm Học liệu – ĐHTN

3




Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

LQR

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Tuyến tính bậc hai

(Linear quadratic legulator)
Giải thuật di truyền

GA

(Gentic Algorithm)
Hệ thống con lắc ngƣợc

IPS

(Inverted Pendulum system)
Cấu trúc dữ liệu

CTDL

DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ
Hình 1.1 Sơ đồ hệ thống điều khiển.............................................................................

8

Hình 1.2 Tối ƣu cục bộ và tối ƣu tồn cục..................................................................

9

Hình 1.3 Hàm chuyển đổi mẫu và bộ điều khiển tối ƣu........................................

30

Hình 2.1 Sơ đồ tổng quát của thuật giải di truyền....................................................


42

Hình 2.2 Thơng số có trong gen trong hệ nhiễm sắc thể.......................................

56

Hình 3.1 (a) Hệ thống con lắc ngƣợc; (b) Sơ đồ tách rời của hệ thống……..

59

Hình 3.2 Sơ đồ cấu trúc điều khiển LQR dùng Matlab-simulink.......................

61

Hình 3.3: Sơ đồ cấu trúc cho con lắc ngƣợc dùng matlab-simulink..................

62

Hình 3.4 Đồ thị sai lệch góc của con lắc....................................................................

63

Hình 3.5 Đồ thị sai lệch vị trí của xe đẩy .................................................................

63

Số hóa bởi Trung tâm Học liệu – ĐHTN

4





Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

Mở Đầu
1. Tính cấp thiết của đề tài
Việc nghiên cứu và ứng dụng lý thuyết điều khiển thông minh vào thực
tế với mục đích giải phóng sức lao động, tăng năng suất và hạ giá thành sản
phẩm; đồng thời sản phẩm tạo ra đáp ứng đƣợc các yêu cầu ngày càng cao
(chất lƣợng, hình thức, …) của xã hội là việc làm cần thiết.
Bộ điều khiển tối ƣu tuyến tính dạng tồn phƣơng LQR (Linear
Quadratic regulator) là thuật tốn điều khiển đƣợc xây dựng dựa trên cơ sở
nguyên lý phản hồi trạng thái. Tham số của bộ điều khiển đƣợc xác định nhờ
việc giải phƣơng trình RICATI khi biết mơ hình tốn tuyến tính của đối
tƣợng. Khi khơng có đƣợc mơ hình tốn tuyến tính của đối tƣợng thì khơng
thể có lời giải cho bài toán điều khiển tối ƣu LQR theo các biểu thức giải tích
thơng thƣờng. Trong trƣờng hợp này ta có thể dùng thuật tốn di truyền để
tìm lời giải tối ƣu và đây cũng là hƣớng nghiên cứu chính của bản luận van.
2. Mục đích nghiên cứu
Việc điều khiển hệ chuyển động theo mong muốn là vấn đề tồn tại thực
tế cần nghiên cứu giải quyết. Hiện nay phƣơng tiện lý thuyết và thực nghiệm
cho phép thực hiện đƣợc các bài tốn phức tạp để tìm đƣợc thông số điều
khiển tối ƣu nhằm nâng cao đƣợc các các chỉ tiêu chất lƣợng của hệ.
Mục tiêu của luận văn là nghiên cứu điều khiển tối ƣu, điều khiển
LQR, thuật toán di truyền và ứng dụng để xác định tham số tối ƣu của bộ điều
khiển LQR trong điều khiển hệ chuyển động.
3. Đối tƣợng và phạm vi nghiên cứu
Đối tƣợng nghiên cứu:
- Xây dựng đƣợc thuật toán di truyền để xác định tham số tối ƣu của bộ

điều khiển LQR. Ứng dụng kết quả cho một hệ chuyển động thực tế.
Số hóa bởi Trung tâm Học liệu – ĐHTN

5




Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

Phạm vi nghiên cứu:
- Khai thác các nghiên cứu lý thuyết về điều khiển tối ƣu, giải thuật di
truyền, điều khiển LQR từ đó tìm đƣợc tham số tối ƣu để điều khiển hệ
chuyển động.
- Xây dựng mơ hình mơ phỏng bằng phần mềm Matlab – Simulink.
4. Ý nghĩa khoa học và thực tiễn của đề tài
Đây là vấn đề khoa học, đang đƣợc các nhà khoa học trên thế giới và
trong nƣớc quan tâm nghiên cứu.
Vấn đề nghiên cứu có tính ứng dụng thực tiễn vì điều khiển hệ chuyển
động là hệ phổ biến hiện nay. Đồng thời, với sự phát triển về mặt công nghệ
đã tạo ra các thiết bị kỹ thuật cho phép tính tốn các thuật tốn phức tạp với
khối lƣợng tính tốn lớn mà trƣớc đây khó thực hiện đƣợc.
5. Nội dung nghiên cứu
Mở đầu
Chƣơng 1: Tổng quan về điều khiển tối ƣu, điều khiển LQR
Chƣơng 2: Thuật toán di truyền và ứng dụng trong việc xác định tham
số tối ƣu bộ điều khiển LQR.
Chƣơng 3: Mô phỏng kiểm chứng bằng phần mềm Matlab – Simulink.
Kết luận


Số hóa bởi Trung tâm Học liệu – ĐHTN

6




Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

CHƢƠNG 1
TỔNG QUAN VỀ ĐIỀU KHIỂN TỐI ƢU, ĐIỀU KHIỂN LQR
1.1 CHẤT LƢỢNG TỐI ƢU
1.1.1 Đặc điểm của bài toán tối ƣu
1.1.1.1. Khái niệm
Một hệ điều khiển đƣợc thiết kế ở chế độ làm việc tốt nhất là hệ luôn ở
trạng thái tối ƣu theo một tiêu chuẩn chất lƣợng nào đó ( đạt đƣợc giá trị cực
trị ). Trạng thái tối ƣu có đạt đƣợc hay khơng tùy thuộc vào yêu cầu chất
lƣợng đặt ra, vào sự hiểu biết về đối tƣợng và các tác động lên đối tƣợng, vào
điều kiện làm việc của hệ điều khiển …

Hình 1.1: Sơ đồ hệ thống điều khiển
Hệ thống điều khiển nhƣ hình trên bao gồm các phần tử chủ yếu: đối
tƣợng điều khiển ( ĐTĐK ), cơ cấu điều khiển ( CCĐK ) và vòng hồi tiếp
( K ). Với các ký hiệu:
x0: tín hiệu đầu vào
u: tín hiệu điều khiển
x: tín hiệu đầu ra

 = x0 – x: tín hiệu sai lệch
f: tín hiệu nhiễu

Chỉ tiêu chất lƣợng J của một hệ thống có thể đƣợc đánh giá theo sai
lệch của đại lƣợng đƣợc điều khiển x so với trị số mong muốn x0, lƣợng quá
điều khiển ( trị số cực đại xmax so với trị số xác lập x    tính theo phần trăm ),
Số hóa bởi Trung tâm Học liệu – ĐHTN

7




Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

thời gian quá độ … hay theo một chỉ tiêu hỗn hợp trong điều kiện làm việc
nhất định nhƣ hạn chế về cơng suất, tốc độ, gia tốc … Do đó việc chọn một
luật điều khiển và cơ cấu điều khiển để đạt đƣợc chế độ làm việc tối ƣu còn
tùy thuộc vào lƣợng thơng tin ban đầu mà ta có đƣợc.
Ở đây chúng ta có thể thấy đƣợc sự khác biệt của chất lƣợng tối ƣu khi
lƣợng thông tin ban đầu thay đổi ( Hình 1.2 ).

Hình 1.2: Tối ƣu cục bộ và tối ƣu tồn cục.
Khi tín hiệu điều khiển u giới hạn trong miền [u1,u2], ta có đƣợc giá trị
tối ƣu cực đại J1 của chỉ tiêu chất lƣợng J ứng với tín hiệu điều khiển u1 .
Khi tín hiệu điều khiển u khơng bị ràng buộc bởi điều kiện u1  u  u2 , ta
có đƣợc giá trị tối ƣu J 2  J1 ứng với u2 . Nhƣ vậy giá trị tối ƣu thực sự bây
giờ là J 2 .
Tổng quát hơn, khi ta xét bài toán trong một miền um , un  nào đó và tìm
đƣợc giá trị tối ƣu J i thì đó là giá trị tối ƣu cục bộ. Nhƣng khi bài tốn khơng
có điều kiện ràng buộc đối với u thì giá trị tối ƣu là J   extremum( J i ) với J i là
các giá trị tối ƣu cục bộ, giá trị J  chính là giá trị tối ƣu toàn cục.
Điều kiện tồn tại cực trị:



Đạo hàm bậc một của J theo u phải bằng 0:

J
0
u



Xét giá trị đạo hàm bậc hai của J theo u tại điểm cực trị:

Số hóa bởi Trung tâm Học liệu – ĐHTN

8




Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

2J
 0 : điểm cực trị là cực tiểu
u 2
2J
 0 : điểm cực trị là cực đại
u 2

1.1.1.2. Điều kiện thành lập bài toán tối ƣu
Để thành lập bài toán tối ƣu thì yêu cầu đầu tiên là hệ thống phải có đặc

tính phi tuyến có cực trị.
Bƣớc quan trọng trong việc thành lập một hệ tối ƣu là xác định chỉ tiêu
chất lƣợng J. Nhiệm vụ cơ bản ở đây là bảo đảm cực trị của chỉ tiêu chất
lƣợng J. Ví dụ nhƣ khi xây dựng hệ tối ƣu tác động nhanh thì yêu cầu đối với
hệ là nhanh chóng chuyển từ trạng thái này sang trạng thái khác với thời gian
quá độ nhỏ nhất, nghĩa là cực tiểu hóa thời gian q độ. Hay khi tính tốn
động cơ tên lửa thì chỉ tiêu chất lƣợng là vƣợt đƣợc khoảng cách lớn nhất với
lƣợng nhiên liệu đã cho.
Chỉ tiêu chất lƣợng J phụ thuộc vào tín hiệu ra x(t), tín hiệu điều khiển
u(t) và thời gian t. Bài tốn điều khiển tối ƣu là xác định tín hiệu điều khiển
u(t) làm cho chỉ tiêu chất lƣợng J đạt cực trị với những điều kiện hạn chế nhất
định của u và x.
Chỉ tiêu chất lƣợng J thƣờng có dạng sau:
T

J   L[ x(t ), u (t ), t ]dt
0

Trong đó L là một phiếm hàm đối với tín hiệu x, tín hiệu điều khiển u
và thời gian t.
1.1.1.3. Tối ƣu hoá tĩnh và động
Chúng ta cần phân biệt hai dạng bài toán tối ƣu hoá tĩnh và tối ƣu hóa
động. Tối ƣu hóa tĩnh là bài tốn khơng phụ thuộc vào thời gian. Cịn đối với
tối ƣu hóa động thì thời gian cũng là một biến mà chúng ta cần phải xem xét
đến.
Số hóa bởi Trung tâm Học liệu – ĐHTN

9





Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

1.1.2. Xây dựng bài tốn tối ƣu
1.1.2.1. Tối ƣu hóa khơng có điều kiện ràng buộc
Một hàm chỉ tiêu chất lƣợng vô hƣớng Lu   0 đƣợc cho trƣớc là một
hàm của một vector điều khiển hay một vector quyết định u  R m . Chúng ta
cần chọn giá trị của u sao cho L(u) đạt giá trị nhỏ nhất.
Để giải bài toán tối ƣu, ta viết chuỗi Taylor mở rộng cho độ biến thiên
của L(u) nhƣ sau:
1
dL  LTu du  du T Luu du  O(3)
2

(1.1)

Với O(3) có thể coi là số hạng thứ 3. Grad của L theo u là một vector m
cột:

Lu



 L / u1 


L  L / u 2 




u 


L / u m 

(1.2)

và đạo hàm cấp 2 của L theo u là một ma trận m x m ( còn gọi là ma
trận Hessian ):
Luu



 2 L   2 L

u 2  u i u j






(1.3)

Luu đƣợc gọi là ma trận uốn.
Một điểm cực trị hoặc điểm dừng xuất hiện khi sự biến thiên dL với
thành phần thứ nhất tiến về 0 với mọi biến thiên du trong quá trình điều
khiển. Vì vậy, để có điểm cực trị thì:
Lu  0


(1.4)
Giả sử đang ở tại điểm cực trị, có Lu = 0 nhƣ (1.4). Để điểm cực trị trở

thành điểm cực tiểu, chúng ta cần có:
Số hóa bởi Trung tâm Học liệu – ĐHTN

10




Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

dL 

1 T
du Luu du  O(3)
2

(1.5)

là xác định dƣơng với mọi sự biến thiên du. Điều này đƣợc đảm bảo
nếu ma trận uốn Luu là xác định dương:
Luu  0

(1.6)

Nếu Luu là xác định âm thì điểm cực trị chính là điểm cực đại; cịn nếu
Luu là khơng xác định thì điểm cực trị chính là điểm n ngựa. Nếu Luu là bán

xác định thì chúng ta sẽ xét đến thành phần bậc cao hơn trong (1.1) để xác
định được loại của điểm cực trị.
Nhắc lại: Luu là xác định dƣơng ( hoặc âm ) nếu nhƣ các giá trị riêng
của nó là dƣơng ( hoặc âm ), khơng xác định nếu các giá trị riêng của nó vừa
có dƣơng vừa có âm nhƣng khác 0, và sẽ là bán xác định nếu tồn tại giá trị
riêng bằng 0. Vì thế nếu Luu  0 , thì thành phần thứ hai sẽ khơng hồn tồn
chỉ ra đƣợc loại của điểm cực trị.
1.1.2.2. Tối ƣu hóa với các điều kiện ràng buộc
Cho hàm chỉ tiêu chất lƣợng vô hƣớng Lx, u  , với vector điều khiển
u  R m và vector trạng thái x  R n . Bài toán đƣa ra là chọn u sao cho hàm chỉ

tiêu chất lƣợng L(x,u) đạt giá trị nhỏ nhất và thỏa mãn đồng thời các phƣơng
trình điều kiện ràng buộc.
f  x, u   0

(1.7)

Vector trạng thái x đƣợc xác định từ một giá trị u cho trƣớc bằng mối
quan hệ (1.7), vì thế f là một hệ gồm n phƣơng trình vơ hƣớng, f  R n .
Để tìm điều kiện cần và đủ của giá trị cực tiểu, đồng thời thỏa mãn
f x, u   0 , ta cần làm chính xác nhƣ trong phần trƣớc. Đầu tiên ta khai triển

dL dƣới dạng chuỗi Taylo, sau đó xác định số hạng thứ nhất và thứ hai.
Thừa số Lagrange và hàm Hamilton.

Số hóa bởi Trung tâm Học liệu – ĐHTN

11





Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

Tại điểm cực trị, dL với giá trị thứ nhất bằng 0 với mọi sự biến thiên
của du khi df bằng 0. Nhƣ vậy chúng ta cần có:
dL  LTu du  LTx dx  0

(1.8)

và:
df  f u du  f x dx  0

(1.9)

Từ (1.7) ta xác định đƣợc x từ giá trị u đã có, độ biến thiên dx đƣợc xác
định bởi (1.9) từ giá trị biến thiên du đã có. Nhƣ vậy, ma trận Jacobi fx khơng
kỳ dị và:
dx   f x1 f u du

(1.10)

Thay dx vào (1.8) ta đƣợc:
dL  ( LTu  LTx f x1 f u )du

(1.11)

Đạo hàm riêng của L theo u chứa hằng số f đƣợc cho bởi phƣơng trình:
L
u




 LTu  LTx f x1 f u



T

 Lu  f uT f xT Lx

(1.12)

df 0

với f xT   f x1  . Lƣu ý rằng:
T

L
u

 Lu

(1.13)

dx 0

Để thành phần thứ nhất của dL bằng không với giá trị du tùy ý khi
df  0 , ta cần có:
Lu  f uT f xT Lx  0


(1.14)

Đây là điều kiện cần để có giá trị cực tiểu. Trƣớc khi đi tìm điều kiện
đủ, chúng ta hãy xem xét thêm một vài phƣơng pháp để có đƣợc (1.14).
Viết (1.8) và (1.9) dƣới dạng:
dL  LTx
 df   
   fx

LTu   dx 
   0
f u  du

Số hóa bởi Trung tâm Học liệu – ĐHTN

(1.15)

12




Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

Hệ phƣơng trình tuyến tính này xác định một điểm dừng, và phải có
một kết quả dxT duT  . Điều này chỉ xảy ra nếu ma trận hệ số n 1  n  m
T

có hạng nhỏ hơn n+. Có nghĩa là các hàng của ma trận tuyến tính với nhau để

tồn tại một vector  có n số hạng nhƣ sau:

1

Lf

 T .


T
x
x

LTu 
0
fu 

(1.16)

Hay:
LTx  T f x  0

(1.17)

LTu  T f u  0

(1.18)

Giải (1.17) ta đƣợc :
T   LTx f x1


(1.19)

và thay vào (1.18) để có đƣợc (1.14).
Vector   R n được gọi là thừa số Lagrange, và nó sẽ là cơng cụ hữu
ích cho chúng ta sau này. Để hiểu thêm ý nghĩa của thừa số Lagrange ta xét
du = 0, từ (1.8) và (1.9) ta khử dx để đƣợc:
dL  LTx f x1df

(1.20)

Vì vậy:
L
f

 LTx f x1   
T

(1.21)

du  0

Do đó - là đạo hàm riêng của L với biến điều khiển u là hằng số. Điều
này nói lên tác dụng của hàm chỉ tiêu chất lƣợng với biến điều khiển không
đổi khi điều kiện thay đổi.
Nhƣ là một cách thứ ba để tìm đƣợc (1.14), ta phát triển thêm để sử
dụng cho các phân tích trong những phần sau. Kết hợp điều kiện và hàm chỉ
tiêu chất lƣợng để tìm ra hàm Hamilton.
H  x, u ,    L x, u   T f x, u 


Số hóa bởi Trung tâm Học liệu – ĐHTN

(1.22)
13




Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

Với   R n là thừa số Lagrange chƣa xác định. Muốn chọn x, u,  để có
đƣợc điểm dừng, ta tiến hành các bƣớc sau.
Độ biến thiên của H theo các độ biến thiên của x, u,  đƣợc viết nhƣ
sau:
dH  H xT dx  H uT du  H T d

(1.23)

Lƣu ý rằng:
H 

H
 f ( x, u )


(1.24)

Giả sử chúng ta chọn các giá trị của u thỏa mãn:
H  0


(1.25)

Sau đó ta xác định x với giá trị của u đã có bằng phƣơng trình điều kiện
ràng buộc f x, u   0 . Trong trƣờng hợp này hàm Hamilton tƣơng đƣơng với
hàm chỉ tiêu chất lƣợng:
H

f 0

L

(1.26)

Nhắc lại: nếu f = 0, ta sẽ tìm đƣợc dx theo du từ (1.10). Ta khơng nên
xét mối quan hệ giữa du và dx để thuận tiện trong việc chọn  sao cho:
Hx  0

(1.27)

Sau đó, từ (1.23), độ biến thiên dH không chứa thành phần dx. Điều
này mang lại kết quả :
H
 Lx  f xT   0
x

(1.28)

hay T  LTx f x1 .
Nếu giữ nguyên (1.25) và (1.27) thì:
dL  dH  H uT du


(1.29)

Vì H = L, để có đƣợc điểm dừng ta phải áp đặt điều kiện:
Hu  0

Số hóa bởi Trung tâm Học liệu – ĐHTN

(1.30)
14




Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

Tóm lại, điều kiện cần để có được điểm cực tiểu của L(x,u) thỏa mãn
điều kiện ràng buộc f(x,u) = 0 gồm có:
H
 f 0


(1.31a)

H
 Lx  f xT   0
x

(1.31b)


H
 Lu  f uT   0
u

(1.31c)

Với H x,u,   xác định bởi (1.22). Cách thƣờng dùng là từ 3 phƣơng
trình đã cho xác định x, , và u theo thứ tự tƣơng ứng. So sánh 2 phƣơng trình
(1.31b) và (1.31c) ta thấy chúng tƣơng ứng với 2 phƣơng trình (1.17) và
(1.18).
Trong nhiều ứng ụng, chúng ta khơng quan tâm đến giá trị của , tuy
nhiên ta vẫn phải đi tìm giá trị của nó vì đó là một biến trung gian cho phép
chúng ta xác định các đại lƣợng cần tìm là u, x và giá trị nhỏ nhất của L.
Ƣu điểm của thừa số Lagrange có thể tóm tắt nhƣ sau: trên thực tế, hai
đại lƣợng dx và du không phải là hai đại lƣợng biến thiên độc lập với nhau,
theo (1.10). Bằng cách đƣa ra một thừa số bất định , chúng ta chọn  sao cho
dx và du có thể đƣợc xem là hai đại lƣợng biến thiên độc lập với nhau. Lấy
đạo hàm riêng của H lần lƣợt theo các biến nhƣ trong (1.31), nhƣ thế ta sẽ có
đƣợc điểm dừng.
Khi đưa ra thừa số Lagrange, chúng ta có thể thay thế bài tốn tìm giá
trị nhỏ nhất của L(x,u) với điều kiện ràng buộc f(x,u) = 0, thành bài tốn tìm
giá trị nhỏ nhất của hàm Hamilton H(x,u,) khơng có điều kiện ràng buộc.
Điều kiện đã (1.31) xác định một điểm dừng. Ta sẽ tiếp tục chứng minh
đây là điểm cực tiểu nhƣ đã thực hiện trong phần trƣớc.
Viết chuỗi Taylor mở rộng cho độ biến thiên của L và f nhƣ sau:










Lxu   dx 
L
(1.32)
du T  xx
    O(3)
 Lux Luu  du
Số hóa bởi Trung tâm Học liệu – ĐHTN

15
dL  LTx

 dx  1
LTu    dxT
du 2


Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động



 dx  1
f u    dxT
du 2

df   f x


f
du T  xx
 f ux



f xu   dx 
 O(3)
f uu  du

(1.33)

Với:


f xu 

2 f
ux

Để đƣa ra hàm Hamilton, ta sử dụng các phƣơng trình sau:

1

T 






dL
 H xT

 df 



 dx  1
H uT    dxT
du 2

H
du T  xx
 H ux



H xu   dx 
 O(3)
H uu  du

(1.34)

Bây giờ, để có đƣợc điểm dừng ta cần có f  0 , và đồng thời thành
phần thứ nhất của dL bằng 0 với mọi sự biến thiên của dx và du. Vì f  0
nên df  0 , và điều này đòi hỏi H x  0 và H u  0 nhƣ trong (1.31).
Để tìm điều kiện đủ cho điểm cực tiểu, chúng ta xét đến thành phần thứ
hai. Đầu tiên, ta cần xem mối quan hệ giữa dx và du trong (1.34). Giả sử rằng
chúng ta đang ở điểm cực trị nên H x  0 , H u  0 và df  0 . Sau đó, từ (1.33)
ta có:

dx   f x1 f u du  O(2)

(1.35)

Thay vào (1.34) ta đƣợc:
dL 



1 T
du  f uT f xT
2



H
I  xx
 H ux

H xu   f x1 f u 

 du  O(3)
H uu   I 

(1.36)

Để đảm bảo đây là điểm cực tiểu, dL trong (1.36) phải dương với mọi
sự biến thiên của du. Điều này được đảm bảo nếu như ma trận uốn với f luôn
bằng 0 là xác định dương.



f
Luu
 Luu

f



  f uT f xT

 H uu  f f
T
u

T
x

H xu

H xu   f x1 f u 


H uu   I 
 H ux f x1 f u  f uT f xT H xx f x1 f u



H
I  xx

 H ux

(1.37)

Lƣu ý rằng nếu điều kiện ràng buộc f x, u   0 với mọi x và u thì (1.37)
đƣợc rút lại thành Luu ở phƣơng trình (1.6).
Số hóa bởi Trung tâm Học liệu – ĐHTN

16




Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

Nếu (1.37) là xác định âm ( hoặc không xác định ) thì điểm dừng sẽ là
điểm cực đại ( hoặc điểm yên ngựa ).
1.2. CÁC PHƢƠNG PHÁP ĐIỀU KHIỂN TỐI ƢU
1.2.1. Phƣơng pháp biến phân cổ điển Euler_Lagrange
1.2.1.1. Giới thiệu
Nhiệm vụ của điều khiển tối ƣu là giải bài toán tìm cực trị của phiếm
hàm L[ x(t ), u(t )] bằng cách chọn tín hiệu điều khiển u(t) với những điều kiện
hạn chế của đại lƣợng điều khiển và tọa độ pha. Một trong những cơng cụ
tốn học để xác định cực trị là phƣơng pháp biến phân cổ điển
Euler_Lagrange.
Đƣờng cực trị là những hàm trơn còn phiếm hàm cùng các điều kiện
hạn chế là những hàm phi tuyến. Do đó phƣơng pháp này khơng thể áp dụng
cho những trƣờng hợp mà tín hiệu điều khiển có thể là các hàm gián đoạn.
Trƣờng hợp khơng có điều kiện ràng buộc
Cho u(t) là hàm thuộc lớp hàm có đạo hàm bậc nhất liên tục. Trong mặt

phẳng (u,t) cho hai điểm (t0,u0) và (t1,u1). Cần tìm quỹ đạo nối hai điểm này
sao cho tích phân theo quỹ đạo u  u(t ) cho bởi:
t1

J (u)   L(u, u, t )dt

(1.38)

t0

có cực trị.
L là hàm có đạo hàm riêng bậc một và bậc hai liên tục với mọi biến của
nó. Để thống nhất, ở đây ta lấy t0 = 0 và t1 = T.
Biến đổi của J do u tạo nên là:
J (u  u)  J (u  u)  J (u)
T

T

0

0

  L(u  u, u  u, t )dt   L(u, u, t )dt

Số hóa bởi Trung tâm Học liệu – ĐHTN

17





Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
T

  [ L(u  u, u  u, t )  L(u, u, t )]dt

(1.39)

0

Phân tích (1.39) theo chuỗi Taylor và chỉ khảo sát thành phần bậc một
của J ta đƣợc:
T

J (u, u)   [(
0

L(u, u, t )
L(u, u, t )
)u  (
)u ]dt
u
u

(1.40)

vì u và u liên hệ nhau bởi:
T


u (t )   u (t )dt  u (0)
0

Xem u là hàm biến đổi độc lập, biểu thức (1.40) có thể biến đổi để chỉ
chứa u bằng cách lấy tích phân những thành phần chứa u :
L(u, u, t ) T
L(u, u, t ) d L(u, u, t )
J (u, u) 
u 0   [

]udt...
u
u
dt
u
0
T

(1.41)

Từ điều kiện đã cho u(0) = (T) = 0, phần đầu của vế phải ở biểu thức
(1.41) bằng 0.
Nếu gia số J của chỉ tiêu chất lƣợng J tồn tại và nếu J có cực trị đối
với u* thì:
J (u * , u )  0

(1.42)

Đó là điều kiện cơ bản của phép tính biến phân.
Từ các biểu thức (1.41), (1.42) ta có:

T

J (u * , u)   [
0

L(u * , u * , t ) d L(u * , u * , t )

]udt  0
u
dt
u

(1.43)

Từ đó có thể rút ra phƣơng trình Euler_Lagrange:
L(u, u, t ) d L(u, u, t )

0
u
dt
u

(1.44a)

Hoặc có thể viết đơn giản:
L d L

0
u dt u
Số hóa bởi Trung tâm Học liệu – ĐHTN


(1.44b)
18




Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

Trƣờng hợp có điều kiện ràng buộc
Nếu ngồi chỉ tiêu chất lƣợng (1.38) cịn có các điều kiện ràng buộc
dạng:
 i (u , u, t )  0

t [0, T ] , i  1, n

(1.45)

thì chỉ tiêu chất lƣợng J có dạng:
T

n

0

i 1

J a (u, i )   [ L(u, u, t )   i (t ) i (u, u, t )]dt

(1.46)


mà i(t) với i = 1,2,…,n là hàm Lagrange.Vì giới hạn thỏa mãn với mọi
t nên hàm Lagrange phụ thuộc thời gian.
Tƣơng tự nhƣ trên ta có phƣơng trình Euler_Lagrange tổng quát:
La (u, u,  , t ) d La (u, u,  , t )

0
u
dt
u

(1.47)
n



La (u, u,  , t )  L(u, u, t )   i (t ) i (u, u, t ) (1.48)
i 1

Khi điều kiện ràng buộc có dạng:
T



i

(u, u, t )dt  qi

(1.49)


0

thì phƣơng trình Euler_Lagrange tổng qt (1.47) có phiếm hàm:
n


La (u, u,  , t )  L(u, u, t )   
i (u , u , t )

(1.50)

i 1

Trong trƣờng hợp này, i là các hệ số khơng phụ thuộc thời gian.
Khi có điều kiện ràng buộc dạng (1.45) hoặc (1.49) phải giải (n+1)
phƣơng trình để xác định y*(t) và i*(t) với i=1,2,…,n.
Phƣơng trình Euler_Lagrange với tín hiệu điều khiển bị hạn chế
Trong phần trên ta chỉ đề cập tới bài tốn mà trong đó tín hiệu điều
khiển khơng có giới hạn nào ràng buộc. Trong thực tế, thƣờng gặp tín hiệu
điều khiển có ràng buộc dạng u  1 .
Số hóa bởi Trung tâm Học liệu – ĐHTN

19




Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động

Điều kiện cần để có cực trị: khi u(t) là đƣờng cực trị thì u+u và u-u

là những hàm cho phép. Bây giờ ta so sánh trị số phiếm hàm ở đƣờng cực trị
với trị số của nó ở hàm u+u và u-u. Nếu miền biến đổi của u(t) là kín và
u(t) ở ngồi biên thì một trong các hàm u+u hoặc u-u sẽ ra ngoài miền cho
phép.
Một trong các biện pháp khắc phục khó khăn trên là đƣờng cực trị ở
biên và:
u   (t )

(1.51)

Ví dụ, nếu u  1 , điều kiện u   (t ) nghĩa là  (t )  1. Đổi biến ta có:
z2  u 

(1.52)

thì biến mới z sẽ khơng có điều kiện hạn chế và biên giới của biến u
T

tƣơng đƣơng với z = 0. Bây giờ chỉ tiêu chất lƣợng J (u)   L(u, u, t )dt có biến
0

mới u = z2 + , từ đó:
u  2zz  

và chỉ tiêu chất lƣợng J có dạng:
T

J   L[ z 2   ,2 zz   , t ]dt

(1.53)


0

Vì khơng có điều kiện hạn chế nên phƣơng trình Euler_Lagrange có
dạng:
L d L

0
z dt z

Ở đây

(1.54)
L L u L u L
L



2z 
2 z
z u z u z u
u
L L u L u L



2z
z u z u z u
d L
d L L

 2z(
)
2 z
dt z
dt u
u

Số hóa bởi Trung tâm Học liệu – ĐHTN

20




×