ĐIỀU KHIỂN THÔNG
MINH
NHÓM 10
HELLO!
NHÓM 10
Lê Minh Phúc
Ý
Nguyễn Tiến Hòa
Hoàng Như
ĐIỀU KHIỂN HỌC
Let’s start with the first set of
slides
Khái niệm về điều khiển học
So sánh điều khiển học và điều khiển
thích nghi
Sơ đồ khối hệ thống điều khiển học
Thực thi hệ thống điều khiển học
Các thí dụ điều khiển học dùng mạng
RBF, điều khiển học mờ
Khái niệm hệ thống điều khiển học
✘Là hệ thống có khả năng cải thiện chất
lượng điều khiển trong tương lai dựa vào:
*thông tin kinh nghiệm thu thập trong
quá khứ*
*thông qua tương tác vòng kín với đối
tượng và môi trường*
Khái niệm hệ thống điều khiển học
✘Đặc điểm của hệ thống điều khiển học:
*Có khả năng tự chủ (autonomy), vì có thể
cải thiện chất lượng của chính nó*
*Có bộ nhớ để lưu trữ thông tin quá
khứ=>cải thiện chất lượng tương lai
*Hệ thống nhận thông tin phản hồi chất
lương dựa trên một hàm mục tiêu mà hệ thống
So sánh
ĐIỀU KHIỂN HỌC
VS
ĐIỀU KHIỂN THÍCH NGHI
So sánh điều khiển học và điều khiển thích
nghi
Giống nhau
Cả 2 hệ thống đều có
thể thực thi bằng các
thuật toán chỉnh định
thông số.
Đều sử dụng thông tin
phản hồi chất lượng
qua tương tác vòng kín
với đối tượng và môi
trường.
Khác nhau
Hệ thống điều khiển
học có khả năng sử
dụng thông tin kinh
nghiệm trong quá khứ
do lưu trong bộ nhớ ->
không cần quá trình
thích nghi khi lặp lại
tình huống cũ.
Hệ thống điều khiển
thích nghi không có bộ
Sơ đồ khối
Học mục tiêu
Cơ sở
Tri thức
mục tiêu
Suy luận
mục tiêu
Học luật điều
khiển
Cơ sở
Tri thức
Điều khiển
Học mô hình
đối tượng
Cơ sở
Tri thức
Mô hình
Chọn
bộ điều khiển
Chọn
Mô hình
Bộ điều khiển
Đối tượng
Thực thi hệ
thống
Tra bảng:
Phân chia không gian tín hiệu vào thành các miền rời
nhau sao cho tín hiệu ra có thể được xác định bằng
cách “ tra bảng“ tương ứng với miền tín hiệu vào.
Rất nhiều hệ thống diều khiển học được thực hiện
bằng cách này.
Khuyết điểm : Tổ hợp các miền tín hiệu vào tăng lên
khi không gian trạng thái tăng lên hoặc số miền phân
chia mỗi chiều không gian trạng thái tăng lên .
Thực thi hệ
thống
Xấp xỉ hàm :
Phát triển dựa trên cấu trúc toán học có thể xấp xỉ của
một họ các hàm liên tục.
Cấu trúc này có thể cố định hay biến đổi và có nhiều các
thông số tự do.
Ưu điểm :
- Mô tả mộtcáchhiệu quả qua các thông số tự do.
- Cần ít bộ nhớ để biểu diễn một hàm liên tục.
- Có tính chất tổng quát hóa ( tức là nội suy giữa những
điểm tín hiệu vào ).
Cấu trúc xấp xỉ hàm được sử dụng phổ biến : mạng thần
kinh (MLP,RBF) và mô hình mờ(mamdani ,takagisugeno)
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF
Đối tượng mô tả bởi mô hình toán học
Trong đó là biến hoạch định điểm làm việc ,
giả sử thay đổi theo qui luật sau:
= rand([0,1])
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
Giả thiết chúng ta chỉ biết bậc của hệ
thống (bậc 2) mà không biết ảnh hưởng
của điểm làm việc đến đặc tính động học
của hệ thống như thế nào ( tức là không
cụ thể
A(v)
và khiển
B(v) phụ
thuộc
vàotín
v như
Mục
tiêu
điều
là bám
theo
hiệu
thế nào)
vào
với đáp ứng quá độ cho trước.
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
Sơ đồ khối hệ
thống điều
khiển học
trực tiếp:
Place your screenshot here
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
✘Mô
hình chuẩn:
(s) =
Luật điều khiển hồi tiếp
trạng thái:
độ lợi hồi tiếp trạng thái,
: độ lợi đầu vào
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG MẠNG RBF (tt)
Mục đích của HTĐK học
là nhận dạng và lưu trữ
vector thông số của bộ
điều khiển như hàm của
biến hoạch định điểm
làm việc:
Mạng RBF : 1 ngõ vào
v, 3 ngõ ra k1, k2, k3
31 tế bào thần kinh ở
Place your screenshot here
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
✘Quá
trình học: Tại mỗi thời điểm lấy mẫu hệ thống
học thực hiện các tác vụ sau:
Đo lường biến hoạch định điểm làm việc
Đọc độ lợi điều khiển từ ngõ ra mạng RBF:
Tính tín hiệu điều khiển hồi tiếp trạng thái:
Xuất tín hiệu điều khiển tác động vào đối tượng
Sai lệch giữa đáp ứng của đối tượng với tín hiệu ra
mong muốn của mô hình chuẩn được sử dụng để
cập nhật trọng số mạng RBF
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
toán cập nhật trọng số mạng RBF:
✘Thuật
Bước 1: giá trị hiệu chỉnh độ lợi điều khiển ở ngõ ra cả
mạng RBF được tính dựa vào sai số giữa tín hiệu ra của mô
hình chuẩn và tín hiệu ra của hệ thống theo công thức:
Trong đó: là hệ số dương nhỏ
Bước 2: các trọng số lớp ra của mạng RBF được cập nhật
bằng thuật toán suy giảm độ dốc:
= Trong đó : là ngõ ra của tế bào thần kinh thứ i ở lớp ẩn
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
✘Mô
phỏng kết quả:
Cứ 60 chu kì lấy mẫu giá trị thay đổi
một lần
Ba giá trị đầu tiên của được gán bằng
0.1 ; 0.3 ; 0.6
Các giá trị sau đó được gán ngẫu nhiên
trong đoạn [0,1]
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
✘Kết
quả học luật điều khiển : Độ lợi hồi tiếp
trạng thái (v)
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
✘Kết
quả học luật điều khiển : Độ lợi hồi tiếp
trạng thái (v)
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
✘Kết
quả học luật điều khiển : Độ lợi hồi tiếp
trạng thái (v)
Thí dụ điều khiển học mờ
Đối tượng:tên lửa một tầng có mô hình toán học đơn giản cho bởi phương
trình:
Thí dụ điều khiển học mờ (tt)
Sơ đồ khối hệ thống điều khiển học mờ:
Thí dụ điều khiển học mờ (tt)
Cơ chế học của hệ thống như sau:
o
Quan sát dữ liệu vào ra của hệ thống điều khiển mờ.
o
Đánh giá chất lượng của hệ thống điều khiển.
o
o
Tự chỉnh thông số bộ điều khiển mờ để đạt được chất lượng
mong muốn (chất lượng mong muốn xác định bởi mô hình
chuẩn trong sơ đồ điều khiển).
Lưu trữ tri thức (qui luật chỉnh định thông số) vào bộ nhớ.