ĐIỀU KHIỂN THÔNG MINH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.25 MB, 35 trang )

ĐIỀU KHIỂN THÔNG
MINH
NHÓM 10

HELLO!
NHÓM 10
Lê Minh Phúc
Ý
Nguyễn Tiến Hòa

Hoàng Như

ĐIỀU KHIỂN HỌC
Let’s start with the first set of
slides

Khái niệm về điều khiển học
So sánh điều khiển học và điều khiển
thích nghi
Sơ đồ khối hệ thống điều khiển học
Thực thi hệ thống điều khiển học
Các thí dụ điều khiển học dùng mạng
RBF, điều khiển học mờ

Khái niệm hệ thống điều khiển học

✘Là hệ thống có khả năng cải thiện chất

lượng điều khiển trong tương lai dựa vào:
*thông tin kinh nghiệm thu thập trong
quá khứ*
*thông qua tương tác vòng kín với đối
tượng và môi trường*

Khái niệm hệ thống điều khiển học

✘Đặc điểm của hệ thống điều khiển học:
*Có khả năng tự chủ (autonomy), vì có thể
cải thiện chất lượng của chính nó*
*Có bộ nhớ để lưu trữ thông tin quá
khứ=>cải thiện chất lượng tương lai
*Hệ thống nhận thông tin phản hồi chất
lương dựa trên một hàm mục tiêu mà hệ thống

So sánh
ĐIỀU KHIỂN HỌC
VS
ĐIỀU KHIỂN THÍCH NGHI

So sánh điều khiển học và điều khiển thích
nghi

Giống nhau
Cả 2 hệ thống đều có
thể thực thi bằng các

thuật toán chỉnh định
thông số.
Đều sử dụng thông tin
phản hồi chất lượng
qua tương tác vòng kín
với đối tượng và môi
trường.

Khác nhau
Hệ thống điều khiển
học có khả năng sử
dụng thông tin kinh
nghiệm trong quá khứ
do lưu trong bộ nhớ ->
không cần quá trình
thích nghi khi lặp lại
tình huống cũ.
Hệ thống điều khiển
thích nghi không có bộ

Sơ đồ khối
Học mục tiêu

Cơ sở
Tri thức
mục tiêu

Suy luận
mục tiêu

Học luật điều
khiển

Cơ sở
Tri thức
Điều khiển

Học mô hình
đối tượng

Cơ sở
Tri thức
Mô hình

Chọn
bộ điều khiển

Chọn
Mô hình

Bộ điều khiển

Đối tượng

Thực thi hệ
thống
 Tra bảng:
 Phân chia không gian tín hiệu vào thành các miền rời

nhau sao cho tín hiệu ra có thể được xác định bằng
cách “ tra bảng“ tương ứng với miền tín hiệu vào.
 Rất nhiều hệ thống diều khiển học được thực hiện
bằng cách này.
 Khuyết điểm : Tổ hợp các miền tín hiệu vào tăng lên
khi không gian trạng thái tăng lên hoặc số miền phân
chia mỗi chiều không gian trạng thái tăng lên .

Thực thi hệ
thống
 Xấp xỉ hàm :
 Phát triển dựa trên cấu trúc toán học có thể xấp xỉ của
một họ các hàm liên tục.
 Cấu trúc này có thể cố định hay biến đổi và có nhiều các
thông số tự do.
 Ưu điểm :
- Mô tả mộtcáchhiệu quả qua các thông số tự do.
- Cần ít bộ nhớ để biểu diễn một hàm liên tục.
- Có tính chất tổng quát hóa ( tức là nội suy giữa những
điểm tín hiệu vào ).
 Cấu trúc xấp xỉ hàm được sử dụng phổ biến : mạng thần
kinh (MLP,RBF) và mô hình mờ(mamdani ,takagisugeno)

THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF
 Đối tượng mô tả bởi mô hình toán học

 Trong đó là biến hoạch định điểm làm việc ,

giả sử thay đổi theo qui luật sau:
= rand([0,1])

THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
 Giả thiết chúng ta chỉ biết bậc của hệ
thống (bậc 2) mà không biết ảnh hưởng
của điểm làm việc đến đặc tính động học
của hệ thống như thế nào ( tức là không
cụ thể
A(v)
và khiển
B(v) phụ
thuộc
vàotín
v như
 Mục
tiêu
điều
là bám
theo
hiệu
thế nào)
vào
với đáp ứng quá độ cho trước.

THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)

 Sơ đồ khối hệ
thống điều
khiển học
trực tiếp:

Place your screenshot here

THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
✘Mô
hình chuẩn:
(s) =
 Luật điều khiển hồi tiếp
trạng thái:


độ lợi hồi tiếp trạng thái,



: độ lợi đầu vào

THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG MẠNG RBF (tt)

 Mục đích của HTĐK học
là nhận dạng và lưu trữ
vector thông số của bộ
điều khiển như hàm của

biến hoạch định điểm
làm việc:
 Mạng RBF : 1 ngõ vào
v, 3 ngõ ra k1, k2, k3
 31 tế bào thần kinh ở

Place your screenshot here

THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
✘Quá
trình học: Tại mỗi thời điểm lấy mẫu hệ thống
học thực hiện các tác vụ sau:
Đo lường biến hoạch định điểm làm việc
Đọc độ lợi điều khiển từ ngõ ra mạng RBF:
 Tính tín hiệu điều khiển hồi tiếp trạng thái:
 Xuất tín hiệu điều khiển tác động vào đối tượng
 Sai lệch giữa đáp ứng của đối tượng với tín hiệu ra
mong muốn của mô hình chuẩn được sử dụng để
cập nhật trọng số mạng RBF

THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
toán cập nhật trọng số mạng RBF:
✘Thuật



Bước 1: giá trị hiệu chỉnh độ lợi điều khiển ở ngõ ra cả

mạng RBF được tính dựa vào sai số giữa tín hiệu ra của mô
hình chuẩn và tín hiệu ra của hệ thống theo công thức:
Trong đó: là hệ số dương nhỏ

 Bước 2: các trọng số lớp ra của mạng RBF được cập nhật
bằng thuật toán suy giảm độ dốc:
= Trong đó : là ngõ ra của tế bào thần kinh thứ i ở lớp ẩn

THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
✘Mô
phỏng kết quả:
Cứ 60 chu kì lấy mẫu giá trị thay đổi
một lần
 Ba giá trị đầu tiên của được gán bằng
0.1 ; 0.3 ; 0.6
 Các giá trị sau đó được gán ngẫu nhiên
trong đoạn [0,1]

THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
✘Kết
quả học luật điều khiển : Độ lợi hồi tiếp
trạng thái (v)

THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
✘Kết
quả học luật điều khiển : Độ lợi hồi tiếp
trạng thái (v)

THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
✘Kết
quả học luật điều khiển : Độ lợi hồi tiếp
trạng thái (v)

Thí dụ điều khiển học mờ
Đối tượng:tên lửa một tầng có mô hình toán học đơn giản cho bởi phương
trình:

Thí dụ điều khiển học mờ (tt)
Sơ đồ khối hệ thống điều khiển học mờ:

Thí dụ điều khiển học mờ (tt)


Cơ chế học của hệ thống như sau:

o

Quan sát dữ liệu vào ra của hệ thống điều khiển mờ.

o

Đánh giá chất lượng của hệ thống điều khiển.

o

o

Tự chỉnh thông số bộ điều khiển mờ để đạt được chất lượng
mong muốn (chất lượng mong muốn xác định bởi mô hình
chuẩn trong sơ đồ điều khiển).
Lưu trữ tri thức (qui luật chỉnh định thông số) vào bộ nhớ.

ĐIỀU KHIỂN THÔNG MINH

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về