(300Кб, DOC)

advertisement
УСТОЙЧИВОСТЬ.
Система устойчива, если ограниченное воздействие приводит к ограниченной
реакции системы.
Операторный полином
d
a ( D) y t  b ( D) u t D 
dt
n
n 1
a (D)  a n D  a n 1 D ... a 0
Шаг квантования 1:
x ( t )  x ( t 1) - оператор Набла (сдвига)
0 – предел слева (система выключена). Она д.б. неограниченна слева.
Пример:
z 2  3z 1
a () x t  ( 2 3 1) x t  x ( t  2) 3x ( t 1)  x ( t )
Для непрерывных: Полином устойчивый если все его корни в левой полуплоскости.
В устойчивых системах переходный процесс затухает.
W(p) =Y(p)/U(p) – передаточная функция системы
 t - весовая функция
(p 1)B(p)
- не устойчивый, т.к. p=1 вне левой полуплоскости
(p 1)A(p)
(p 1)B(p)
- можно сократить, но пренебрегая переходным процессом.
W ( p) 
(p 1)A(p)
Запрещается сокращать неустойчивые многочлены.
W ( p) 
Для дискретных: Если на границе или внутри единичного круга – не устойчивая.
a () x t  0
Пример.
a(z)=z-1/2
x0=1
1
1
a () x t  x t  x t  x t 1  x t  0
2
2
x0=x1/2
x1=2
x1=x2/2
x2=4
Пример:
a (z)  z 2  z 1
D  3
z
1 i 3
2
2
1 i 3
1/ 4  3/ 4 1
2
Не уст.
В пространстве состояний для системы с непрерывным временем: все СЗ матрицы А
должны лежать в левой полуплоскости (или отрицательная вещественная часть),
тогда устойчивая.
x(t) – скаляр, u(t) – вход, y(t) – выход
dx
 D  Ax  bu
dt
(D  A) x  bu
x  (D  A) 1 bu
y t c T x t - в “c” все нули, кроме тех, что соответствуют “х” (там единицы)
y t  W(D)u y
W(p)  c T (p  A) 1
( b,c,A) - реализация системы в пространстве состояний
Пример:
A   1 2 
3 4
1  2   2  5  2
 3 4 



5 33
- неустойчивая
2
УПРАВЛЯЕМОСТЬ
Если за конечное время систему можно перевести из начального состояние в
конечное ограниченное состояние, то система управляема.
x t 1  Ax t  bu t
x0
x 1  Ax 0  bu 0
x 2  Ax 1  bu 1  A 2 x 0  Abu 0  bu 1
Критерий Калмана (Качмажа??): если матрица управляемости не вырождена (   0 ),
то система управляема и наоборот.
y  (b,Ab,...,A n 1b)  X - матрица управляемости
Пример:
A – диагональная
b – столбец не нулевых эл-тов
(A=I) => (b,b,b…)=y – неуправляемая.
Пример:
A   1 0 
 0 0
b   1 
 0
y  (b,Ab)   1 1  - неуправляемая
 0 0
Геометрическая интерпретация неуправляемости:
b Ab
X – вне => неуправляемая, т.к. из
плоскости нельзя вырваться.
An-1b
СТАБИЛИЗИРУЕМОСТЬ.
Пространство состояний:
b( p) T
W ( p) 
 c (p  A) 1 b - для управляемых систем дробь несократима.
a ( p)
Если возможно построить такую обратную связь (ОС): u=ky, что замкнутая система
устойчива, то объект стабилизируем и матрица (A,b) – стабилизируемая и наоборот.
Если есть общие множители, то не стабилизируемая.
Управляемая => стабилизируемая всегда, но не наоборот.
Док-во:
1 .... n - собственные значения (СЗ) – сами выбираем из, например в левой полуплоскости
=> можно построить матрицу замкнутой системы с ОС A+kbcT, где
dx
 Ax  kbc T x  (A  kbc T ) x и  1 ... n  СЗ(для уст )
dt
Стабилизируемая, но не управляемая:
 dx 1
 dt  A11x 1  A12 x 2
 dx
2

 A 22 x 2
dt

( x 1 ,x 2 )  x
x1 – управляемая часть
x2 – неуправляемая
Если A22 – устойчива, то замкнутая система стабилизируется (A11 – устойчива), то:
dx
 Ax
dt
A A 
A   11 12 
 0 A 22 
НАБЛЮДАЕМОСТЬ.
По выходу нужно точно восстановить состояние.
dx
 Ax ( t 0 ,t 1 ) -измеряем y. Надо построить точную оценку состояния.
dt
y c T x
Если задача разрешима, то система наблюдаема и матрица (A,c) – наблюдаема и
наоборот.
d2x
A 2x
2
dt
dx T
 c Ax
dt
d2x T 2
c A x
dt 2
d3x T 3
c A x
dt 3
 cT A 
 cT A 2 
 T 3 
Матрица наблюдаемости:  c A 
 ... 
 c T A n 1 


Критерий наблюдаемости: Если матрица наблюдаемости невырождена, система
наблюдаема (можно выразить через y??).
Пример:
A   0 1 
 0 0
T
c  (0,1)
c A  (0,0)
T
b   0 
1
(A,c)
 0 1  - вырождена => не наблюдаема
0 0
 
АЛГОРИТМ НАБЛЮДАТЕЛЬ.
x* - выход наблюдателя (оценка состояния х)
dx *
 Ax * q ( y  c T x*) (1) – правая часть - наблюдатель
dt
q – коэффициент усиления
( ycT x*) - невязка (ошибка восстановления)
t 
(2)
( t )  x ( t )  x *( t )0
dx
 Ax  (1)
Из
dt
d
 A  qc T   (A  qc T )
dt
Если q: (A  qc T ) - устойчивое, то наблюдатель сколь угодно точно оценивает
переменную состояния (2).
Можно регулировать скорость сходимости и точность с помощью СЗ 1... n
Если первая компонента восстановима, а вторая – нет, то система частично ненаблюдаема.
Вход наблюдателя = выход системы. Наблюдатель – человек.
Алгоритм наблюдателя с управлением.
К алгоритму наблюдателя добавляем компоненту управления “bu”:
dx *
 Ax *q ( y  c T x*)  bu (1)
dt
dx
 Ax  bu (2)
dt
Проверка: из (2)-(1), тогда исчезнет bu и всё будет сходиться.
При решении задачи – декомпозиция – разделение на 2 части:
- моделируем, если система полностью управляема (задача синтеза регулятора)
- заменяем ненаблюдаемые компоненты состояния их оценками.
u
y
объект
наблюдатель
x*
регулятор
dx
 Ax  bu  (A  Bc T ) x
dt
(A  Bc T ) - если объект управляем, то матрица устойчива
u=cTx – стабилизация по состоянию
Если состояние не полностью наблюдаемо, то u=cTx* - можем стабилизировать по выходу
(y).
Алгоритм наблюдателя с помехами (шум).
dx
 Ax  bu  F
dt
y cT x  
CИСТЕМА УПРАВЛЕНИЯ.
Состоит из объекта управления, регулятора и связей.
t=0,1,2,……
u t  U t ( y 0t 1 ,u 0t 1 ,W0t ) , W – возмущение.
U 0 ( t ) - стратегия управления.
w
u
объект
y
регулятор
Управление трёх типов:
- ООС (неважна природа возмущения)
- Комбинированное (в законе управления есть W)
- Программное управление (индукция) как функция времени.
АДАПТАЦИЯ
dx
 f ( x ,u ) u  k T x -управление k=k(t)
dt
V(x)>0 при x 0 асимптотически устойчива по Ляпунову:
dV( x ) n
V V du T
 f k ( x,u )

 f V  0 - должна убывать
dt
x k u dt
k 1
Пример:
dx
 Ax V( x )  x T Lx
dt
AL  LA T  0
Док-во: A - гурвицова матрица – СЗ в левой полуплоскости.
L – положительно определена(т.е. положительна при любом не нулевом х)
dV
dx T
0
xTAT
dt
dt
T
dV dx
dx

Lx  x T L  x T A T LX  X T LAX  X T (A T L  LA ) x  0 x 0
dt dt
dt
T
A L  LA  0
Чтобы адаптировать систему не обязательно знать полную инфу о системе, т.е. адаптация
для целого семейства объектов.
Для дискретного времени:
y t  x Tt 
y t - измеряемый выход
x Tt - наблюдаемый вектор входов
 - неизвестный вектор параметров
Геометрическая иллюстрация – получить общую точку пересечения плоскостей.
Алгоритм Качмажа.
Последовательно  0 .... n будет сходиться к  . За N итераций можно попасть в  , если
плоскости под прямым углом.
a   t 1 
min
x Ta  y
2
t
t
Строим функцию Лагранжа:
L(a ,)  a   t 1  ( x Tt a  y t )
2
L
0
a
L
 2(a   t 1 )  x Tt  0
a
 x Tt
a
  t 1
2
Подставляем ‘a’ в x Tt a  y y и находим коэффициент Лагранжа  .
Затем  подставляем в a 
x Tt
  t1 и находим а.
2
…
a   t 1 ...  t
 t - коррекция против помех. Если  t =0 – обучение прекращается.
Фактор помех устраняется временной избыточностью.
y t  x Tt   e t
Мe t  0
e t - белошумная последовательность.
Me e2   2
ВОЗМУЩЕНИЯ.
Стохастическая аппроксимация (Роббинса-Монро):
x t 0


t 1
2
t
  - первое условие
t
  - второе условие.


t 1

1
Пример:  t  
t 1 t

c1
t 1 c 2  t
 t 
Если темп изменений велик, то может быть срыв слежения.
Возмущения по темпу:
- Быстрые (координатные: ветер)
- Медленные (параметрические: износ инструмента)
Квазистационарность – в среде изменение такие медленные, что в сравнении с
координатными возмущениями ими можно пренебречь.
Теория о непрерывных возмущениях:
dx
 f ( x ), f ( x ) - условие Лившица: f (x 2 )  f (x1 )  L x 2  x1
dt
удовлетворяет).
x 
Возмущённая система: x  f (X)  f ( x )
f ( x ) - возмущение.
(например,
x не
Если f ,то при  0: x  X 0
Пример: реле идеальное не удовлетворяет Лившицу (L=inf)
Реальное реле удовлетворяет: L – большое.
y t T x t
 T - параметрическое возмущение
x t - координатное возмущение
Пример:
y t   T x t  ku t
k –коэф.усиления (известен)
Цель: y t 0
1
Если  T известен, то u t    T x t (не реализуемо)
k
1
Если  T не известен, то u t    Tt 1 x t
k
Введём новую переменную: Yt  y t  ku t
Теперь в алгоритме Качмажа (см.выше) вместо yT подставляетм YT
Разделение процессов во времени.
Режимы:
- Пакетный (через буфер)
- Реального времени (Качмажа)
xt
yt
объект
ut
компенсатор
 t 1
идентификатор
Компенсатор – блок быстрых переменных. Регулятор.
Идентификатор – блок медленных переменных. Вычисляет оценки параметров в реальном
времени.
Идентификационный (отождествляющий) подход:
- Сначала решаем задачу в полной инфе
- Затем заменяем вектор-параметр оценками.
Пример:
х – быстрые переменные
y – медленные
 dx
 dt  f ( x , y)
 dx
  F( x , y)
 dt
 1
Пребрегаем  :
dX  f (X,Y)
 F( x, y)  0

 dX
  f (X,G (X))
 dt
 Y  G ( x )
  трение
Теоретическое обоснование см. теорию Тихонова А.Н.
РАСПОЗНАВАНИЕ ОБРАЗОВ. КЛАССИФИКАЦИЯ.
Два класса задач:
- В детерминистской постановке (т.е. классы разделены a priori и вероятность
правильного разделения p=1)
- В стохастической постановке (критерий качества: вероятность ошибки
классификации).
Песть существует:
Тогда f ( x ):
f ( x )  0, xA
f ( x )  0, xB
Линейное разделение: f(x)  sign(  T x   0 ) . Возможно, если “А – выше, B – ниже”, т.е.
формы должны быть выкуклые.
( x ):R n  R N , N  n, чтобы F( x )   T ( x )   0
Теорема Вейерштрасса:
 0  многочлен p(x): f (x)  p(x) , xk
Можно построить пространство, где образы A и B разделимы. Пространство функций от
признаков – спрямляющее. Если подвигать разделяющую плоскость, то она ей и останется
(в детерминистской постановке) и можно за конечное число итераций разделить A и B с
окрестностью  .
Свойство конечной сходимости: последовательность оценок стабилизируется и есть
точное разделение. Правильное гарантируется только после завершения алгоритма.
МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ.
( x 1 ,....,x n )  x n
p( x 1 ,....,x n |)  L k ()
 - параметр (например, М или D)
Функция потерь: d( ,)  0
 - истинное
 - оценка
Средний риск: Md (,)
   d  0
n
Функция правдоподобия:
p ( x
k
|)
k 1
Надо искать такое  , чтобы функция правдоподобия была максимальной.
L n () max - оценка метода макс.правдоподобия.
Критерий Вальда: нужно осмотреть (1/e)%, чтобы выработать критерий.
Пример:
x k    Vk
P( x |) 
V ~ N(0,D)
1
2D
e

( x  ) 2
2D
( x  ) 2
ln( P( x |))  ln(
)
2D
2D
2
n
( x  )
 k
2D
k 1
1
n
n
k 1
k 1
min   ( x k  ) 2  МНКв  2( x k  )  0
n 
1
x n - выборочное среднее.
n
Пример:
Распределение Лапласа.
 v
p( v)  A e
ln( p( v))  ln A   x k  
n
x
k 1
k
   min
Центральная предельная теорема:
1 n
(x k  ) ~ N(0,)
n k 1
Процедура построения робастных оценок.
Выборочная медиана.
см. Huber
Механизм огрубления метода наибольшего правдоподобия.
РАЗНЫЕ ПОНЯТИЯ.
Гурвицова матрица – СЗ в левой полуплоскости.
Ранг: min(a,b) – a и b – кол-во ненулевых строк и столбцов.
Вероятность – мера в пространстве элементарных исходов.
Белый шум – процесс постоянной спектральной плотности.
a priori – до опыта
a posteriori – после опыта
Download