(300Кб, DOC)

УСТОЙЧИВОСТЬ. Система устойчива, если ограниченное воздействие приводит к ограниченной реакции системы. Операторный полином d a ( D) y t  b ( D) u t D  dt n n 1 a (D)  a n D  a n 1 D ... a 0 Шаг квантования 1: x ( t )  x ( t 1) - оператор Набла (сдвига) 0 – предел слева (система выключена). Она д.б. неограниченна слева. Пример: z 2  3z 1 a () x t  ( 2 3 1) x t  x ( t  2) 3x ( t 1)  x ( t ) Для непрерывных: Полином устойчивый если все его корни в левой полуплоскости. В устойчивых системах переходный процесс затухает. W(p) =Y(p)/U(p) – передаточная функция системы  t - весовая функция (p 1)B(p) - не устойчивый, т.к. p=1 вне левой полуплоскости (p 1)A(p) (p 1)B(p) - можно сократить, но пренебрегая переходным процессом. W ( p)  (p 1)A(p) Запрещается сокращать неустойчивые многочлены. W ( p)  Для дискретных: Если на границе или внутри единичного круга – не устойчивая. a () x t  0 Пример. a(z)=z-1/2 x0=1 1 1 a () x t  x t  x t  x t 1  x t  0 2 2 x0=x1/2 x1=2 x1=x2/2 x2=4 Пример: a (z)  z 2  z 1 D  3 z 1 i 3 2 2 1 i 3 1/ 4  3/ 4 1 2 Не уст. В пространстве состояний для системы с непрерывным временем: все СЗ матрицы А должны лежать в левой полуплоскости (или отрицательная вещественная часть), тогда устойчивая. x(t) – скаляр, u(t) – вход, y(t) – выход dx  D  Ax  bu dt (D  A) x  bu x  (D  A) 1 bu y t c T x t - в “c” все нули, кроме тех, что соответствуют “х” (там единицы) y t  W(D)u y W(p)  c T (p  A) 1 ( b,c,A) - реализация системы в пространстве состояний Пример: A   1 2  3 4 1  2   2  5  2  3 4     5 33 - неустойчивая 2 УПРАВЛЯЕМОСТЬ Если за конечное время систему можно перевести из начального состояние в конечное ограниченное состояние, то система управляема. x t 1  Ax t  bu t x0 x 1  Ax 0  bu 0 x 2  Ax 1  bu 1  A 2 x 0  Abu 0  bu 1 Критерий Калмана (Качмажа??): если матрица управляемости не вырождена (   0 ), то система управляема и наоборот. y  (b,Ab,...,A n 1b)  X - матрица управляемости Пример: A – диагональная b – столбец не нулевых эл-тов (A=I) => (b,b,b…)=y – неуправляемая. Пример: A   1 0   0 0 b   1   0 y  (b,Ab)   1 1  - неуправляемая  0 0 Геометрическая интерпретация неуправляемости: b Ab X – вне => неуправляемая, т.к. из плоскости нельзя вырваться. An-1b СТАБИЛИЗИРУЕМОСТЬ. Пространство состояний: b( p) T W ( p)   c (p  A) 1 b - для управляемых систем дробь несократима. a ( p) Если возможно построить такую обратную связь (ОС): u=ky, что замкнутая система устойчива, то объект стабилизируем и матрица (A,b) – стабилизируемая и наоборот. Если есть общие множители, то не стабилизируемая. Управляемая => стабилизируемая всегда, но не наоборот. Док-во: 1 .... n - собственные значения (СЗ) – сами выбираем из, например в левой полуплоскости => можно построить матрицу замкнутой системы с ОС A+kbcT, где dx  Ax  kbc T x  (A  kbc T ) x и  1 ... n  СЗ(для уст ) dt Стабилизируемая, но не управляемая:  dx 1  dt  A11x 1  A12 x 2  dx 2   A 22 x 2 dt  ( x 1 ,x 2 )  x x1 – управляемая часть x2 – неуправляемая Если A22 – устойчива, то замкнутая система стабилизируется (A11 – устойчива), то: dx  Ax dt A A  A   11 12   0 A 22  НАБЛЮДАЕМОСТЬ. По выходу нужно точно восстановить состояние. dx  Ax ( t 0 ,t 1 ) -измеряем y. Надо построить точную оценку состояния. dt y c T x Если задача разрешима, то система наблюдаема и матрица (A,c) – наблюдаема и наоборот. d2x A 2x 2 dt dx T  c Ax dt d2x T 2 c A x dt 2 d3x T 3 c A x dt 3  cT A   cT A 2   T 3  Матрица наблюдаемости:  c A   ...   c T A n 1    Критерий наблюдаемости: Если матрица наблюдаемости невырождена, система наблюдаема (можно выразить через y??). Пример: A   0 1   0 0 T c  (0,1) c A  (0,0) T b   0  1 (A,c)  0 1  - вырождена => не наблюдаема 0 0   АЛГОРИТМ НАБЛЮДАТЕЛЬ. x* - выход наблюдателя (оценка состояния х) dx *  Ax * q ( y  c T x*) (1) – правая часть - наблюдатель dt q – коэффициент усиления ( ycT x*) - невязка (ошибка восстановления) t  (2) ( t )  x ( t )  x *( t )0 dx  Ax  (1) Из dt d  A  qc T   (A  qc T ) dt Если q: (A  qc T ) - устойчивое, то наблюдатель сколь угодно точно оценивает переменную состояния (2). Можно регулировать скорость сходимости и точность с помощью СЗ 1... n Если первая компонента восстановима, а вторая – нет, то система частично ненаблюдаема. Вход наблюдателя = выход системы. Наблюдатель – человек. Алгоритм наблюдателя с управлением. К алгоритму наблюдателя добавляем компоненту управления “bu”: dx *  Ax *q ( y  c T x*)  bu (1) dt dx  Ax  bu (2) dt Проверка: из (2)-(1), тогда исчезнет bu и всё будет сходиться. При решении задачи – декомпозиция – разделение на 2 части: - моделируем, если система полностью управляема (задача синтеза регулятора) - заменяем ненаблюдаемые компоненты состояния их оценками. u y объект наблюдатель x* регулятор dx  Ax  bu  (A  Bc T ) x dt (A  Bc T ) - если объект управляем, то матрица устойчива u=cTx – стабилизация по состоянию Если состояние не полностью наблюдаемо, то u=cTx* - можем стабилизировать по выходу (y). Алгоритм наблюдателя с помехами (шум). dx  Ax  bu  F dt y cT x   CИСТЕМА УПРАВЛЕНИЯ. Состоит из объекта управления, регулятора и связей. t=0,1,2,…… u t  U t ( y 0t 1 ,u 0t 1 ,W0t ) , W – возмущение. U 0 ( t ) - стратегия управления. w u объект y регулятор Управление трёх типов: - ООС (неважна природа возмущения) - Комбинированное (в законе управления есть W) - Программное управление (индукция) как функция времени. АДАПТАЦИЯ dx  f ( x ,u ) u  k T x -управление k=k(t) dt V(x)>0 при x 0 асимптотически устойчива по Ляпунову: dV( x ) n V V du T  f k ( x,u )   f V  0 - должна убывать dt x k u dt k 1 Пример: dx  Ax V( x )  x T Lx dt AL  LA T  0 Док-во: A - гурвицова матрица – СЗ в левой полуплоскости. L – положительно определена(т.е. положительна при любом не нулевом х) dV dx T 0 xTAT dt dt T dV dx dx  Lx  x T L  x T A T LX  X T LAX  X T (A T L  LA ) x  0 x 0 dt dt dt T A L  LA  0 Чтобы адаптировать систему не обязательно знать полную инфу о системе, т.е. адаптация для целого семейства объектов. Для дискретного времени: y t  x Tt  y t - измеряемый выход x Tt - наблюдаемый вектор входов  - неизвестный вектор параметров Геометрическая иллюстрация – получить общую точку пересечения плоскостей. Алгоритм Качмажа. Последовательно  0 .... n будет сходиться к  . За N итераций можно попасть в  , если плоскости под прямым углом. a   t 1  min x Ta  y 2 t t Строим функцию Лагранжа: L(a ,)  a   t 1  ( x Tt a  y t ) 2 L 0 a L  2(a   t 1 )  x Tt  0 a  x Tt a   t 1 2 Подставляем ‘a’ в x Tt a  y y и находим коэффициент Лагранжа  . Затем  подставляем в a  x Tt   t1 и находим а. 2 … a   t 1 ...  t  t - коррекция против помех. Если  t =0 – обучение прекращается. Фактор помех устраняется временной избыточностью. y t  x Tt   e t Мe t  0 e t - белошумная последовательность. Me e2   2 ВОЗМУЩЕНИЯ. Стохастическая аппроксимация (Роббинса-Монро): x t 0   t 1 2 t   - первое условие t   - второе условие.   t 1  1 Пример:  t   t 1 t  c1 t 1 c 2  t  t  Если темп изменений велик, то может быть срыв слежения. Возмущения по темпу: - Быстрые (координатные: ветер) - Медленные (параметрические: износ инструмента) Квазистационарность – в среде изменение такие медленные, что в сравнении с координатными возмущениями ими можно пренебречь. Теория о непрерывных возмущениях: dx  f ( x ), f ( x ) - условие Лившица: f (x 2 )  f (x1 )  L x 2  x1 dt удовлетворяет). x  Возмущённая система: x  f (X)  f ( x ) f ( x ) - возмущение. (например, x не Если f ,то при  0: x  X 0 Пример: реле идеальное не удовлетворяет Лившицу (L=inf) Реальное реле удовлетворяет: L – большое. y t T x t  T - параметрическое возмущение x t - координатное возмущение Пример: y t   T x t  ku t k –коэф.усиления (известен) Цель: y t 0 1 Если  T известен, то u t    T x t (не реализуемо) k 1 Если  T не известен, то u t    Tt 1 x t k Введём новую переменную: Yt  y t  ku t Теперь в алгоритме Качмажа (см.выше) вместо yT подставляетм YT Разделение процессов во времени. Режимы: - Пакетный (через буфер) - Реального времени (Качмажа) xt yt объект ut компенсатор  t 1 идентификатор Компенсатор – блок быстрых переменных. Регулятор. Идентификатор – блок медленных переменных. Вычисляет оценки параметров в реальном времени. Идентификационный (отождествляющий) подход: - Сначала решаем задачу в полной инфе - Затем заменяем вектор-параметр оценками. Пример: х – быстрые переменные y – медленные  dx  dt  f ( x , y)  dx   F( x , y)  dt  1 Пребрегаем  : dX  f (X,Y)  F( x, y)  0   dX   f (X,G (X))  dt  Y  G ( x )   трение Теоретическое обоснование см. теорию Тихонова А.Н. РАСПОЗНАВАНИЕ ОБРАЗОВ. КЛАССИФИКАЦИЯ. Два класса задач: - В детерминистской постановке (т.е. классы разделены a priori и вероятность правильного разделения p=1) - В стохастической постановке (критерий качества: вероятность ошибки классификации). Песть существует: Тогда f ( x ): f ( x )  0, xA f ( x )  0, xB Линейное разделение: f(x)  sign(  T x   0 ) . Возможно, если “А – выше, B – ниже”, т.е. формы должны быть выкуклые. ( x ):R n  R N , N  n, чтобы F( x )   T ( x )   0 Теорема Вейерштрасса:  0  многочлен p(x): f (x)  p(x) , xk Можно построить пространство, где образы A и B разделимы. Пространство функций от признаков – спрямляющее. Если подвигать разделяющую плоскость, то она ей и останется (в детерминистской постановке) и можно за конечное число итераций разделить A и B с окрестностью  . Свойство конечной сходимости: последовательность оценок стабилизируется и есть точное разделение. Правильное гарантируется только после завершения алгоритма. МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ. ( x 1 ,....,x n )  x n p( x 1 ,....,x n |)  L k ()  - параметр (например, М или D) Функция потерь: d( ,)  0  - истинное  - оценка Средний риск: Md (,)    d  0 n Функция правдоподобия: p ( x k |) k 1 Надо искать такое  , чтобы функция правдоподобия была максимальной. L n () max - оценка метода макс.правдоподобия. Критерий Вальда: нужно осмотреть (1/e)%, чтобы выработать критерий. Пример: x k    Vk P( x |)  V ~ N(0,D) 1 2D e  ( x  ) 2 2D ( x  ) 2 ln( P( x |))  ln( ) 2D 2D 2 n ( x  )  k 2D k 1 1 n n k 1 k 1 min   ( x k  ) 2  МНКв  2( x k  )  0 n  1 x n - выборочное среднее. n Пример: Распределение Лапласа.  v p( v)  A e ln( p( v))  ln A   x k   n x k 1 k    min Центральная предельная теорема: 1 n (x k  ) ~ N(0,) n k 1 Процедура построения робастных оценок. Выборочная медиана. см. Huber Механизм огрубления метода наибольшего правдоподобия. РАЗНЫЕ ПОНЯТИЯ. Гурвицова матрица – СЗ в левой полуплоскости. Ранг: min(a,b) – a и b – кол-во ненулевых строк и столбцов. Вероятность – мера в пространстве элементарных исходов. Белый шум – процесс постоянной спектральной плотности. a priori – до опыта a posteriori – после опыта

(300Кб, DOC)

Похожие документы

Разделы

Поддержка

(300Кб, DOC)

Похожие документы

Добавить этот документ в коллекции

Добавить этот документ в сохраненные

Предложите, как улучшить StudyLib