Лекция 3. Анализ характеристик случайных процессов Выбор структуры математических моделей, определение их параметров связано с анализом случайных величин и процессов. Поэтому в данной главе кратко рассмотрены характеристики случайных величин и методы получения их параметров. 1.1. Случайные величины и процессы Случайной является величина, которая в результате опыта, проводимого в постоянных условиях, является не постоянной, а принимает одно из множества возможных значений [15-24]. Это обусловлено влиянием факторов, не поддающихся контролю. Исследование закономерностей изменения случайных величин производится методами теории вероятностей и математической статистики. Вероятность принятия случайной величиной какого-то значения оценивается относительной частотой его появления, равной отношению количества k принятия случайной величиной данного значения, например, x x1 к полному числу экспериментов N : p( x1 ) k . N (18) Если эксперименты или другие достаточно веские соображения позволяют сделать вывод, что при бесконечном увеличении количества опытов относительная частота принятия случайной величиной какого-либо значения, например x x1 , стабилизируется около постоянного числа, то данное число рассматривается как вероятность данного события [20]. С понятием случайной величины обычно связывают объект исследования, результат которого выражается числом, например, рост, масса студентов 2 курса. Основной их особенностью является независимость результата текущего эксперимента от результатов предыдущих экспериментов. Особенностью режимных параметров, характеристик полуфабрикатов, готовой продукции промышленных объектов исследования является то, что они вследствие изменения характеристик исходных материалов, режимных параметров и других неконтролируемых факторов изменяются случайным образом во времени, т.е. являются функциями времени. Случайные функции времени называются случайными процессами и для их анализа применяется теория случайных процессов [40-49]. Особенностью случайных процессов является зависимость текущих значений случайной величины от предыдущих. В отличие от случайных величин, характеристики которых анализируются по множеству, характеристики случайных процессов анализируются в основном по времени. 1.2. Функции распределения случайных величин и процессов Для полного описания случайной величины необходимо указать все возможные значения, которые она может принять, и вероятность принятия ею каждого значения. Эти данные представляются в виде таблицы или графика и называются функцией распределения случайной величины. Для дискретной случайной величины функция распределения может описать все множество возможных значений случайной величины и вероятность появления каждого значения [15-24]. Для непрерывной случайной величины все множество возможных значений является бесконечным. Поэтому вероятность появления конкретного значения равна нулю, что, однако, не означает невозможности этого события при проведении экспериментов. Построить таблицу со всеми возможными значениями случайной величины, как для дискретного случая, невозможно. Поэтому строят таблицу с интервалами значений случайной величины и вероятностями попадания случайной величины в эти интервалы. Для аналитического описания вероятности непрерывной случайной величины используется плотность распределения вероятностей непрерывных величин f (x) которую также называют дифференциальной функцией рапределения. Интеграл от дифренциальной функции распределения в пределах некоторого диапазона случайной переменной равен вероятности попадания случайной величины в этот диапазон и показывает, какая доля значений случайной величины приходится на данный диапазон. Интеграл от дифференциальной функции распределения, описывающий вероятность принятия случайной величиной значения меньшего наперед заданного значения, например x1 , называется интегральной функцией распределения F (x) x1 F ( x) f ( x)dx . (19) Практически интегральная функция F (x) показывает какую долю составляют значения, меньшие или равные заданному значению x1 . Знание дифференциальной или интегральной функций распределения позволяет определить вероятность нахождения случайной величины в коридоре x1 x x2 по выражениям x2 Fx1 , x2 f ( x)dx или Fx1 , x2 F ( x2 ) F ( x1 ) . (20) x1 Примечание: включение или не включение в рассматриваемый диапазон границ интервала a x b или a x b в данном случае не имеет значения, так как вероятность конкретного значения непрерывной случайной величины равна нулю, т.е. f (a) f (b) 0 . Значения дифференциальной и интегральной функций различных законов распределения случайной величины сведены в статистические таблицы. На компьютерах в математических пакетах для их вычисления имеются специальные операторы. 1.3. Количественные характеристики случайных величин и процессов На практике при работе со случайными величинами и процессами часто нет необходимости знать закон распределения случайной величины, а достаточно знать некоторые количественные характеристики, которые позволяют описать поведение случайных величин и прогнозировать их поведение во времени. При этом нельзя точно спрогнозировать конкретные значения случайной величины во времени, но с достаточной для практики точностью можно спрогнозировать верхние и нижние границы коридора, в пределах которого случайная величина будет изменяться, что часто достаточно для управления технологическими процессами и получения высококачественной продукции. Наиболее широко используются следующие четыре характеристики [15-24]: 1) математическое ожидание ; 2) дисперсия 2 ; 3) корреляционная функция R( ) ; 4) спектральная плотность S ( ) . Названные выше характеристики случайных процессов являются теоретическими характеристиками, описывающими все множество случайных величин, которая называется генеральной совокупностью. Их значения получить сложно или невозможно и на практике пользуются их оценками, полученными на основании экспериментальных выборок, являющихся частью генеральных совокупностей случайной величины. Условно говоря, оценки являются результатами «измерений» характеристик случайной величины, которые отличаются от фактических (теоретических) характеристик. Математическое ожидание и его оценка – среднее x характеризуют уровень, вокруг которого x(t) колеблется случайная x величина. Среднее значение x1(t) (t) случайной величины x1 определяется по выражению N xi x x2 2 x2(t) t i 1 N . (21) Здесь – объем N выборки (количество экспериментальных данных). Рис. 15. Случайные процессы с различными средними На рис. 15 приведены два случайных процесса с различными средними значениями. 2 Дисперсия является характеристикой ширины коридора колебания случайной величины. Экспериментальная оценка дисперсии s 2 определяется по выражению N ( xi s2 x)2 . i 1 N 1 (22) Корень квадратный из 2 дисперсии называется x(t ) средним квадратическим x 1 (t) отклонением. Знание среднего квадратического отклонения или его оценки позволяет s s2 непосредственно определить ширину t x 2 (t) коридора, в котором с заданной вероятностью находится Рис. 16. Случайные процессы исследуемая случайная величина. На с различными дисперсиями рис. 16 приведены два случайных процесса с одинаковыми средними значениями и различными дисперсиями. Спектральные характеристики случайных процессов. На рис. 17 приведены графики трех случайных процессов x1 (t ), x2 (t ), x3 (t ) не отличающихся своими средними значениями, дисперсиями и законами распределения. Но они отличаются скоростью изменения случайных величин во времени. Это определяется тем, что они имеют различные гармонические (спектральные) составляющие. Эти свойства случайных процессов необходимо учитывать при анализе технологических процессов и систем управления, т.к. сигналы с x 1(t) различными частотами проходят через технологические процессы и отрабатываются t системами управления согласно частотным x 2(t) характеристикам. Для учета этих свойств используются две взаимосвязанные характеристики: корреляционная функция и спектt x 3(t) ральная плотность. Корреляционная функция T Rxx ( ) 1 x(t ) x(t T 0 )dt описывает степень связи между значениями случайного процесса, сдвинутыми одно относительно другого на величину . Оценка корреляционной функции дискретной выборки x(k ) случайного процесса x(t ) с периодом T0 x( k ) x(t ), при t kT0 , k t t t+1 t+2 t+3 Рис. 17. Случайные процессы с различными частотными составляющими (23) 0,1, 2, ..., N определяется по выражению Rxx ( p) (24) N p 1 N p ( x(k ) x ) ( x(k k 0 p) x ) , p 0,1, 2, ...N / 4 Rx(τ) На рис. 18 приведены графики корреляционных Rx3 функций Rxx( ) данных Rx1 Rx2 временных рядов. Первый временной ряд x1 во времени изменяется быстро, для него корреляционная связь между t1 t2 t3 сечениями быстро убывает; для второго эта связь убывает Рис. 18. Корреляционные функции случайных медленнее; для третьего еще процессов с различными частотными медленнее. Чем медленнее составляющими случайный процесс x, тем больше время затухания корреляционной функции t3 > t2 > t1. Следовательно, время затухания корреляционной функции является количественной характеристикой скорости изменения случайного процесса и характеризует наличие различных спектральных составляющих. Спектральная плотность есть прямое преобразование Фурье от корреляционной функции x(t) S( ) R( ) e j dt 2 R( ) cos tdt. (25) x(t) 0 x t x t x нч t x сч t x вч t Рис. 19. Разложение случайного процесса на спектральные составляющие Спектральная плотность [18-20, 44-49] имеет простой физический смысл. Случайный сигнал x(t ) практически всегда можно представить в виде суммы нескольких компонент (рис. 19): x – среднее значение; xнч (t ) – низкочастотная составляющая; xcч (t ) – среднечастотная составляющая; xвч (t ) – высокочастотная составляющая. Дисперсия равна сумме x(t ) 2 2 3 2 дисперсий компонент x нч сч вч . Построим следующий график (рис. 20). По оси абсцисс отложим частоту составляющих, а по оси ординат – их дисперсию. Мы получили распределение дисперсии процесса x(t ) по частотам. Это и есть спектральная плотность. Площадь под кривой спектральной плотности S ( ) равна дисперсии случайного процесса s x2 (26) 1 2 S ( )d 0 Дисперсия по определению – среднее значение квадрата отклонения случайной величины от среднего значения. Это означает, что спектральная плотность показывает распределение мощности случайного процесса по частотам. Покажем, что квадрат физической величины отображает мощность этой величины на примере простой электрической схемы. Рассмотрим мощность, выделяющуюся в электрической цепи на сопротивлении R 1Ом. P UI I 2R k1 I 2 (27) 2 P UI U R k 2U 2 S( ) Мощность электрического σсч тока пропорциональна квадрату тока или напряжения. Следовательно, σнч σвч дисперсия характеризует мощность переменной составляющей случайного процесса, а спектральная плотность S( ) показывает, какие нч сч нч частотные составляющие есть в Рис. 20 Спектральная плотность – распределение сигнале и как мощность случайного процесса распределена по частотам. мощности случайного процесса по частоте Корреляционные функции и спектральные плотности имеют широкое применение, т.к. они позволяют анализировать прохождение случайных сигналов через динамические звенья. Так, при подаче на вход сигнала, равного автокорреляционной функции входного случайного процесса, на выходе будет сигнал, равный взаимокорреляционной функции входного и выходного случайных процессов, а спектральные плотности выходного и входного случайных процессов связаны квадратом модуля частотной характеристики динамического звена. Основные характеристики случайных процессов и формулы для их расчета приведены в табл. 2. Таблица 2 Основные характеристики случайных процессов Теоретическая характеристика Экспериментальная оценка Дифференциальная функция Гистограмма – диаграмма относительных частот экспериментальных значений f (x) , распределения для попадания случайной величины в частичные интервалы. В нормального распределения f ( x) (x 1 f( , ) e 2 Интегральная функция )2 2 2 a распределения F (a) f ( x)dx , пакете «Анализ данных» электронных таблиц Excel имеется специальная программа. Многоугольник накопленных частот (огива). В пакете «Анализ данных» электронных таблиц Excel имеется специальная программа. для нормального распределения )2 (x a 1 2 F (a ) e 2 dx 2 Математическое ожидание 2 2 Оценка дисперсии s 2 T 1 ( x(t ) x )(x(t T0 ) x )dt Спектральная плотность S ( ) R( ) e j d x)2 i 1 n 1 Оценка корреляционной функции дискретной выборки случайного процесса x(t ) x(k ) x(t ), при t kT0 , k 0,1, 2, ..., N R xx ( p ) S( ) n ( xi Корреляционная функция Rxx ( ) Rxx ( ) i 1 n ) 2 f ( x)dx (x xi Среднее значение x xf ( x)dx Дисперсия n N p 1 N p ( x(k ) x ) ( x(k p) x ) , k 0 p 0,1, 2, ...N / 4 Оценка спектральной плотности S ( ) 2 R( ) cos t d В математических пакетах есть команды для расчета спектральных плотностей. 1.4. Предварительный графический анализ случайных процессов Предварительную оценку характеристик случайного процесса можно сделать непосредственно по его графику. Такой анализ позволяет получить предварительную оценку среднего значения случайного процесса x ; определить максимальное и минимальное значения случайной величины и по ним определить ширину коридора колебаний случайного процесса; определить оценку СКО случайного процесса s из условия, что 99,7 % значений случайного процесса находится в коридоре x 3 (или 95% в коридоре x 2 ), выявить и оценить характеристики основных спектральных составляющих случайного процесса. На рис. 21 представлен график случайного процесса результатов испытаний готовых резинотехнических изделий на разрывную прочность. Проведем предварительный анализ данного случайного процесса. 1. Визуально проведем прямую линию среднего значения. Получим оценку на уровне 560 кгс. 2. Найдем оценки максимального и минимального значений (1-5% максимальных и минимальных значений можно не учитывать, т.к. они выходят за 99,7 или 95% коридор) X min 300 кгс, X max 800 кгс. Рис. 21. Временной ряд разрывного усилия резинотехнических изделий 3. Определяем оценку СКО случайного процесса из условия, что случайная величина находится в коридоре 3s от среднего значения s 500 6 85 кгс . 4. Проводим линию текущего среднего, которая показывает наличие низкочастотной составляющей. 5. Проводим линию среднечастотных колебаний прочности вокруг линии текущего среднего. 6. Колебание прочности вокруг среднечастотной составляющей на данном этапе можно рассматривать как высокочастотную составляющую. 7. Низкочастотная составляющая колеблется в диапазоне 500 600 кгс , следовательно ее СКО равно sнч 17 кгс. 75 кгс , 8. Среднечастотная составляющая колеблется в диапазоне следовательно ее СКО равно sнч 25 кгс. 9. Среднеквадратическое отклонение высокочастотной составляющей определим из условия равенства дисперсии суммы составляющих сумме 2 2 2 2 дисперсий составляющих s sнч sсч sвч . 2 2 sсч 852 172 252 7225кгс2 , отсюда sвч 79 кгс . Тогда sвч2 s 2 sнч Более подробно анализ случайных процессов производится в приложении 1. 1.5. Нормальные случайные процессы В природе и технике случайные величины, как правило, являются результатом влияния большого количества неконтролируемых факторов. Такие процессы характеризуются колоколообразными функциями распределения и называются нормальными или гауссовыми случайными процессами [15-24, 4049]. Нормальные случайные процессы имеют широкое распростронение и знание их основных параметров важно для выявления закономерностей технологических процессов, разработки эффективных систем управления, решения задач получения качественных показателей готовой продукции в условиях действия случайных воздействий. 1.5.1. Дифференциальная функция распределения нормальной случайной величины Нормальный случайный процесс имеет дифференциальную функцию распределения, описываемую выражением Гусса f ( x) (x 1 f( , ) 2 e )2 2 2 , (28) где x, , 2 – соответственно текущее значение случайной величины, математическое ожидание, дисперсия. Графики дифференциальной и интегральной функций распределения гауссова случайного процесса для 20, 4 приведены на рис. 22. Положение центра функции распределения определяется математическим ожиданием (средним значением x ). При изменении математического ожидания b a f(x) 0,10 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,02 0,01 0,00 F(x) 1,0 F(x) μ=20 µ=20 σ=4 ?=4 0,8 f(x) 0,6 0,4 0,2 x 0 5 10 15 20 25 30 35 0,0 40 Рис. 22. Нормальный закон распределения дифференциальная функция распределения смещается. Ширина распределения (диапазон изменения случайной величины) определяется дисперсией 2 2 случайной величины (оценкой дисперсии s ). При увеличении дисперсии ширина диапазона возможных значений случайной величины по оси x расширяется, а высота функции распределения уменьшается, т.к. площадь под линией f (x) равна вероятности принятия случайной величиной какого-то значения из всего возможного диапазона и всегда равна 1 p f ( x)dx 1 . , (29) Вероятность принятия случайной величиной значения из диапазона [a, b] , т.е. a x b определяется площадью трапеции под дифференциальной функцией распределения в пределах [a, b] b f ( x)dx . pa ,b a (30) 1.5.2. Интегральная функция распределения случайной величины Интегральная функция распределения является интегралом от дифференциальной функции распределения с неограниченным нижним и заданным верхним пределами, например, для x a F (a) a f ( x)dx (см. рис. 22). Она определяет вероятность нахождения случайной величины на интервале от до величины a и определяется площадью под дифференциальной функцией S a слева от величины a . При изменении величины a от до F (a ) изменяется от 0 до 1 (см. рис. 22). 1.5.3. Вероятность нахождения случайной величины в заданном коридоре Вероятность нахождения случайной величины на отрезке [a, b] определяется площадью трапеции под дифференциальной функцией распределения или разностью площадей S b и S a под интегральной функцией распределения, что соответствует разности интегральных функций распределения p a ,b S b S a F (b) F (a ) . (31) В качестве примера найдем вероятность нахождения нормальной случайной величины в диапазоне 15 x 25 при 20, 4. 25 b f ( x)dx; p15, 25 pa ,b a 1 15 4 2 e ( x 20 ) 2 32 dx (32) 1 вариант расчета. Находим интеграл от дифференциальной функции распределения в MathCAD p15, 25 25 1 15 4 2 e ( x 20) 2 2 42 dx , p15, 25 0,789 . (33) 2 вариант расчета. Используем интегральную функцию распределения p a ,b Fa ,b F (b) F (a ) . (34) По интегральной функции (см. рис. 22) находим: p15 F (0 x 15) 0.11 , p25 F (0 x 25 ) 0.9 . Тогда вероятность p15, 25 F (25 ) F (15 ) 0.9 0.11 0.79 , что совпадает с решением, полученным в MathCAD. Ширину коридора изменения случайной величины удобно выражать в среднеквадратических отклонениях, что практически сразу позволяет определить вероятность нахождения случайной величины в используемых на практике диапазонах. Для нормальной случайной величины в коридоре x находятся 68,3 значений. Соответственно, в коридорах x 2 и x 3 находятся 95,5 и 99,7 % значений случайной величины (см. рис. 23). x x x 3 99.7% x 2 68% 95% x x f(x) x x 2 x 3 t Рис. 23. Нормальный случайный процесс и функция распределения с 68-, 95- и 99,7-процентными доверительными интервалами Эта зависимость позволяет решить обратную задачу: по оценке дисперсии при заданной доверительной вероятности определить ширину коридора изменения случайной величины. Например, при 99.7 % 4 случайной величины находится в коридоре 3 x 3 , т.е. 12 . 1.5.4. Расчет количественных характеристик и функций распределения случайной величины в Excel [23, 24, 50-56] 1. Количественные оценки математического ожидания, дисперсии, стандартного отклонения случайных величин находятся в Excel путем выделения столбцов или строк значений случайной величины и применения статистических функций СРЗНАЧ, ДИСП, СТАНДОТКЛОН. Например, для расчета среднего значения используется последовательность команд: fx / статистические/ СРЗНАЧ. 2. Дифференциальная функция нормального закона распределения в Excel определяется по выражению: f ( x) НОРМРАСП( x, , ,0), где x, , ,0 , соответственно, значение случайной величины, для которого находится функция распределения, математическое ожидание, среднеквадратическое отклонение (или их оценки), 0 – код расчета дифференциальной функции распределения. 3. Значение интегральной функции нормального закона распределения находится по выражению F ( x) НОРМРАСП( x, , ,1) , где x, , те же параметры, 1 – код расчета интегральной функции распределения. 4. Определение вероятности нахождения случайной величины в заданном диапазоне. Рассмотрим пример определения вероятности нахождения случайной величины в диапазоне 15 x 25 из раздела 3 путем использования функций Excel F ( x2 ) НОРМРАСП( x2 , , ,1) НОРМРАСП(25,20,4,1) 0,894; F ( x1 ) НОРМРАСП( x1 , , ,1) НОРМРАСП(15,20,4,1) 0,105; p( x1 , x2 ) 0,894 0,105 0,789, что совпадает с решением задачи в MathCAD. 1.6. Нахождение диапазонов изменения случайной величины, соответствующих заданным значениям вероятности [15-24] При нахождении параметров модели часто требуется решить обратную задачу – определить границы диапазона изменения случайной величины x1 a, x2 b , внутри которого находится заданная доля значений случайной величины. Для определения левой и правой границы искомого диапазона используется функция, обратная интегральной функции распределения. Значения случайной величины a, b , соответствующие левой и правой границам искомого диапазона, называются квантилями (квантиль – женского рода). Методика определения диапазона случайной величины, соответствующего заданному значению вероятности, заключается в следующем: 1. Из условий решемой задачи задается значение вероятности, например p 0,99 . Это означает, что 99% значений случайной величины должны находиться в искомом диапазоне ее изменения. 2. Находится уровень значимости 1 p , показывающий, какая часть значений случайной величины относится к незначимой и находится за пределами рассматриваемого коридора. 3. Находятся значения интегральной функции распределения для минимальной и максимальной границ искомого диапазона изменения случайной величины (для левой и правой квантилей). При симметричной функции распределения неучитываемые значения обычно одинаково распределяются за левой и правой квантилями случайной величины. Тогда значение интегральной функции распределения F (x) , соответствующей левой границе интервала, т.е. левой квантили a , равна F (a) F (b) 1 2 2 , а правой квантили . 4. Используя обратную функцию нормального распределения, находят левую и правую квантили. a НОРМОБР( ; ; ) , 2 b НОРМОБР(1 2 ; ; ) 5. Искомый диапазон возможного изменения случайной величины равен a x b. В этом интервале находится доля значений случайной величины, соответствующая заданному значению вероятности. Для наглядности определим ширину коридора, в котором находится 95% случайной величины, на графике. Для этого вертикальной линией a на интегральной функции распределения (рис. 24) отсечем слева значения случайной величины на уровне 2,5% (точка А соответствует F ( ) F (0,025) ) и 2 по оси абсцисс найдем значение нижней границы a 12 . Аналогично линией b отсечем справа значения случайной величины на уровне 97,5% (точка В соответствует F (1 2 ) F (1 0,025) F (0,975) ) и по оси абсцисс найдем значение верхней границы b 28 . Следовательно, с 95% вероятностью случайная величина находится в коридоре 12 x 28 . Более точно искомый интервал определяется расчетным путем. В электронных таблицах Excel интервал изменения случайной величины можно определить путем использования команд обратного распределения: a НОРМОБР( , , ) 2 b НОРМОБР(1 2 НОРМОБР(0.025,20,4) 12,16 , , ) НОРМОБР(0.975,20,4) 27,84 Следовательно, с 95% вероятностью 12,16 x 27,84 . Подробно анализ характеристик нормальных случайных процессов в системе Excel рассмотрен в лабораторной работе в приложении 2. 1.7. Анализ точности и надежности статистических оценок характеристик случайных величин Каждая оценка характеристики случайной величины, например, среднее значение, оценка дисперсии, оценка коэффициента математической модели и т.д., зависит от условий, при которых получены экспериментальные данные, и является случайной величиной. Поэтому, как все случайные величины, оценки имеют весь спектр статистических характеристик – математическое ожидание, дисперсию, корреляционную функцию и т.д. При определении оценок всех характеристик необходимо оценить их точность и надежность. 1.7.1. Показатели точности и надежности оценок [15-24] Пусть получена оценка а * неизвестной характеристики случайной величины a . Чем точнее определена оценка, тем меньше абсолютная величина разности а а * . Если определено положительное число , то 0 и а а* величина является характеристикой точности оценки [21]. Т.к., оценка является случайной величиной, выполнение условия для конкретного значения оценки а * не позволяет утверждать, что а а* для всех реализаций оценки это условие выполняется. Можно лишь говорить о доверительной вероятности p , с которой это неравенство выполняется. Запишем неравенство по абсолютной величине в виде двойного неравенства P(а * а a * ) p , которое читается следующим образом: вероятность того, что интервал (а * , a * ) накроет истинное значение характеристики a равна p . Данный интервал называется доверительным интервалом. Он является количественным показателем точности полученной оценки. Показателем надежности оценки является доверительная вероятность p . Обычно при анализе вначале задается доверительная вероятность, для нее определяется доверительный интервал, который с заданной вероятностью накрывает истинное значение искомой характеристики. 1.7.2. Определение доверительных интервалов оценок Между процессами измерения и получения оценок характеристик случайной величины можно провести аналогию. Пусть стоит задача измерения температуры какого-то объекта. Возьмем серию термометров с различными классами точности, например, 1 0,1; 2 0,5; 3 1 и измерим температуру. Допустим, что результаты измерения равны T1 , T2 , T3 . Вследствие наличия ошибок измерения ни один из приборов не показал истинное значение температуры. При отсутствии систематической ошибки класс точности показывает значение случайной ошибки в процентах от шкалы измерения прибора. Ошибка каждого прибора равна ширине коридора колебания случайной составляющей, который при нормальном законе распределения с 99, 7% вероятностью составляет 3 , т.е. ошибка прибора связана со средним квадратическим отклонением случайной ошибки правилом «трех сигм». Истинное значение температуры находится в пределах T1 1 T T1 1 T2 T T2 T3 T T3 2 2 3 3. Вернемся к постановке задачи и скорректируем ее. Для каждого процесса можно назвать допустимую точность измерения температуры, которая не повлияет на процесс принятия решения по результатам измерения. Например, температуру в офисе достаточно оценить с точностью 10 C . Но в лаборатории, в которой температура влияет на результаты исследования, необходимо стабилизировать с точностью 0,50 C , а в некоторых случаях 0,10 C . Таким образом, необходимо поставить задачу измерения исследуемого параметра с указанием допустимой для исследуемого объекта ошибкой измерения и выбрать прибор с требуемой точностью измерения. Тогда возможное отклонение результата измерения от истинного значения будут находиться в пределах, не влияющих на результат решения задачи, для которой производится измерение, и результаты измерения можно принять за измеряемый параметр. Получение оценок характеристик случайной величины соответствует процессу их «измерения». Ввиду их случайности результат представляется в виде доверительного интервала, в котором с заданной доверительной вероятностью находится истинное значение искомой характеристики. Процедура получения оценок характеристик случайных величин заключается в следующем: 1. Производится n независимых опытов, в результате которых получают выборку x1 , x2 ,... xn значений случайной величины X . 2. На основании полученных экспериментальных значений случайной величины записывается выражение для расчета оценки a * искомой характеристики a случайной величины a* f ( x1 , x2 ,... xn ) . (35) 3. Полученная оценка a * рассматривается как одно из возможных значений всего множества случайных оценок A* оцениваемого параметра a A* f ( X 1 , X 2 ,... X n ) . (36) 4. По заданному закону распределения случайной величины X находится закон распределения F * оценки A * . 5. Задавшись доверительной вероятностью p , и используя команды расчета функций, обратных закону распределения оценки, находят доверительный интервал, в котором с принятой доверительной вероятностью находится истинное значение искомой характеристики: a мин F * ОБРАТ( ; K ) , 2 a макс F * ОБРАТ(1 2 ;K) , где F * ОБРАТ – функция, обратная интегральной функции распределения оценки искомой характеристики случайной величины, 1 p – уровень значимости; показывает, какая доля наблюдений находится за доверительным интервалом при принятой доверительной вероятности, 2 – вероятность нижней границы доверительного интервала интегральной функции распределения оценки (левой квантили), 1 2 – вероятность верхней границы доверительного интервала интегральной функции распределения оценки (правой квантили), K – параметры функции распределения оценки, характеризующие условия получения экспериментальной выборки. 6. Записывают доверительный интервал, в котором с принятой доверительной вероятностью (надежностью) находится истинное значение искомой характеристики случайного процесса a мин a a макс . 7. Если полученная точность (доверительный интервал) обеспечивает решение поставленной задачи, то полученная оценка принимается за искомую характеристику, в противном случает производят повторную оценку искомой характеристики при увеличенном объеме выборки случайной переменной. Для каждого типа оценки прямые и обратные законы распределения изучены и приведены в таблицах в справочниках. В математических пакетах для компьютеров для различных законов распределения имеются специальные команды для расчета доверительной вероятности при заданном доверительном интервале (прямая функция распределения) и расчета доверительных интервалов при заданной доверительной вероятности (обратная функция распределения) при заданных условиях проведения выборки. В статистике предъявляют к оценкам характеристик случайной величины несмещенность и состоятельность. Оценка является f (x ) несмещенной, если по мере увеличения числа опытов ее математическое ожидание совпадает с оцениваемым параметром. Оценка является x состоятельной, если при 2 3 3 x x x x увеличении числа опытов ее Рис. 25. Функция распределения среднего дисперсия стремится к нулю. x x x x x x x x x 1.8. Понятие степени свободы Функции распределения оценок характеристик случайной величины зависят от характеристик и условий проведения выборок, в том числе от объема выборки. Для учета этого используется понятие числа степеней свободы [15-24]. Всем известно понятие степеней свободы в механике. Твердое тело в трехмерном пространстве имеет 6 степеней свободы – движение по 3-м осям и вращение вокруг этих осей. При вставлении во втулку оси у втулки остается 2 степени свободы – движение по оси и вращение вокруг этой оси. Понятие число степеней свободы в математике используется для определения количества переменных в системе, которые могут изменяться без нарушения имеющихся математических соотношений. Пусть имеется выборка случайной величины x объемом N. Пока не определили ни одной статистической характеристики все N значений могут изменяться, т.к. они ничем не связаны – система имеет N степеней свободы. N xi Пусть мы определили оценку среднего i 1 x N (обратим внимание, что в знаменателе стоит N). Теперь, связав систему средним значением, мы не можем изменять все значения x, т.к. среднее изменится. Можно изменять N 1 значение x, а последнее значение рассчитать из условия равенства среднего полученной оценке. Таким образом, система стала иметь N 1 степеней N свободы. Поэтому в выражении определения дисперсии s 2 ( xi x )2 , i 1 N 1 которая определяется после определения среднего, в знаменателе стоит N 1. Это обеспечивает отсутствие смещения оценки относительно истинного значения дисперсии. Забегая вперед, отметим, что при оценке остаточной ошибки в задаче идентификации m коэффициентов число степеней свободы еще уменьшается и становится равным N m 1, где m – количество оцениваемых коэффициентов. 1.9. Точность и надежность оценки математического ожидания Оценкой математического ожидания xf x dx является среднее M x N xi x i 1 N . (37) Пусть мы сделали k выборок, каждая по N экспериментов, по результатам которых получили k оценок среднего x1 , x2 ,... xk и построили функцию распределения оценки среднего по k полученным данным (рис. 25). Оказывается, оценка математического ожидания имеет нормальное распределение с параметрами , 2 N x [15-24], что может быть записано в виде x N x, 2 x N . (38) Оценка дисперсии среднего равна s2x s x2 . N (39) Таким образом, среднее является несмещенной и состоятельной оценкой математического ожидания, т.к. при N среднее стремится к математическому ожиданию lim xn x , а дисперсия оценки – к нулевому 0. значению lim s 2 x n С 95 %-й доверительной вероятностью оценка среднего находится в 3 x. диапазоне x (40) x Теперь представим, что мы сделали одну выборку и рассчитали оценку среднего x . Данная оценка может находиться в любой точке рассмотренного диапазона. Из (40) следует, что истинное значение математического ожидания находится в коридоре x x 3 x . Если оценка совпала с математическим ожиданием x x , то ошибка равна 3 x. нулю, но мы можем получить и наихудший вариант, когда x x Для нормального распределения в коридор 3 попадает 99,7% значений, следовательно с 99,7% доверительной вероятностью математической ожидание находится в диапазоне x x 3 x . С доверительной вероятностью p=0,997 доверительный интервал для x 3 x . Соответственно, с математического ожидания составляет x доверительной вероятностью доверительный интервал для p 0,95 математического ожидания составляет x x 2 x . Для снижения ошибки оценки математического ожидания необходимо уменьшить дисперсию оценки дисперсии среднего согласно (39), это можно сделать путем увеличения объема выборки. При использовании вместо дисперсии среднего значения x ее оценки s x функции распределения оценки среднего перестает быть нормальной. При анализе используется распределение так называемого t критерия, равного отклонению оценки x от математического ожидания , выраженного в оценках среднего квадратического отклонения s x x t x sx . (41) Функция распределения данной величины называется распределением Стьюдента [15-24]. Это распределение зависит от объема выборки (числа степеней свободы ). Поэтому функция распределения Стьюдента p(t , ) является функцией двух переменных и описывается выражением P(t , ) 1 Г( 2 1 ) Г( ) 2 (1 t2 1 ) 2 (16) где – число степеней свободы, 1 – гамма-функция. Г( ) 2 1, 5, 30 приведены на рис. 26. При Графики распределения Стьюдента для N 30 функция распределения p(t , ) близка к нормальному распределению. Величина t является обратной величиной к функции распределения и зависит от числа степеней свободы и заданной доверительной вероятности. При решении конкретных задач количество экспериментов известно, следовательно известно число степеней свободы N . При использовании величины t доверительный интервал для математического ожидания на основе (40) записывается в виде x t sx x t sx , (42) x В Excel имеются функции для решения прямой и обратной задачи распределения Стьюдента. Для определения вероятности p(t , ) используется оператор СТЬЮДРАСП(t , , 2) , где 2 означает использование двухстороннего критерия. Для определения t-критерия используется оператор t СТЬЮДРАСПОБР( / 2, ) . Введение распределения Стьюдента и t критерия позволяет определить доверительный интервал для математического ожидания по оценкам среднего и среднего квадратического отклонения оценки среднего. Пример. Получены экспериментальные данные значений переменной x, приведенные в таблице. Объем выборки N 8 . Необходимо найти оценку и доверительный интервал математического ожидания с доверительной вероятностью p 0,95 . №N x 1. По экспериментальным данным находим оценки 1 2 3 4 5 6 7 8 76.78 76.43 77.20 76.45 76.25 76.48 76.48 76.60 8 8 xi x i 1 8 ( xi 76 ,56; s 2 x i 1 8 1 x) 0,079 ; sx s x2 N 0,0999 . 2. Находим доверительный интервал для математического ожидания. Уровень значимости при заданной доверительной 1 p 0,05 . вероятности равен Т.к. критерий двухсторонний, вероятности левой и правой квантилей одинаковы и равны / 2 0,025 . В Ехсel находим значение t-критерия СТЬЮДРАСПОБР(0,025;8) = 2,36 Записываем доверительный интервал для математического ожидания 76 ,56 0,099 2,36 76 ,56 0,099 2,36 , x 76 ,35 76 ,79 . x 1.10. Проверка значимости математического ожидания Вследствие случайности оценка модет иметь ненулевое значение при нулевом значении искомой характеристики. Поэтому часто стоит задача определить, отличается ли теоретическая характеристика от нуля или полученная ненулевая оценка является результатом случайных колебаний. Примером могут быть задачи: несет случайный сигнал информацию или нет, отличается ли от нуля истинный коэффициент корреляции или его оценка также является результатом случайных колебаний. Определить значимость характеристики означает по значению полученной оценки определить, отличается ли от нуля теоретическая характеристика, или теоретическая характеристика равна нулю, а значение оценки является результатом случайных колебаний [15-24]. n 2 Случайная величина значимо n 3 отличается от нуля, если ее среднее значение превышает ширину коридора n 5 колебаний случайной величины. В n 25 противном случае исследуемая 2 s x величина является случайной с 2 2 x2 x х нулевым математическим ожиданием. 2 Рис. 27. Функция распределения Применительно к математическому +3 ожиданию методика проверки значимости заключается в следующем х [15-24]: 1) Находятся оценки математического ожидания и дисперсии оценки +2 математического ожидания N х xi 2 x i 1 ; sx n+ sx ; N (x x) ; sx N 1 х t-критерия 2) Определяется расчетное значение tр а с ч x sx и сравнивается с заданным значением t зад . Для заданных условий эксперимента (числа степеней х свободы ) и доверительной вероятности значение t зад часто определяется по таблицам, поэтому оно часто называется таблицным t табл . + Математическое ожидание значимо, если t расч. t табл. . х Для рассматриваемого примера tтабл. равно + 2 = 2,36 . СТЬЮДРАСПОБР(0.025;8) x 76 ,5 х равно t расч 765 ,4 Расчетное значение t – критерия sx 0,099 +3 Т.к. t расч. t табл. , то значение математического ожидания случайной переменной значимо. Распределению Стьюдента подчиняются оценки математического ожидания, коэффициентов регрессии, коэффициентов корреляции и др. 1.11. Точность и надежность оценки дисперсии В теории статистики [15-24] показано, что выборочная оценка дисперсии 2 s x2 связана с самой дисперсией x2 соотношением s 2x x2 , v где - хи-квадрат распределение; v - число степеней свободы, N 1. 2 Распределение оценки s 2x 2 x x2 имеет вид, представленный на рисунке 27. По v оси оценки дисперсии за единицу шкалы выбрано x2 . Отсюда можно найти доверительный интервал, в котором находятся истинные значения x2 . Сделаем N x )2 ( xi выборку N точек и определим s 2x . i 1 N 1 Для заданного числа степеней свободы N 1 функция распределения p ( s , ) имеет конкретный вид, представленный на рис. 28. Для определения доверительного интервала дисперсии необходимо найти значения левой и правой квантилей a и b . 2 x Число a соответствует распределению 2 при v N 1 и вероятности Число b соответствует распределению вероятности 1 p( s 2x ) 2 v N 1 . и . Тогда выражение для доверительного интервала будет иметь вид = N-1 a при 2 2 2 х 2 v s 2x b 2 Рис. 28.Функция распределения для заданного 2 s 2x v 2 v ,1 /2 (43) При нахождении значений квантилей 2 необходимо учитывать, что в справочниках есть s 2x 2 х 2 x 2 v, / 2 таблицы двух видов: 2 , и v, . v Нахождение вероятности и распределения в Excel производится с помощью операторов p ( s x2 , ) ХИ 2( s x2 , ) , а ХИ 2ОБР( , ) , 2 2 2 ХИ 2ОБР(1 2 1 2 квантилей 2 а , ). 2 Пример. Определить оценку и доверительный интервал дисперсии по экспериментальным данным при заданной доверительной вероятности p 0,95 . №N x 1. По экспериментальным данным 8 8 xi x i 1 8 xi s2 76 .561; x i 1 8 1 0.0790 ; s x 2 x S N 0.099 . 2. Доверительный интервал для дисперсии определяется - критерием при заданном уровне значимости и числе Sx 2 степеней свободы S x2 ; 2 2 /2 Для 1 p 0,05 и 1 /2 8 1 7 значения 2 критерия 1 2 3 4 5 6 7 8 76.78 76.43 77.20 76.45 76.25 76.48 76.48 76.60 равны а ХИ 2ОБР ( , ) 2 2 2 ХИ 2ОБР (1 2 1 Тогда 2 0.079 7 16.01 2 ХИ 2ОБР (0,025 ,7) 16 ,01 а , ) 2 ХИ 2ОБР (0,975 ,7) 1,69 0.079 7 ; 0.03452 1.69 2 0.3262. При необходимости повышения точности оценки дисперсии необходимо увеличить объем выборки N . Нахождение оценок количественных характеристик случайных величин, доверительных интервалов в электронных таблицах Excel подробно рассматривается в приложении 3. 1.12. Построение доверительных интервалов и оценка значимости других оценок Для других оценок построение доверительных интервалов и оценка значимости производится аналогично [15-24]. Только вследствие определения оценок по различным выражениям изменяются вид распределения и вид критерия. Основные виды применяемых критериев приведены в табл. 3. Таблица 3 Наименование проверки Оценка и проверка значимости x, s x , rxx ,rxy ,...b и др. Оценка дисперсии Оценка отношений дисперсий при адекватности математических моделей Тип t-критерий - критерий анализе Критерий Фишера (F-критерий) 2 t, 2 , и F-распределения табулированы и приводятся в литературе, а в математических пакетах есть специальные команды статистического анализа. 1.13. Генерация случайных процессов с заданными характеристиками В реальных условиях на технологические процессы, системы управления действуют случайные процессы с различными характеристиками [57-63]. Для анализа процессов, эффективности работы систем управления необходимо уметь получать случайные процессы с реально действующими на производствах характеристиками. Для этого используют формирующие фильтры, позволяющие из сигналов типа «белый шум» получать случайные процессы с требуемыми характеристиками. Материал этого раздела позволяет лучше понять закономерности случайных процессов и взаимосвязи их характеристик. Рассмотрим систему получения широко распространенных нормальных случайных процессов с экспоненциальной автокорреляционной функцией, называемых марковскими 2 (44) R( ) e Блок-схема системы, генерирующей марковские случайные процессы с заданными характеристиками, приведена на рис. 29. Система включает 3 блока: - генератор равномерного распределения - 1; - генератор нормального стандартного случайного процесса - 2; - генератор цветного нормального случайного процесса с заданными характеристиками - 3. a. Получение равномерного случайного процесса Практически во всех языках программирования имеются генераторы случайной величины RND с равномерным распределением от 0 до 1. Случайные величины с данным распределением имеют следующие характеристики. Математическое ожидание: 1 1 xf ( x)dx 0 xdx 0 x2 1 0,5. 2 0 (45) Дисперсия: 1 2 ( x 2 ) M ( x) 2 x 2 f ( x)dx M ( x) 2 0 x3 1 1 3 0 4 1 . 12 (46) На выходе генератора RND генерируется сигнал с равномерным 2 распределением, математическим ожиданием и дисперсией , что записывается в виде выражения: x1 R( , 2 ) 1 1 R( ; ). 2 12 Временные графики и функции распределения данного и других генерируемых сигналов приведены на рис. 29. b. Получение стандартного нормального случайного процесса Стандартым случайным процессом называется нормальный случайный процесс с нулевым средним и единичной дисперсией N(0,1). В блоке 2 производится суммирование 12 последовательно следующих от генератора R(1/2;1/12) величин (или параллельных сигналов от 12 генераторов RND) для получения одной случайной величины с нормальным законом распределения. По закону больших чисел случайная величина, на которую влияет большое количество случайных величин с равномерными вкладами и различными законами распределения, имеет нормальное (гауссово) распределение. Практически уже при 5 6 факторах выходная случайная величина имеет нормальный закон распределения. Поэтому полученная сумма имеет нормальное распределение с параметрами: 1) математическое ожидание суммы сигналов равно сумме математических ожиданий сигналов 12 M 12 R 12 M ( R) 1 1 0,5 (47) 6. 1 2) дисперсия суммы сигналов равна сумме дисперсий сигналов 12 D 12 R D( R) 12 1 1 1 1. 12 (48) После суммирования 12 сигналов получен нормальный случайный процесс с математическим ожиданием ( x2 ) 6 и единичной дисперсией x2 N (6;1). При вычитании из полученного сигнала постоянной величины, равной среднему 6 , получается нормальный случайный процесс с нулевым математическим ожиданием и единичной дисперсией x3 N (0,1) . Последующие друг за другом значения данного случайного процесса некоррелированны, полученный сигнал является белым шумом. Его корреляционная функция не равна нулю только при при 0 при 2 0 : R( ) 0, 0. Спектральная плоскость данного сигнала имеет постоянное значение S ( ) c во всем диапазоне частот. Это означает присутствие в сигнале всех гармоник с частотами . Сумма цветов видимого спектра света дает белый свет. Отсюда данный сигнал получил название белый шум. Из условия, что дисперсия случайного сигнала равна 2 1 S ( )d , (49) 0 постоянное значение спектральной плотности в диапазоне означает бесконечную мощность сигнала, что невозможно. В реальности все элементы систем управления технологических процессов имеют ограниченный частотный диапазон пропускания сигналов. Поэтому в практике используют генераторы белого шума ограниченного диапазона частот, несколько перекрывающего диапазон частот исследуемого элемента. Тем самым снимается ограничение по мощности при использовании модели сигнала «белый шум». c. Получение нормального случайного процесса с заданными характеристиками Получение нормального случайного процесса с заданными характеристиками N ( , x2 , R) производится в блоке 3 путем пропускания стандартного нормального белого шума через формирующий фильтр ФФ и прибавления к полученной случайной величине математического ожидания . Спектральная плотность выходного 10,00 сигнала формирующего фильтра S(w ) связана со спектральной плотностью 8,00 входного сигнала квадратом модуля 6,00 амплитудной частотной характеристики фильтра [18-20, 44-79]. 4,00 2 S x4 ( ) Wф ( j ) S x3 ( ). (50) 2,00 w Корреляционная функция выходного 0,00 -16 -12 -8 -4 0 4 8 12 16 сигнала задана R( ) 2e , Рис. 30. Спектральная плотность 2 где – дисперсия случайного процесса; – постоянная времени затухания корреляционной функции. Спектральная плотность выходного сигнала является преобразованием Фурье от корреляционной функции S x4 ( ) R ( )e j d 2 R( s) cos( )d 2 e 0 cos( 2 )d 2 2 2 (51) 0 График спектральной плотности выходного сигнала приведен на рис. 30. При единичной спектральной плотности входного сигнала формирующего фильтра S x3 ( ) 1 , спектральная плотность выходного сигнала фильтра равна квадрату модуля амплитудной частотной характеристики 2 S x4 ( ) Wф ( j ) . (52) Представив спектральную плотность выходного сигнала через сопряженные составляющие, получим передаточную функцию формирующего фильтра 2 S x4 ( ) 2 W ( p) где k 2 ;T j 1 2 2 2 2 2 j 2 2 p j 1 1 Wф ( p) Wф ( p); 2 p 1 1 Tp k , Tp 1 (53) (54) . Таким образом, формирующий фильтр для заданного случайного процесса с экспоненциальной корреляционной функцией является апериодическим звеном первого порядка W ( p) k , на вход которого подается нормальный случайный Tp 1 процесс типа «белый шум» с единичной спектральной плотностью в рабочем диапазоне частот. Параметры k, T фильтра определяются параметрами корреляционной функции или спектральной плотности выходного сигнала. В полученном сигнале, согласно частотным характеристикам фильтра, отфильтрованы высокочастотные спектральные составляющие, поэтому он не является белым шумом и называется цветным случайным процессом. Для получения случайного процесса с заданным математическим ожиданием к выходному сигналу фильтра прибавляется заданное значение математического ожидания генерируемого сигнала x5 (k ) x4 (k ) . В приложении 4 приведена лабораторная работа на тему генерации случайного процесса с заданными характеристиками с подробно разобранным примером реализации работы в Excel.