ИНСТИТУТ ЕСТЕСТВЕННЫХ НАУК И ЭКОЛОГИИ ПРОГРАММА и ОСНОВНЫЕ ФОРМУЛЫ по курсу: СТАТИСТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА ЭКСПЕРИМЕНТА для студентов 1 курса (I семестр) Автор: д.ф.-м.н. Скорохватов Михаил Дмитриевич Раздел 1. Вероятности Понятие эксперимента, как строгой последовательности определенных действий, ведущих к получению (измерению) одной или нескольких величин. Понятие случайной величины. Результат эксперимента, дискретные и непрерывные величины, результаты повторных экспериментов. Понятие выборочного пространства и события. Частотное определение вероятности. Основные понятия аксиоматической теории вероятности. Случайные события, дополнительное событие, логические операции, совместные и несовместные события, независимые события. Условная вероятность. Литература: [1], [2], [5]. Раздел 2. Распределение вероятностей случайных величин Функция распределения вероятностей случайной величины X: F(x) = P(X<x) lim F(x) при x+ = 1 lim F(x) при x- = 0 Плотность вероятности случайной величины: f x dF ( x) dx a P( X a) F (a) f ( x)dx f ( x)dx 1 Функции одной случайной величины, математическое ожидание, дисперсия распределения. Математическое ожидание или среднее значение для дискретной случайной величины: M ( x ) x x i P ( X xi ) для непрерывной случайной величины: M ( x) x xf ( x)dx Дисперсия распределения дискретной случайной величины: 2 ( x) ( x x ) 2 P ( X xi ) непрерывной случайной величины: 2 ( x) ( x x ) 2 f ( x)dx Стандартное отклонение или ошибка X : x ( x) 2 ( x) Некоторые распределения и их свойства 1. Биномиальное распределение n! Wkn p k (1 p ) n k k!( n k )! M ( k ) np 2 (k ) np (1 p ) 2. 3. Равномерное распределение 1 f ( x) const . при...a x b ba f ( x) 0 при...x a...и...x b ba M ( x) x 2 (b a ) 2 2 ( x) 12 Распределение Пуассона k e k! M (k ) k p (k ) 2 (k ) 4. Распределение Гаусса f ( x) 1 2b M ( x) x a 2 e ( xa )2 2b 2 2 ( x) b 2 5. Стандартное (приведенное) распределение Гаусса xx Нормированная переменная u x u ( x) x ( x) 0 ( x) 1 e x2 2 2 M ( x) x 0 2 ( x) 1 Распределение Гаусса широко используется при анализе погрешности измерений: если случайная величина является суммой большого числа независимых случайных величин, то она распределена по нормальному закону (независимо от распределения слагаемых). Такая ситуация характерна для сложных физических экспериментов. Распределение вероятностей нескольких случайных величин Понятие функции распределения и плотности вероятности для двух случайных величин. Моменты распределения. Случай двух случайных величин. Ковариация двух случайных величин, коэффициент корреляции. Литература: [1], [3]; [5]. Раздел 3. Выборочный метод Понятие выборки, объема выборки, популяции. Выборочное распределение, Статистика – любая функция от выборки x1, x2, x3, …. xn. Оценка параметра: S0 – истинное значение параметра S = S(x1, x2, x3, …. xn) – статистика для оценки S0. Несмещенная оценка: Математическое ожидание функции S(x1, x2, x3, …. xn) равно S0 для любого n. Состоятельная оценка: Дисперсия функции S(x1, x2, x3, …. xn) стремится к 0 при n . Выборочное среднее x 1 xi n - несмещенная и состоятельная оценка для математического ожидания (среднего значения) распределения случайной величины, т.е. оценка x xf ( x)dx Выборочная дисперсия s2 1 ( xi x ) 2 несмещенная оценка дисперсии распределения случайной величины X, т.е. n 1 оценка 2(x). Замечания о числе степеней свободы. Распределение выборочного среднего, дисперсия распределения 1 1 2 ( x ) ( x i x ) 2 n n 1 Прямые и косвенные измерения. Вычисление ошибок в косвенных измерениях. y = y(x) y y ( x ) 2 2 ( y ) dy 2 ( x ) dx Для нескольких случайных величин z = z (x,y): z y ( x , y ) 2 2 ( z ) 2 dz dz 2 ( x ) 2 ( y ) dx dy z 2 ( z ) Литература: [1], [5]. Раздел 4. Принцип максимального правдоподобия Функция правдоподобия и логарифмическая функция правдоподобия: L() = f(x1, )f(x2, )…..f(xn, ) где - неизвестный параметр функции f(x, ) распределения случайной величины x, а (x1, x2,…xn) – выборка. l = lnL = lnf(xn, ) Оценка параметра следует из решения уравнения: dl d ln f ( xn , ) 0 d d ~ Ошибка связана с дисперсией распределения : ~ 2 при условии нормировки ~ 2 ( ) 2 L( )d L ( ) 1 Для функций специального вида dl A(~ ) , дисперсия равна 2 ( ) 1 . A d Равноточные и неравноточные измерения Оценка среднего значения в прямых равноточных измерениях по выборке (x1, x2,…xn), каждое xn получено с одинаковой ошибкой . ~ 1 xn n 1 ~ n Оценка среднего значения в прямых неравноточных измерениях по выборке (x1, x2,…xn), каждое xn получено со своей ошибкой n. xn ~ 2 n 1 2 n 1 ~ 2 n 1 Литература: [1], [3], [5]. Раздел 5. Метод наименьших квадратов Прямые измерения, результаты повторных экспериментов: yn = x + n, где x- истинное значение, n - флюктуации результатов вокруг истинного значения. Значение определяется таким образом, чтобы n2 min или 2 ( x y ) min n Предполагается, что n распределены нормально вокруг нулевого значения с дисперсией (уn)2. Примеры – равноточные и неравноточные измерения. Непрямые измерения, линейный случай: y 1 2 x где предполагается, что yn измеряются (находятся) с ошибками yn при соответствующих значениях xn. n y n 1 2 xn n2 y n 2 Для нахождения 1 и 2 ищем min функции y n 1 2 xn 2 M n2 n2 n2 т.е. y 1 2 xn M n 0 1 n2 ( y 1 2 xn ) xn M n 0 2 n2 Значения 1 и 2 находятся из решений двух уравнений. Связь метода наименьших квадратов и метода максимального правдоподобия. Логарифмическая функция правдоподобия для стандартного распределения Гаусса величин u=n /n: 1 l M. 2 Литература: [1]; [3], [5]. Раздел 5. Проверка гипотез Параметрические критерии и критерии согласия. Примеры. Понятие уровня значимости, двусторонние и односторонние критерии. Критерий Фишера равенства дисперсий. Критерий Стьюдента равенства средних значений. Распределение 2 Определение 2 как суммы квадратов n величин из стандартного распределения Гаусса f(x) с дисперсией равной 1 и средним значением равным 0: 2 x12 x 22 ... x n2 , где n – число степеней свободы. Функция распределения F(2 ) и плотность распределения f(2). 2 1 2 1 2 f ( 2 ) ( ) e ( ) 2 n2 Математическое ожидание M(2) = 2 = n Дисперсия 2(2) = 4 = 2n Критерий согласия 2 Проверка гипотезы о принадлежности выборки (x1,x2, …, xn) к распределению случайной величины X, плотность которого задается функцией f(x). Область значений (x) разбивается на (r) интервалов, так что pi P( x xi ) f ( x)dx xi r p i 1 i Для каждого интервала (xi) подсчитывается число элементов выборки (ni), входящих в этот интервал, т.е. n i x i r n i n 1 где n - объем выборки. Для проверки гипотезы рассчитывается сумма X2: r ni npi 2 1 npi X2 которая при n подчиняется распределению 2 с ( r-1 ) степенями свободы. Применение критерия для случаев: f(x) - распределение Гаусса f(x) - распределение Пуассона. Критерий 2 и метод наименьших квадратов. Применение метода наименьших квадратов связано с построением суммы: n n y F ( xi , m )2 min 2 M i2 i 2 i i 1 При n распределение величин М переходит в распределение 2 с (n-m) степенями свободы, где m - число связей при нахождении параметров m: 1 M 0 1 M 0 2 m уравнений. .............. M 0 m Таким образом, критерий 2 может быть использован для проверки согласия y=F(x,m) при подгонке параметров методом наименьших квадратов или в более общем случае при решении задач методом максимального правдоподобия. Литература: [1]; [3], [4]. ЛИТЕРАТУРА а) основная литература: 1. 2. 3. З. Брандт «Статистические методы анализа наблюдений» Б.В. Гнеденко «Курс теории вероятностей» Б.Л. Ван дер Варден «Математическая статистика» б) дополнительная литература: 4. Д. Худсон «Статистика для физиков» 5. С.С. Уилкс «Математическая статистика» в) дополнительная литература для практических занятий: 6. Дж. Сквайрс «Практическая физика»