ЛАБОРАТОРНАЯ РАБОТА № 3 Тема работы: Предварительная статистическая обработка экспериментальных данных.

Реклама
ЛАБОРАТОРНАЯ РАБОТА № 3
В.Н. Демидов
Тема работы: Предварительная статистическая обработка экспериментальных данных.
Цель работы: Научиться проверять основные статистические гипотезы: об
однородности наблюдений и соответствии результатов измерения закону нормального
распределения вероятностей.
Задание: Основываясь на статистических критериях проверить, не содержат ли
результаты измерений x1 , x 2 , …, x n грубых погрешностей. Используя приближенный
критерий и критерий согласия Пирсона проверить гипотезу о том, что распределение
вероятностей рассматриваемой серии измерений подчиняется нормальному
закону.
Теоретическая часть
Предварительная обработка результатов измерений преследует в основном две цели:
исключение грубых ошибок измерений и проверку гипотезы о соответствии результатов
измерений закону нормального распределения.
Исключение грубых ошибок измерений.
Трудность обнаружения грубых ошибок обусловлена следующим обстоятельством. Если
число измерений n мало, то доверительный интервал широк, и даже значительные
отклонения от среднего x в него укладываются. Если же n велико, то возрастает
вероятность того, что хотя бы одно измерение xi сильно отклонится от среднего на
«законных основаниях», т. е. случайно.
Методы исключения грубых погрешностей измерений для малых выборок
изложены в материалах лекционного курса. Для больших выборок на практике
используется следующий метод проверки однородности наблюдений.
Пусть произведено n независимых измерений и вычислены значения
эмпирического среднего x и стандарта s . Сомнительный элемент выборки, резко
отличающийся от других, будем обозначать через x* . Это «крайний» элемент выборки, то
есть x  xm ax или x  xm in .
В основе рассматриваемого метода лежит тот факт, что критические значения
максимального относительного отклонения

x  x
(1)
s
выражаются через квантили распределения Стьюдента с n  2 степенями свободы:
1 ,n 
t1 ,n 2 n  1
n2t
2
1  ,n  2
.
(2)
На практике обычно вычисляются два значения 1 ,n при   0.05 и   0.001:
1   0.95,n ,
 2   0.999,n
Этими значениями вся область изменения  разбивается на три интервала:
1)      1 ;
2) 1     2 ;
(3)
3)  2     .
Наблюдения, попавшие в первый интервал, не рекомендуется отбрасывать ни в коем
случае. Наблюдения, попавшие во второй интервал можно исключить, если имеются
какие-либо дополнительные соображения в пользу их ошибочности. Наконец,
наблюдения, попавшие в третий интервал, всегда отбрасываются как грубо ошибочные.
Проверка гипотезы о нормальности распределения результатов измерения.
Приближенный метод проверки нормальности распределения основан на вычислении по
результатам измерения эмпирических оценок коэффициентов асимметрии, эксцесса и их
дисперсий:
n
  3
1
xi  x 3 ,
A 3  3
s
s n i 1
6n  2
D  A 
,
n  1n  3
n
  4
1
xi  x 4  3 ,
E 4  4
s
s n i 1
24nn  2n  3
.
D E  
n  12 n  3n  5


Если выборочные асимметрия и эксцесс удовлетворяют неравенствам



E  5 DE  ,


A 3 D A
(4)
то гипотеза о нормальности наблюдаемого распределения принимается, в противном
случае гипотеза отклоняется.
Если выборка достаточно велика, применяются иные критерии согласия, наиболее
надежным и универсальным из которых является критерий Пирсона  2 . Применяя
данный критерий необходимо выполнить следующие действия.
Область возможных значений случайной величины  , разбивается на
конечное число ( m  8  20 ) непересекающихся интервалов:
 , x2 ,x2 , x3 ,x3 , x4 ,,xm , 
интервала xi 1 , xi  подсчитывается число
Для каждого
попавших в данный интервал.
Вычисляется теоретическая вероятность
нормальном законе распределения вероятностей
ni элементов выборки,
pi попадания в i -й интервал при
x x
x x
pi  P xi 1  X  xi    0  i
   0  i 1
,
 s 
 s 
где  0  x  - функция Лапласа.
Проверяется выполнение условия npi  5 для всех интервалов; интервалы, для
которых это условие не выполнено, объединяются с соседними интервалами.
Вычисляется сумма
 
2
k
ni  npi 2
i 1
npi

,
(5)
имеющая приближенно  - распределение с k  3 степенями свободы.
При заданной доверительной вероятности p  1   (  - уровень значимости) и
числе степеней свободы k  3 вычисляется (или находится по таблицам) критическое
значение критерия  2p ,k 3 .
Если
 2   2p ,k 3 ,
(6)
2
то гипотеза принимается, т. е. можно считать, что распределение вероятностей
рассматриваемой серии измерений не отличается от нормального.
Необходимо помнить о вероятностном характере выводов, поэтому никакая, даже
самая малая величина суммы (5) не может служить доказательством нормальности
закона распределения.
Порядок выполнения задания
Исключение грубых ошибок измерений
1. Присвойте переменной ORIGIN значение равное единице.
2. Введите вектор выборочных значений (X:=READPRN(“путь к файлу Lab3 1a”)); используя встроенную
функцию length(X) вычислите объем выборки.
2
3. Вычислите выборочные значения среднего, дисперсии и стандартного отклонения: x , s и s .
4. Изобразите элементы выборки и «трехсигмовый» интервал на графике. Определите грубо-визуально, есть
ли среди элементов выборки аномально отклоняющиеся значения.
5. Если есть подозрительные элементы, то для удобства дальнейших вычислений, произведите сортировку
выборочных значений. Тогда подозрительные элементы будут находиться в начале и (или) в конце
вариационного ряда.
6. По формулам (1) и (2) вычислите значения
 , 1 и  2 . Если значение 
попадает в третий интервал (3),
исключите его из выборки; по оставшимся элементам выборки заново вычислите параметры
переходите к анализу следующего подозрительного элемента и т. д.
7. Сохраните рабочий документ.
x , s2 , s
и
Проверка гипотезы о нормальности распределения (1)
1. Присвойте переменной ORIGIN значение равное единице.
2. Введите вектор выборочных значений (Y:=READPRN(“путь к файлу Lab3 1b”)); используя встроенную
функцию length(Y) вычислите объем выборки.
3. Вычислите оценки эмпирических коэффициентов асимметрии, эксцесса и их дисперсий.
4. Сравните вычисленные значения по формуле (4) и сделайте соответствующее заключение.
Проверка гипотезы о нормальности распределения (2)
1. Вычислите оценки эмпирического среднего, дисперсии и стандартного отклонения.
2. Вычислите максимальное и минимальное значения выборки.
3. Присвойте конкретное значение числу интервалов разбиения m (при выборе числа
m
можно
пользоваться рекомендациями, приведенными в первой лаб. работе) и вычислите границы интервалов
i  1, 2,, m  1; крайним границам присвойте значения x1   , xm1   .
xi ,
4. С помощью функции hist(x,X) вычислите частоты попадания выборочных значений в интервалы
разбиения, а с помощью функции нормального распределения norm(x,a,s) – теоретические вероятности.
5. Проверьте выполнение условия npi  5 и объедините интервалы так, чтобы это условие было
выполнено для всех интервалов.
6. Вычислите сумму (5).
7. Задайте определенный уровень значимости и вычислите критическое значение критерия
 2p ,m3
-
квантиль распределения «хи-квадрат» уровня p с m  3 степенями свободы.
8. На основе неравенства (5) сделайте вывод о принятии или отклонении гипотезы о нормальности
распределения.
9. Сохраните рабочий документ.
Скачать