Uploaded by Павел Холондач

Лекция Обработка результатов многокр изм

advertisement
1.1
Обработка результатов многократных равноточных
измерений
Многократное измерение одной и той же величины постоянного размера
производится при повышенных требованиях к точности измерений; целесообразность многократных измерений должна быть строго обоснована.
Очевидно, что вопрос о необходимом для получения надёжного результата количестве повторных измерений приобретает существенное значение.
Ответ на этот вопрос зависит от целей организуемых измерений и важности их
результатов для оценки состояния объекта измерений.
Если можно принять, что в общей погрешности результата измерений
роль систематической составляющей пренебрежимо мала, то при определении
необходимого количества измерений следует исходить из возможности и целесообразности проведения той или иной статистической обработки полученных
результатов. Известно, что уже при 7…8 измерениях оценки их результатов
приобретают некоторую устойчивость. Вместе с тем, параметры ряда законов
распределения, применяемых при оценке результатов и случайных погрешностей измерения, при увеличении числа наблюдений более 25…30 изменяются
незначительно. Таким образом, если речь идет о получении достоверных результатов измерений, то число 25…30 является достаточным. По-иному ставится задача организации измерений, если объект до этого метрологически не
исследовался, и, кроме предварительных, обычно расчетных значений величин, о нем мало что известно. В этом случае число измерений «в точке» должно
быть увеличено в 2…3 раза (против 25…30), а при необходимости нахождения
закона распределения вероятности оцениваемых величин число измерений целесообразно увеличить на порядок (до 300).
Результат многократных измерений описывается выражением:
n
Q=Q=
Q
1
n
i
.
(14.5)
Как и результат однократного измерения, он является случайным значением измеряемой величины, но его дисперсия в n раз меньше дисперсии результата измерения Q:
n
1 n
1
1
Q
)
=
D
(
Qi ) = Q2 ,


i
2
n 1
n
n
1
1
1
Q .
D( Q ) = Q2 ;  Q =
n
n
D(
или
(14.6)
(14.7)
Благодаря этому обстоятельству точность определения значения измеряемой величины повышается в n раз.
Наличие большого количества результатов измерения Qi позволяет получить апостериорную информацию о законе распределения вероятности результата измерения. На основании такой информации можно определить вид
этого закона; выявить грубые промахи или их отсутствие. Эффективное использование апостериорной информации является специфической особенностью многократного измерения. Это, однако, не означает, что априорная
2
информация обесценивается; её значение при многократных измерениях такое
же, что и при однократных, но с той разницей, что при многократных измерениях информация о законе распределения вероятности результата измерения
получается опытным путем.
Равноточные и неравноточные измерения
После анализа априорной информации и тщательной подготовки к многократному измерению получают n независимых значений отсчета. Эта основная измерительная процедура может быть организована по-разному. Если изменением измеряемой величины во времени можно пренебречь, то все значения отсчета получают путем многократного повторения операции сравнения
(непосредственно измерения) с помощью одного и того же средства измерений. При этом все значения отсчета будут распределены с одинаковой дисперсией. Такие значения отсчета называются равноточными (равнорассеянными).
Если же из априорной информации следует, что за время измерения произойдет существенное изменение измеряемой величины, то для ускорения
процедуры величину измеряют несколькими средствами измерений, каждое из
которых дает одно из независимых значений отсчета. Так как средства измерений могут отличаться по точности, то случайные значения отсчета х i могут
иметь разную дисперсию. Такие значения отсчета называются неравноточными (неравнорассеянными).
Порядок выполнения и обработки многократных равноточных измерений следующий:
1 анализ априорной информации;
2 получение ряда независимых значений отсчета xi;
3 перевод отсчета в показание и внесение поправки;
4 определение среднего арифметического Q и среднего квадратического
отклонения  Q измеряемой величины. Определенные на основании опытных
данных, эти параметры называются точечными оценками;
5 проверка наличия или отсутствия в результатах измерений грубых промахов;
6 построение гистограммы и определение вида закона распределения вероятности результата измерения;
7 проверка гипотезы о виде закона распределения, чаще всего о нормальности этого закона;
8 определение ширины доверительного интервала на основании заданной доверительной вероятности и запись результата в принятой форме.
Рассмотрим более подробно некоторые этапы этой последовательности
действий.
Определение точечных оценок числовых характеристик
Оценки числовых характеристик законов распределения вероятности
случайных величин, изображаемые точками на числовой оси, называются точечными (в противовес интервальным оценкам, выражаемым доверительным
3
интервалом). В отличие от самих числовых характеристик оценки являются
случайными, причем их значения зависят от объема экспериментальных данных, а законы распределения вероятности — от законов распределения самих
случайных (измеряемых) величин. Оценки должны удовлетворять трем требованиям: быть состоятельными, несмещенными и эффективными.
Оценка называется состоятельной, если при неограниченном увеличении числа наблюдений (измерений) она приближается (сходится по вероятности) к значению оцениваемого параметра. Это означает, что при n →  и любом
фиксированном значении доверительного интервала точечной оценки этот интервал с заданной вероятностью покрывает истинное значение параметра.
Оценка называется несмещенной, если её математическое ожидание
равно оцениваемому параметру.
Оценка называется эффективной, если её дисперсия меньше дисперсии
любой другой оценки данного параметра.
В качестве оценки среднего значения результата измерения используют
среднее арифметическое; состоятельность и несмещенность среднего арифметического обеспечивает правильность результата многократного измерения.
В качестве несмещенной точечной оценки дисперсии используют выражение
SQ2 =
1 n
(Q i − Q n ) 2 .

n − 1 i=1
(14.8)
Величина ̂ Q (или SQ) называется стандартным отклонением.
Оценки Qˆ и ̂ Q (SQ) можно использовать вместо числовых характеристик закона распределения вероятности.
Обнаружение грубых погрешностей.
Грубыми называются погрешности, явно превышающие по своему значению погрешности, оправданные условиями проведения эксперимента (измерения). Очевидно, что наиболее подозрительными являются минимальное и
максимальное показания. Вопрос о том, содержит ли данный результат грубую
погрешность, решается общими методами проверки статистических гипотез.
Проверяемая гипотеза состоит в утверждении, что результат Qi не содержит грубой погрешности. Как и во всех случаях, связанных с проверкой статистических гипотез, вычисляется некая характерная статистика. Под статистикой здесь понимают показатель, связанный с некоторой случайной величиной Q и имеющий собственный закон распределения вероятности. Если значение Q оправдано условиями проведения измерений и не противоречит исходной статистической гипотезе, то расчетная статистика, в которую входит эта
величина, подчиняется установленному для неё распределению вероятности.
При выявлении результатов, содержащих грубые погрешности (промахи), для проверки этой гипотезы используют распределения вероятности
следующих величин (критерий Граббса):
p =
Q max − Q
,
Q
(14.9)
4
p =
Q − Q min
.
Q
(14.10)
Законы распределения вероятностей этих величин совпадают между собой, и для нормального распределения вероятностей результатов измерения
они табулированы. По таблицам при заданной доверительной вероятности Р и
количестве измерений n находят табличное (предельно допустимое) значение
т; его сравнивают с расчетным значением р. Если выполняется условие р 
т, то гипотеза об отсутствии грубой погрешности принимается с вероятностью Р. Правило обнаружения грубых погрешностей с помощью -критерия
используется для небольших (n = 15…20) массивов измерительной информации.
При значительном числе опытных данных грубые погрешности исключаются с помощью правила «трех сигм». Если известно, что закон распределения нормальный, и его числовые характеристики (их оценки) равны М Q и Q,
то с доверительной вероятностью 0,9973 промахами (результатами, содержащими грубую погрешность) являются те результаты измерения, которые
выходят за границы интервала МQ Q.
После того, как грубые погрешности (промахи) исключены из результатов измерения, необходимо снова определить оценки числовых характеристик
и убедиться в отсутствии грубых погрешностей.
Построение гистограммы
При обработке экспериментальных данных на их основе часто строится
гистограмма распределения. По оси абсцисс откладываются интервалы значений измеряемой величины (обычно равные), эти отрезки являются основаниями прямоугольников, площади которых равны частотам р* попадания значений величины на каждый интервал. Таким образом, высота каждого прямоугольника (эмпирическая плотность вероятности) равна частоте, деленной на
длину интервала. Очевидно, что полная площадь гистограммы равна единице.
По виду гистограммы (рис.14.1), а также исходя из существа задачи,
можно предположить принципиальный вид кривой закона распределения вероятности. Например, из рис. 14.1 видно, что распределение вероятности, скорее всего, окажется нормальным.
Для предполагаемого распределения вероятности с вычисленными оценками числовых характеристик строится теоретическая кривая. Далее следует
выяснить вопрос, являются ли расхождения теоретического и статистического
распределения случайными (из-за малого числа наблюдений), или объясняются неправильно подобранным теоретическим законом ? На этот вопрос отвечают с помощью так называемых критериев согласия; наиболее распространенным из них является критерий К. Пирсона.
5
200 изм., 9 интервалов
60
51
50
42
39
40
30
27
20
17
13
10
5
3
3
0
1
2
3
4
5
6
7
8
9
Рис. 14.1. Гистограмма, иллюстрирующая эмпирическое распределение
вероятности результатов измерения
Проверка вида закона распределения по критерию Пирсона
При использовании этого критерия за меру расхождения экспериментальных данных с теоретическим распределением принимается сумма квадратов отклонения теоретических вероятностей рi от соответствующих частот
m/n, взятых с некоторыми коэффициентами (весами) n/pi:
k ( m − np ) 2
n mj
j
j
2
,
 = (
− pj) = 
n
np j
j=1 p j
j=1
k
2
(14.11)
где k — число интервалов гистограммы,
mj — число результатов измерений, попавших в j-й интервал гистограммы,
n — общее число наблюдений (измерений).
Если расхождение случайно, то статистика 2 подчиняется т. н. 2 распределению Пирсона. Предельно допустимые значения критерия  02 сведены в
таблицы. Если при заданной доверительной вероятности и числе степеней свободы r = k – 3 выполняется условие  2  02 , то принимается гипотеза о соответствии распределения принятому закону, например, нормальному.
При использовании критериев согласия возможны два рода ошибок:
− ошибка первого рода состоит в том, что отвергается верная гипотеза;
− ошибка второго рода состоит в том, что принимается неверная гипотеза.
Вероятности и той, и другой ошибки зависят от значения  02 , которое, в
свою очередь, определяется вероятностью P = F(02 ) , с которой принимается
6
решение. С повышением этой вероятности увеличивается значение  02 (доверительный интервал), и, следовательно, вероятность ошибки первого рода
уменьшается, а ошибки второго рода — возрастает, и наоборот. Таким образом,
нецелесообразно принимать решение с очень высокой степенью вероятности.
Обычно выбирается Р = 0,9…0,95.
Критерий Пирсона является универсальным и используется для проверки любых законов распределения вероятности. Однако область его применения ограничивается числом результатов: оно должно быть не меньше 50.
Проверка гипотезы о нормальности закона распределения
вероятности с помощью составного критерия
При малом числе измерений для проверки нормальности закона распределения используется специализированный составной критерий, стандартизованный для обработки результатов измерений при 11 n  50. Проверка производится в два этапа:
1 Вычисляется статистика
n

d =  Qi − Q
i =1
n

n  (Q i − Q ) 2 .
(14.12)
i =1
Квантили распределения этой статистики протабулированы; с их помощью проверяется выполнение условия
(14.13)
d q  d  dq ,
1−
где d
1−
q1
2
1
1
2
2
, d q — квантили статистики d, выбираемые из таблицы в зависимости
1
2
от n и q1,
q 1 — уровень значимости, с которым проводится проверка гипотезы. Уровень
значимости связан с доверительной вероятностью соотношением q = 1 – P.
Если условие (14.13) выполняется, то переходят ко второму этапу.
2 Проверяются «хвосты» распределения.

Если не более m разностей Qi − Q превосходят уровень z 1+   SQ , то рас2
пределение считается нормальным.
Число «m» выбирается из таблицы в зависимости от числа измерений n,
z 1+ — квантиль интегральной функции нормированного нормального распре2
деления (то есть распределения с MQ = 0 и Q = 1):  (z 1+ ) =
2
1+ 
,  — величина,
2
определяемая из таблицы и зависящая от уровня значимости q2 и числа измерений n. Иными словами можно сказать, что /2 — это площадь под кривой
функции Лапласа в интервале от 0 до z.
Распределение считается нормальным, если выполняются условия принятия нулевой гипотезы на каждом этапе проверки. Уровень значимости при
этом составит:
q  q 1 + q 2 , или
7
P  P1 + P2 − 1 ,
где Р, Р1, Р2 — соответствующие доверительные вероятности (общая, на первом
и втором этапах).
Запись результата измерения в принятой форме
Окончательный результат представляется в форме доверительного интервала:


(14.14)
Q − tS Q  Q  Q + tS Q .
Значение t выбирается из таблиц функции Лапласа при нормальном распределении среднего арифметического и числе измерений более 30…35, или
из неравенства Чебышева при неизвестном распределении вероятности.
Определение вероятности для того или иного доверительного интервала
или доверительного интервала при заданной вероятности приведенным выше
способом оказывается тем менее надежным, чем меньше число наблюдений.
Нельзя пользоваться формулами нормального распределения при малом числе
наблюдений, если априори неизвестно СКО для данного метода измерений.
Определять доверительную вероятность или доверительный интервал для
среднего при малом числе наблюдений и неизвестной дисперсии возможно с
помощью распределения вероятности Стьюдента. В таблицах этого распределения значение относительной ширины доверительного интервала tc находится в зависимости от доверительной вероятности Рс и числа наблюдений n.
Чем больше число измерений n, тем ближе распределение к нормальному.
Download