Uploaded by Natali Fetisova

Статобработка

advertisement
ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ ГОРОДА МОСКВЫ
ГОУ СПО ПОЛИТЕХНИЧЕСКИЙ КОЛЛЕДЖ № 39
МЕТОДИЧЕСКОЕ ПОСОБИЕ
«Статистические методы обработки результатов измерений»
дисциплина «Мониторинг загрязнения ОПС»
для специальности 3201 «Охрана окружающей среды
и рациональное использование природных ресурсов»
Автор
Щербакова Г.С.,
преподаватель
ГОУ СПО ПК № 39
Одобрено цикловой комиссией ООС
Протокол № 3 от 10.10.2005 г.
Председатель цикловой комиссии
2005
Щербакова Г.С.
Содержание
Стр.
Введение……………………………………………………………………………………….…….3
1. Погрешности. Общая характеристика и классификация………………………………………3
2. Случайные величины. Частота и вероятность появления результата……………………...…4
3. Нормальное распределение Гаусса и t-распределение……………………………………..….5
4. Порядок статистической обработки результатов измерений…………………………...……..7
4.1. Исключение известных систематических погрешностей……………………………7
4.2. Вычисление выборочных характеристик……………………………………………..7
4.3. Проверка распределения на нормальность методом асимметрии и
эксцесса……………………………………………………………………………….…8
4.4. Оценка наличия грубых измерений………………………………………………….10
4.5. Вычисление доверительного интервала…………………………………………..…11
5. Проверка значимости гипотез………………………………………………………………….12
5.1. Применение доверительного интервала разности средних……………………...…12
5.2. Использование F – критерия. Сравнение дисперсий двух выборок……………….13
Приложение…………………………………………………………………………………….….15
Литература……………………………………………………………………………………...….16
2
Введение
Информацию аналитического характера о состоянии объекта окружающей среды (ОС)
в практике мониторинга получают из количественно ограниченной пробы. Данная проба
должна быть репрезентативной (представительной), т.е. статистически правильно отражать
состояние объекта ОС, из которой она была отобрана, и содержать достаточное количество
материала, остающегося в сохранности до проведения анализа. Однако, в связи с неоднородностью и изменчивостью природных сред как правило возникают сложности с отбором
представительных проб, что приводит к появлению погрешностей результатов мониторинга
ОС.
Общая погрешность полученного результата складывается из погрешностей отбора
пробы, пробоподготовки и химического анализа, и может быть весьма существенной. Поэтому одним из важнейших этапов мониторинга является оценка результатов наблюдений,
которая подразумевает:
1) оценку результатов измерений с точки зрения их достоверности, а также решение
ряда задач математической статистики с целью оценки успешности аналитических
процедур (методик);
2) оценку экологической обстановки по результатам измерений и, в частности, оценку загрязненности природных сред; разработку общих критериев загрязненности.
1. Погрешности. Общая характеристика и классификация
Измерением называют процесс количественного сравнения некоторого свойства объекта с мерой этого свойства или со стандартом (эталоном). Отсюда следует, что получение
результата измерения сопряжено с погрешностями, которые могут быть следствием несовершенства как методики измерения, так и меры. В итоге результат измерения не совпадает с
истинным значением измеряемой величины, а представляет лишь ее оценку.
Точность измерений отражает близость результатов к истинному значению измеряемой величины. Разность между результатом измерения и этим истинным значением называется погрешностью измерения.
Точность измерений складывается из их правильности и прецизионности. Термин
правильность характеризует степень близости среднего арифметического значения большого числа результатов измерений к истинному или принятому опорному значению, термин
прецизионность - степень близости результатов измерений друг к другу.
Правильность измерений характеризуется величиной систематической погрешности.
Систематические погрешности – постоянные, воспроизводящиеся от измерения к измерению, по знаку и величине смещения от истинного значения измеряемой величины. Систематические погрешности принято классифицировать в зависимости от причин их возникновения и по характеру проявления при измерениях.
В зависимости от причин возникновения рассматриваются четыре вида систематических погрешностей:
1) погрешности метода или теоретические, возникающие из-за ошибочности или недостаточной проработки принятой теории метода измерений в целом или от допущенных упрощений при проведении измерений.
2) инструментальные погрешности, зависящие от погрешностей применяемых СИ.
Исследование этих погрешностей является предметом специальной дисциплины –
теория точности измерительных устройств.
3) погрешности, обусловленные неправильной установкой и взаимным расположением средств измерений, являющихся частью единого комплекса, несогласованностью их характеристик, влиянием внешних температурных, гравитационных, радиационных и других полей, нестабильностью источников питания, а также неправильными действиями операторов.
3
4) погрешности, обусловленные индивидуальными особенностями наблюдателя.
По характеру своего поведения в процессе измерений систематические погрешности
подразделяются на постоянные и переменные. Постоянные возникают, например, при неправильной установке начала отсчета, неправильной градуировке и юстировке СИ. Если уж
они возникли, то обнаружить их в результатах наблюдений очень трудно. Среди переменных
принято выделять прогрессивные – монотонно убывающие или возрастающие в процессе
измерения, т.е. являющиеся функцией, например, времени или температуры, и периодические.
Среди них также можно условно выделить погрешности трех типов:
1) Погрешности известной природы, которые могут быть устранены введением поправки или изменением условий определения.
2) Погрешности, источник которых известен и которые могут быть оценены в ходе
анализа или при постановке специального эксперимента.
3) Погрешности невыясненной природы, значения которых неизвестны. Они могут
быть обнаружены лишь после устранения всех прочих систематических погрешностей.
Главной особенностью систематической погрешности является возможность ее
устранения или минимизации после выявления.
Правильность результата выражают также абсолютной или относительной погрешностью.
Абсолютная погрешность – это разность между наблюдаемым значением определяемой ведичины и значением, принятым за истинное и называемым «действительным». Абсолютная погрешность имеет знак «+» или «-», констатируя завышение или занижение результата анализа.
Относительная погрешность выражает отклонение результата от действительного в
процентах (при этом сохраняется знак абсолютной погрешности).
Прецизионность результатов оценивается случайной погрешностью. Случайные погрешности переменны как по величине так и по знаку. Их появление обусловлено многочисленными причинами, поэтому оценить суммарное значение экспериментальной величины
невозможно. Исследователь может лишь оценить с помощью методов математической статистики пределы или доверительные интервалы, в которых с опредленной долей вероятности
может находиться экспериментальная величина. Прецизионность зависит только от случайных погрешностей и не имеет отношения к истинному или установленному значению измеряемой величины.
Различают прецизионность результатов в условиях повторяемости и в условиях воспроизводимости.
Условия повторяемости (сходимости) - условия, при которых независимые результаты измерений (или испытаний) получаются одним и тем же методом на идентичных объектах испытаний, в одной и той же лаборатории, одним и тем же оператором, с использованием одного и того же оборудования, в пределах короткого промежутка времени.
Условия воспроизводимости - условия, при которых результаты измерений (или испытаний) получают одним и тем же методом, на идентичных объектах испытаний, в разных
лабораториях, разными операторами, с использованием различного оборудования
Помимо случайных и систематических погрешностей различают промахи – сильно
выделяющиеся в серии измерений (выпадающие) значения, чье появление вызвано, как правило, грубой ошибкой экспериментатора или сбоем в работе оборудования.
2. Случайные величины. Частота и вероятность появления результата
Любой результата мониторинга представляется собой случайную величину (СВ) –
величину, которая в результате испытаний принимает одно и только одно возможное значе-
4
ние, наперед не известное и зависящее от случайных причин, которые заранее не могут быть
учтены (например, рН воды в реке может принимать значения: 7,24; 6,52; 5,13; 8,03).
Различают дискретные и непрерывные СВ, причем в практике мониторинга, как правило, имеют дело с последними.
Дискретной (прерывной) называют СВ, которая принимает отдельные, изолированные возможные значения с определенными вероятностями. Число возможных значений дискретной СВ может конечным или бесконечным. Примером дискретной СВ является численность видов-индикаторов в биологическом мониторинге.
Непрерывной называют СВ, которая может принимать все значения из некоторого
конечного промежутка. Очевидно, число возможных значений непрерывной СВ бесконечно
(пример – концентрация любого загрязняющего вещества).
В математической статистике поведение СВ принято описывать специальными функциями (х), связывающими значение, которое принимает случайная величина х, с вероятностью ее появления. Функцию (х) называют дифференциальной функцией распределения
случайной величины, или функцией плотности вероятности.
При проведении мониторинга одного и того же объекта ОС возможно получение как
абсолютно одинаковых результатов параллельных измерений, так и некоторого разброса
данных. Если известно общее количество результатов анализа m, среди которых n результатов имеют одинаковое значение, то отношение n/m будет называться частотой появления
результата. При m0 частота появления результата преобразуется в вероятность его появления Р, величина которой колеблется от 0 до 1 (100%).
Значимость события помимо вероятности его появления определяется уровнем значимости . Если при решении поставленной задачи выявляют две критические области, то
 = (1 – Р)/2. Если в задаче решается вопрос, будет ли значение какого-либо параметра
больше или меньше определенного значения (т.е. критическая область одна), то  = 1 – Р.
3. Нормальное распределение Гаусса и t-распределение
Среди законов распределения, которым подчиняются встречающиеся на практике СВ,
чаще всего приходится иметь дело с нормальным законом распределения, которое ввел и исследовал Гаусс.
Функция плотности вероятности гауссова распределения представляется в виде:
1
𝜙(𝑥) = 𝜎√2𝜋 𝑒
−
(𝑥−𝜇)2
2𝜎2
(1)
где ,  - числовые константы, определяющие поведение непрерывной случайной величины, х – ее значение.
 - математическое ожидание, равное истинному значению измеряемой случаной
величины при отсутствии систематической погрешности:
∑𝑛 𝑥
𝑖
𝜇 = 𝑖=1
(2)
𝑛
где xi – i-тое значение случайной величины, n – количество случайных величин
(n).
 - стандартное отклонение случайной величины. Квадрат случайного отклонения 2
называют дисперсией случайной величины.
𝜎2 =
2
∑𝑛
𝑖=1(𝑥−𝜇)
(3)
𝑛
5
График функции нормального распределения представлен на рис. 1.
(х)


Рис. 1. Кривая нормального распределения.
х
Кривая нормального распределения (нормальная кривая) обладает следующими свойствами:
1. Максимум кривой распределения приходится на х = . График представляет собой
колоколообразную кривую, симметричную относительно максимума.
2. При любых значениях  и  площадь, ограниченная нормальной кривой и осью х,
равна единице.
3. Возможные значения нормально распределенных величин группируются вокруг
истинного значения. Расчеты показывают, что площадь фигуры с границами 
составляет 0,6826, с границами 2 - 0,9544, с границами 3 - 0,9973. То есть
можно достаточно надежно (с вероятностью, равной 99,73%) утверждать, что все
значения СВ, подчиняющейся нормальному распределению Гаусса, отклоняются
от истинного значения  не более чем на 3. Это утверждение получило название
правила трех сигм.
При  = 0 и  = 1 нормальную кривую называют нормированной. График этой кривой симметричен относительно оси ординат.
Множество всех результатов анализа (бесконечное большое число измерений), подчиняющихся нормальному распределению, называют генеральной совокупностью. В практике мониторинга часто имеют дело не с генеральной совокупностью, а с гораздо меньшим
объемом данных, извлекаемых из нее случайным образом, т.е. с выборкой (выборочной совокупностью). Выборку следует подбирать так, чтобы она как можно лучше характеризовала
(представляла) генеральную совокупность. Этой цели можно добиться тем скорее, чем лучше удался случайный отбор конкретных измерений.
Большие выборки (n20) подчиняются тем же закономерностям, что и генеральная
совокупность. Для работы с малыми выборками вместо нормального распределения используют распределение Стьюдента (t-распределение случайной величины):
𝑥−𝜇
𝑡 = 𝑠⁄
(4)
√𝑛
где х – среднее арифметическое выборочных значений, s – стандартное отклонение
выборки (s2 – дисперсия случайной величины).
𝑥=
∑𝑛
𝑖=1 𝑥𝑖
(5)
𝑛
2
∑𝑛
𝑖=1(𝑥−𝑥)
𝑠2 =
(6)
𝑛−1
Величина n-1 в знаменателе формулы (6) является числом степеней свободы , которое равно числу независимых переменных в выборочной совокупности за вычетом числа
связывающих их уравнений. Так как отклонение параллельных измерений (xi -x) рассчитывают относительно среднего значениях, то между ними имеет место одна связь и число степеней свободы на единицу меньше, чем число измерений в выборке.
Стандартное отклонение s, характеризующее рассеяние результатов в выборке, имеет
размерность измеряемой величины и характеризует случайную погрешность анализа.
6
4. Порядок статистической обработки результатов измерений
Обработка результатов измерений, полученных в ходе мониторинга (т.е. случайных
величин) включает в себя следующие этапы:
1. Исключение известных систематических погрешностей из результатов наблюдений.
2. Вычисление выборочных характеристик.
3. Проверка распределения на нормальность (осуществляется при наличии генеральной совокупности или больших выборок (n  20). Если в результате проверки окажется, что имеющиеся данные не подчиняются нормальному распределению, то
для их дальнейшей обработки нельзя пользоваться рассмотренными выше формулами. Распределение также можно попытаться привести к нормальному, однако,
соответствующие методы здесь рассмотрены не будут.
4. Оценка наличия грубых измерений (промахов).
5. Вычисление доверительного интервала.
Рассмотрим подробнее каждый этап.
4.1. Исключение известных систематических погрешностей
Дать исчерпывающие правила для отыскания и исключения систематических погрешностей невозможно. Однако устранить источник погрешности до начала измерений можно
путем градуировки, настройки средства измерения, проведения поверки или аттестации используемых приборов или установок, термостатирования прибора или помещения, экранирования от действия электромагнитных полей и т.д.
Наиболее распространенные методы их исключения следующие:
- Введение поправок.
- Сравнение с образцом.
- Компенсация погрешности.
- Проведение симметричных наблюдений.
Метод введения поправок основан на знании систематической погрешности и закономерности ее изменения. В этом случае в результат измерения, содержащий погрешность,
или в показания прибора вносят поправки, равные этим погрешностям по величине, но с
противоположным знаком.
Метод сравнения с образцом. В этом случае исследуемый объект и образец с одинаковой геометрической формой и размерами измеряют одним и тем же методом, с помощью
одних и тех же СИ, при одинаковых внешних условиях. При этом образцы предварительно
аттестовывают с достаточно высокой точностью по сравнению с точностью наших измерений. Тогда, если нет большой разницы в исследуемых значениях измеряемого объекта и образца, систематическая погрешность исключается из результатов измерений.
Часто вместо образца используют меры более высокой точности – образцовые меры,
по которым настраивают СИ и затем измеряют объект, определяя отклонение контролируемого параметра от образцовой меры.
4.2. Вычисление выборочных характеристик
Основными характеристиками выборки являются:
- среднее арифметическое значение (выборочное среднее),
- дисперсия выборки,
- стандартное отклонение выборки,
- размах,
- срединное значение (медиана).
7
Для расчета первых двух характеристик используют формулы (5) и (6) соответственно. Стандартное отклонение выборки представляет собой квадратной корень из выборочной
дисперсии.
Для вычисления размаха выборки R необходимо выявить максимальный xmax и минимальный xmin результат, входящий в выборку:
𝑅 = 𝑥max − 𝑥min
(7)
Для определения медианы (срединного значения выборки), необходимо имеющиеся
результаты анализа выстроить в ряд в порядке возрастания. Если количество этих результатов нечетное, то медианой будет являться срединный член ряда, если же количество результатов, входящих в выборку, четное, то медиану рассчитывают как среднее арифметическое
из двух ближайших к центру членов ряда.
Медиана также как и выборочное среднее является приближенной оценкой истинного
значения измеряемой величины , однако, она менее чувствительна к минимальным и максимальным результатам выборки.
Пример. Получены следующие результаты определения концентрации СО в воздухе,
мг/м : 2,5; 2,6; 2,4; 2,4; 2,7. Вычислите характеристики данной выборки.
3
Определим выборочное среднее значение по формуле (5):
2,50+2,60+2,40+2,40+2,70
12,60
𝑥=
=
= 2,52 мг/м3.
5
5
Вычислим дисперсию по формуле (6):
(2,50−2,52)2 +(2,60−2,52)2 +(2,40−2,52)2 +(2,40−2,52)2 +(2,70−2,52)2
0,068
𝑠2 =
= 4 = 0,017 Поскольку
5−1
стандартное отклонение представляет собой квадратный корень из выборочной дисперсии,
то 𝑠 = √0,017 = 0,13мг/м3.
Размах будет равен 𝑅 = 2,70 − 2,40 = 0,30 мг/м3.
Выстроим имеющие данные в порядке возрастания: 2,40; 2,40; 2,50; 2,60; 2,70. поскольку количество членов ряда нечетное и его середина приходится на значение 2,50, именно оно и является медианой.
4.3. Проверка распределения на нормальность методом асимметрии и эксцесса
Существуют различные методы проверки распределения на нормальность:
- графические (построение вероятностной бумаги, построение гистограмм – диаграмм частоты накопления результатов анализа)
- расчетные (с использованием 2 – критерия, метод асимметрии и эксцесса, метод
Колмогорова-Смирнова и др.).
Все методы проверки (за исключением последнего) требуют достаточно большого
объема численных данных.
Рассмотрим подробнее метод асимметрии и эксцесса, который помимо ответа на вопрос о нормальности распределения позволяет сделать выводе о его симметричности и пологости (заостренности). Последовательность проверки следующая:
1. Вычисление моментов
𝑚1 =
𝑚1 =
𝑚3 =
∑𝑛
𝑖=1(𝑥𝑖 −𝑥)
(8)
𝑛
2
∑𝑛
𝑖=1(𝑥𝑖 −𝑥)
𝑛
3
∑𝑛
𝑖=1(𝑥𝑖 −𝑥)
(9)
(10)
𝑛
4
∑𝑛
𝑖=1(𝑥𝑖 −𝑥)
𝑚4 =
𝑛
2. Вычисление значения асимметрии
𝑚
𝑔1 = 33⁄2
(11)
(12)
𝑚2
8
При g1 = 0 распределение является симметричным, при g1  0 наблюдается положительная асимметрия (см. рис. 2а), при g1  0 – отрицательная (см. рис. 2б).
(х)
(х)

х
а - положительная асимметрия

х
б - отрицательная асимметрия
Рис. 2. Асимметричные распределения.
3. Вычисление значения эксцесса
𝑚
𝑔2 = 42 − 3
(13)
𝑚2
Эксцесс характеризует пологость распределения.
При g2 = 0 распределение является нормальным по высоте, при g2  0 распределение
заостренное, т.е. кривая имеет более высокую и острую вершину, чем нормальная, при g2  0
распределение пологое, кривая имеет более низкую и плоскую вершину, чем нормальная (см.
рис. 3).
4. Вычисление несмещенной оценки асимметрии
√𝑛(𝑛−1)
𝐺1 = 𝑛−2 ⋅ 𝑔1
5. Вычисление несмещенной оценки эксцесса
𝑛−1
𝐺2 = (𝑛−2)(𝑛−3) [(𝑛 + 1)𝑔2 + 6]
(14)
(15)
6. Вычисление среднеквадратичного отклонения для показателя асимметрии
6𝑛(𝑛−1)
𝑆𝐺1 = √(𝑛−2)(𝑛+1)(𝑛+3)
(16)
7. Вычисление среднеквадратичного отклонения для показателя эксцесса
24𝑛(𝑛−1)2
𝑆𝐺2 = √(𝑛−3)(𝑛−2)(𝑛+3)(𝑛+5)
(17)
8. Проверка условий нормальности. Если одновременно выполняются два условия:
|𝐺1 | ≤ 3𝑆𝐺1
|𝐺2 | ≤ 5𝑆𝐺21
то, распределение считается нормальным для данной доверительной вероятности.
(х)
заостренная кривая
нормальная кривая
пологая кривая
х
Рис. 3. Нормальное, заостренное и пологое распределение.
4.4. Оценка наличия грубых измерений
9
Среди серии параллельных измерений могут встретиться значения, которые резко отличаются от остальных результатов и которые следовало бы отбросить как недостоверные.
Однако сделать это можно лишь после предварительного исследования, т.к. необходимо выяснить, является ли данный результата следствием грубой погрешности (промаха). Существует несколько критериев для решения этого вопроса.
Простейший способ проверки основан на использовании правила трех сигм. В этом
случае необходимо знать величину среднего арифметическогох и стандартного отклонения
выборки s. Грубым будет считаться измерение, выпадающее за границы х  3s.
Наиболее предпочтителен для проверки так называемый Q-критерий. Для его использования необходимо сначала расположить все результаты серии измерений по ранжиру
(т.е. в порядке возрастания или убывания):
х1  х2  х3  х4  …  хn или х1  х2  х3  х4  …  хn
Сомнительное значение может находиться либо в начале ряда (х1), либо в конце (хn).
Для этого значения находят разность между ним и ближайшим к нему значениями делят ее на размах варьирования  = хn - х1.
Полученное значение Qэксп сравнивают со значением Qтабл, зависящим от выбранных
доверительной вероятности Р и объема выборки n и взятом из специальной таблицы (Приложение, табл. 1). Доверительную вероятность для проверки промахов по Q-критерию обычно полагают равной 90%.
Если Qтабл  Qэксп, то сомнительный результат следует сохранить.
Пример. При анализе проб воды получено содержание взвешенных веществ, мг/л:
55,95; 56,00; 56,04; 56,08; 56,23. Следует ли исключить последнее значение, т.е. является ли
оно грубым промахом?
1) Используем правило трех сигм.
Определим выборочное среднее значение по формуле (5):
55,95+56,00+56,04+56,08+56,23
280,30
𝑥=
=
= 56,06 мг/м3.
5
5
Вычислим дисперсию по формуле (6):
(55,95−56,06)2 +(56,00−56,06)2 +(56,04−56,06)2 +(56,08−56,06)2 +(56,23−56,06)2
0,0454
𝑠2 =
= 4 = 0,011
5−1
Поскольку стандартное отклонение представляет собой квадратный корень из выборочной дисперсии, то 𝑠 = √0,011 = 0,10мг/м3.
Находим границы интервала 𝑥 ± 3𝑠:
𝑥 − 3𝑠 = 56,06 − 3 ⋅ 0,10 = 55,76
𝑥 + 3𝑠 = 56,06 + 3 ⋅ 0,10 = 56,36
Так как все исходные данные входят в диапазон от 55,76 до 56,36 мг/м3, то грубых
измерений нет.
2) Используем Q-критерий.
Рассчитаем размах варьирования:  = 56,23 – 55,95 = 0,28.
56,23−56,08
0,15
Тогда 𝑄эксп =
=
= 0,54.
0,28
0,28
Для n = 5 значение Qтабл при Р = 90% равно 0,56 (см. табл. 1 Приложения), т.е.
Qтабл  Qэксп. Результат следует оставить, он не является грубым измерением (промахом).
Таким образом, оба способа проверки дали аналогичные результаты.
4.5. Вычисление доверительного интервала
В связи с тем, что операции отбора, подготовки и анализа проб характеризуются
определенными погрешности, никогда нельзя утверждать, что полученная в итоге численная
характеристика объекта окружающей средых (например, концентрация загрязняющего вещества) является истинной (т.е.х = ). И поскольку результат мониторинга является лишь
некоторым приближением к истинному значению измеряемой величины, возникает вопрос о
близости полученного значения к истинному. Для ответа на это вопрос используют величину
10
доверительного интервала. Доверительным называют интервал, который покрывает неизвестный параметр с заданной вероятностью.
Как уже было сказано, среднее арифметическое значениех, рассчитанное для выборки результатов измерения какого-либо показателя качества продукции, как правило, отличается от истинного среднего  генеральной совокупности, к которой принадлежит эта выборка. Однако, при очень большом числе повторений серии измерений в 100 % всех случаев
среднее . должно между некоторыми пределами - и +:
𝑥−𝜀 ≤𝜇 ≤𝑥+𝜀
Эти пределы называют доверительным интервалом (ДИ) и могут обозначать x.
Указывая ДИ, характеризуют надежность измеренного значения. При этом величину, равную
х -  называют нижней границей доверительного интервала, а величину, равную х + 
верхней границей доверительного интервала.
Доверительный интервал используют как характеристику среднего значениях, при
этом само среднее арифметическое для выборки задается в виде:
х±
𝑡(𝛼,𝜈)𝑠
√𝑛
= 𝑥 ± 𝛥𝑥
(18)
где t(,) – критерий Стьюдента,
 - уровень значимости,  = (1 – Р)/2, где Р – доверительная вероятность,
 – число степеней свободы,  = n - 1
s– стандартное отклонение выборки,
n – число параллельных определенийx.
Границы ДИ справедливы только в том случае, когда выполняется t – распределение,
а также гауссово распределение. Поэтому перед определением ДИ рекомендуется проверить
серию измерений на нормальность.
Пример. При анализе почвы на содержание нефтепродуктов были определены следующие концентрации, мг/кг: 38,71; 38,90; 38,62; 38,74. Определите доверительный интервал измерений, считая уровень значимости  равным 0,025.
Найдем значение критерия Стьюдента в табл. 2 Приложения. Для этого определим
число степеней свободы  и доверительную вероятность Р:
=n–1=4–1=3
Р = 1 - 2 = 1 - 20,025 = 0,95
Тогда критерий Стьюдента будет равен t(0,025;3) = 3,18
Для расчета стандартного отклонения найдем выборочное среднее х = 38,74 мг/кг.
Отсюда s = 0,12 мг/кг.
Из уравнения (18) доверительный интервал равен 𝛥х =
3,18⋅0,12
√4
= 0,19 мг⁄кг.
Таким образом, результаты анализа с соответствующим доверительным интервалом имеют вид: (38,740,19) мг/кг при  = 0,025.
5. Проверка значимости гипотез
В практике мониторинга нередко возникает необходимость сравнения двух средних
выборочных значений. Так бывает, когда одну и ту же пробу анализируют разными методами, либо при поиске источника воздействия сравнивают пробы, отобранные в различных местах. В таких случаях важно установить, является ли разница результатов статистически значимой.
К такому роду проверок относится проверка так называемой нуль-гипотезы. Нульгипотеза – это предположение о том, что различие между двумя численно неравными величинами носит чисто случайный характер, т.е. что в статистическом смысле эти величины
равны. Вероятность появления наблюдаемого расхождения в результате случайных ошибок
11
оценивают по законам статистики. Если расхождение равно или больше расхождения, которое могло бы появиться на заданной доверительной вероятности, нуль гипотеза не принимается и расхождение считается значимым. В зависимости от требуемой достоверности суждения выбирают ту или иную доверительную вероятность.
5.1. Применение доверительного интервала разности средних
Пусть имеются две выборки: выборка 1 и выборка 2. Надо решить вопрос: действительно ли они различаются? Неравенство выборочных средних, т.е. то, чтох1 -х2  0, еще
не свидетельствует о неравенстве истинных средних генеральных совокупностей, к которым
принадлежат эти выборки, т.е. о том, что 1 - 2 0 (главным образом потому, что выборки из
генеральной совокупности получают случайным образом).
Можно поставить вопрос иначе: больше ли доверительный интервал разности средних
ДИх, чем сама разность средних х? Если это так, то при заданном уровне значимости
статистически ощутимых различий между двумя выборками не существует и наоборот. Т.е.
при ДИх  х выборки принадлежат одной генеральной совокупности (статистически
значимых различий между ними нет, а при ДИх  х выборки принадлежат разным генеральным совокупностям.
ДИ разности средних вычисляют по формуле:
1
1
ДИ = ±𝑡(𝛼, 𝜈)𝑠кол √𝑛 + 𝑛
1
(19)
2
где n1 и n2 – объем первой и второй выборок соответственно,
t(,) – критерий Стьюдента, для вычисления которого уровень значимости  обычно
принимают равным 0,025, а число степеней свободы  рассчитывают следующим образом:
 = n1 + n2 – 2,
sкол – коллективной стандартное отклонение, которое рассчитывают с учетом данных, входящих в обе выборки. Квадрат коллективного стандартного отклонения представляет собой коллективную дисперсию s2кол:
𝑛
𝑛
𝑠
2кол
=
1 (𝑥 −𝑥 )+∑ 2 (𝑥 −𝑥 )
∑𝑖=1
1
2
1𝑖
𝑖=1 2𝑖
(𝑛1 −1)+(𝑛2 −1)
(20)
Пример. Систематические измерения рН воды в фоновой и импактной зонах р. Волга
привели к получению следующих результатов:
№ опыта
1
2
3
4
5
6
7
8
9
Выборка 1
8,67 8,61 8,66 8,66 8,52 8,66 8,65 8,65 8,67
Выборка 2
8,35 8,38 8,40 8,32 8,35 8,39 8,40
Есть статистически значимое различие между этими данными, полученными на
значительном расстоянии друг от друга?
Рассчитаем выборочные средние по формуле (5) и разность между ними:
х1 = 8,63;х2 = 8,37; х = 8,63 - 8,37 = 0,26.
Используя формулу (20), вычислим коллективную дисперсию:
(8,67 − 8,63)2 + (8,61 − 8,63)2 + ... + (8,35 − 8,37)2 + (8,38 − 8,37)2 + ... 0,0248
2
𝑠кол =
=
(9 − 1) + (7 − 1)
14
= 0,00177
Тогда коллективное стандартное отклонение 𝑠кол = √0,00177 = 0,042
Поскольку  = n1 + n2 – 2 = 9 + 7 – 2 = 14 и доверительная вероятность Р = 1 - 2 =
=1 - 20,025 = 0,95, то с помощью табл. 2 Приложения находим критерий Стьюдента:
t(0,025;14) = 2,14.
Находим величину доверительного интервала разности средних по формуле (19):
12
ДИ𝛥𝑥 = ±
2,14 ⋅ 0,042
= ±0,18
1
1
√ +
9 7
Таким образом, ДИх  х, что говорит о статистической значимости различий
между полученными результатами, которая, скорее всего, обусловлена разными местами
измерений.
5.2. Использование F – критерия. Сравнение дисперсий двух выборок
Корректный способ сравнения двух выборочных средних значений существует только
для случая, когда обе серии значений имеют статистически одинаковые, т.е. незначимо различающиеся, дисперсии. Поэтому сравнению средних значений, как правило, предшествует
сравнение соответствующих дисперсий.
Проверку нуль-гипотезы о незначимом различии двух дисперсий проводят с помощью
F-критерия. Для этого вычисляют отношение
𝑠2
𝐹эксп = 𝑠12
(21)
2
где s21 – большая по значению дисперсия, s22 – меньшая. Поэтому значение F всегда
больше единицы.
Если рассчитанное значение Fэксп не превышает табличное значение Fтабл (см. табл. 3
Приложения), то для заданного уровня значимости и числа степеней свободы между дисперсиями не существует значимой разницы.
Т.е. при Fэксп  Fтабл дисперсии однородны (выборки можно объединить в одну), а
при Fэксп  Fтабл дисперсии неоднородны (выборки объединять нельзя).
При незначимой разнице дисперсий находят средневзвешенную дисперсию
2
𝑠 =
(𝑛1 −1)𝑠12 +(𝑛2 −1)𝑠22
(𝑛1 −1)+(𝑛2 −1)
(22)
а затем рассчитывают значение критерия Стьюдента
𝑡=
|𝑥1 −𝑥2 |
√𝑠 2
𝑛1 ⋅𝑛2
√𝑛
1 +𝑛2
(23)
и сравнивают его с табличным значением коэффициента для заданного уровня значимости и числа степеней свободы  = n1 + n2 – 2. Если рассчитанное значение не превышает
табличного, то различие между х1 их2 является незначимым. При этом все рассматриваемые результаты принадлежат одной выборке объемом n = n1 + n2, и их можно обработать
совместно для нахождения общего среднего х и стандартного отклонения s. Напомним, что
если объем такой объединенной выборки будет больше 20, можно рассчитанное значение s
принять равным стандартному отклонению генеральной совокупности .
Пример. На территории промплощадки два сотрудника определяли концентрацию
взвешенных веществ в воздухе. Первый получил следующие результаты: 38,20; 38,00; 37,66
мг/м3; второй – 37,70; 37,65; 37,55 мг/м3. Значимо ли различаются результаты, полученные
разными людьми? Можно ли объединить выборки?
Сначала по формулам (5) и (6) вычислим выборочные средние и дисперсии:
х1 = 37,95 мг/м3 ;х2 = 37,63 мг/м3; s21 = 0,07453; s22 = 0,00583.
Проводим сравнение дисперсий по F-критерию с использованием формулы (21):
0,07453
𝐹′эксп =
= 12,78
0,00583
Сопоставляем это значение с табличным для 1 = 2 и 2 = 2, приняв  = 0,025
(Р = 0,95). Оно равно F0,025;2;2 = 19,2  Fэксп, поэтому расхождение между дисперсиями незначимо.
Теперь установим, существует ли значимая разница между средними значениями.
Рассчитаем значение средневзвешенной дисперсии по формуле (22):
13
2
𝑠 =
2 ⋅ 0,07453 + 2 ⋅ 0,00583
= 0,04018
(3 − 1) + (3 − 1)
Величина t по формуле (23): 𝑡 =
37,95−37,63
√0,04018
3⋅3
√
3+3
= 1,96. Сравниваем полученное зна-
чение с табличным при  = 0,025 и  = n1 + n2 – 2 =
= 3 + 3 – 2 = 4: t(0,025;4) = 2,78.
Так как t  tтабл, то значимой разницы между средними значениями нет, поэтому две выборки можно объединить в одну, для которойх = 37,79 мг/м3; s = 0,25.
14
Приложение
Таблица 1. Численные значения Q-критерия

Р
0,95
0,94
0,77
0,64
0,56
0,51
0,48
0,46
0,44
0,90
0,89
0,68
0,56
0,48
0,43
0,40
0,37
0,34
2
3
4
5
6
7
8
9
0,99
0,99
0,89
0,76
0,70
0,64
0,58
0,53
0,48
Таблица 2. Процентные точки t-распределения в зависимости от вероятности Р (двусторонняя постановка задачи) иР (односторонняя постановка задачи) и числа степеней свободы .

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
40
60


P = 0,50
1,00
0,816
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700
0,697
0,695
0,694
0,692
0,691
0,690
0,689
0,688
0,688
0,687
0,684
0,683
0,681
0,679
0,674
P = 0,75
0,75
2,41
1,60
1,42
1,34
1,30
1,27
1,25
1,24
1,23
1,22
1,21
1,21
1,20
1,20
1,20
1,19
1,19
1,19
1,19
1,18
1,18
1,17
1,17
1,16
1,15
0,875
0,90
6,31
2,92
2,35
2,13
2,01
1,94
1,89
1,86
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,75
1,74
1,73
1,73
1,73
1,71
1,70
1,68
1,67
1,64
0,95
15
0,95
12,70
4,30
3,18
2,78
2,57
2,45
2,36
2,31
2,26
2,23
2,20
2,18
2,16
2,14
2,13
2,12
2,11
2,10
2,09
2,09
2,06
2,04
2,02
2,00
1,96
0,975
0,98
31,82
6,97
4,54
3,75
3,37
3,14
3,00
2,90
2,82
2,76
2,72
2,68
2,65
2,62
2,60
2,58
2,57
2,55
2,54
2,53
2,49
2,46
2,42
2,39
2,33
0,99
0,99
63,70
9,92
5,84
4,60
4,03
3,71
3,50
3,36
3,25
3,17
3,11
3,05
3,01
2,98
2,95
2,92
2,90
2,88
2,86
2,85
2,79
2,75
2,70
2,66
2,58
0,995
Таблица 3. F-критерий при вероятности появления Р = 0,95
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
40
60
120

1
164,4
18,5
10,1
7,7
6,6
6,0
5,6
5,3
5,1
5,0
4,8
4,8
4,7
4,6
4,5
4,5
4,5
4,4
4,4
4,4
4,3
4,3
4,2
4,2
4,2
4,1
4,1
3,9
3,8
2
199,5
19,2
9,6
6,9
5,8
5,1
4,7
4,5
4,3
4,1
4,0
3,9
3,8
3,7
3,7
3,6
3,6
3,6
3,5
3,5
3,4
3,4
3,4
3,3
3,3
3,2
3,2
3,1
3,0
3
215,7
19,2
9,3
6,6
5,4
4,8
4,4
4,1
3,9
3,7
3,6
3,5
3,4
3,3
3,3
3,2
3,2
3,2
3,1
3,1
3,1
3,0
3,0
3,0
2,9
2,9
2,8
2,7
2,6
1
5
230,2
19,3
9,0
6,3
5,1
4,4
4,0
3,7
3,5
3,3
3,2
3,1
3,0
3,0
2,9
2,9
2,8
2,8
2,7
2,7
2,7
2,6
2,6
2,6
2,5
2,5
2,4
2,3
2,2
4
224,6
19,3
9,1
6,4
5,2
4,5
4,1
3,8
3,6
3,5
3,4
3,3
3,2
3,1
3,1
3,0
3,0
2,9
2,9
2,9
2,8
2,8
2,7
2,7
2,7
2,6
2,5
2,5
2,4
6
234,0
19,3
8,9
6,2
5,0
4,3
3,9
3,6
3,4
3,2
3,1
3,0
2,9
2,9
2,8
2,7
2,7
2,7
2,6
2,6
2,6
2,5
2,5
2,4
2,4
2,3
2,3
2,2
2,1
12
244,9
19,4
8,7
5,9
4,7
4,0
3,6
3,3
3,1
2,9
2,8
2,7
2,6
2,5
2,5
2,4
2,4
2,3
2,3
2,3
2,2
2,2
2,2
2,1
2,1
2,0
1,9
1,8
1,8
24
249,0
19,5
8,6
5,8
4,5
3,8
3,4
3,1
2,9
2,7
2,6
2,5
2,4
2,3
2,3
2,2
2,2
2,1
2,1
2,1
2,0
2,0
2,0
1,9
1,9
1,8
1,7
1,6
1,5

254,3
19,5
8,5
5,6
4,4
3,7
3,2
2,9
2,7
2,5
2,4
2,3
2,2
2,1
2,1
2,0
2,0
1,9
1,9
1,8
1,8
1,7
1,7
1,7
1,6
1,5
1,4
1,3
1,0
Литература
1. ГОСТ Р ИСО 5725-2002. Часть 1-6.
2. Гмурман В.Е. Теория вероятностей и математическая статистика. – 9-е изд., стер. – М.:
Высш. Шк., 2003.
3. Дерффель К. Статистика в аналитической химии. Пер. с нем. – М.: Мир, 1994.
4. Систематические и случайные погрешности химического анализа. – М.: ИКЦ «Академкнига», 2004.
16
Download