Терехина организация эксперимента

реклама
Терехина О.С.
Организация научного и
инженерного эксперимента
Министерство образования и науки РФ
ГОУ ВПО «Волжский государственный инженерно-педагогический
университет»
Организация инженерного и научного
эксперимента
Методическое пособие для студентов
Нижний Новгород
2010
2
Содержание
Введение
1.
2.
5
Эксперимент как предмет исследования
1.1.
Понятие эксперимента
1.2.
Классификация видов экспериментальных
5
исследований
6
Контрольные вопросы
15
Краткие сведения из теории вероятностей и математической
статистики
3.
5
16
2.1.
Случайные величины и их характеристики
16
2.2.
Нормальный закон распределения и его свойства
22
Контрольные вопросы
30
Предварительная обработка экспериментальных данных
31
3.1.
Основные понятия выборочного метода
31
3.2.
Точечное оценивание параметров распределений
33
3.2.1. Оценка истинного значения измеряемой величины
33
3.2.2. Оценка точности измерений. Оценка дисперсии
34
3.3.
Распределение среднего арифметического для
выборок из нормальной совокупности. Распределение
Стьюдента
3.4.
Распределение дисперсии в выборках из нормальной
совокупности. Распределение 𝜒 2 – Пирсона
3.5.
42
Интервальные оценки числовых характеристик случайных
величин
3.7.
39
Распределение отношений дисперсий.
Распределение Фишера или f – распределение
3.6.
36
42
Оценка математического ожидания (истинного значения
измеряемой величины)
45
Контрольные вопросы
47
4. Оценка погрешностей результатов измерений
47
3
4.1. Типы погрешностей измерения
47
4.1.
Суммарная погрешность измерения
50
4.2.
Погрешность косвенных измерений
52
4.3.
Учет погрешности в записи окончательного результата
измерения
54
Контрольные вопросы
54
5. Проверка статистических гипотез
54
5.1.
Основные определения
54
5.2.
Отсеивание грубых промыхов опыта
57
5.3.
Гипотеза о равенстве математического ожидания заданному
значению
58
5.4.
Гипотеза о равенстве средних
59
5.5.
Гипотеза о равенстве дисперсий
60
5.6.
Однородность дисперсии нескольких выборок
равного объема. Критерий Кохрана
5.7.
Однородность дисперсии выборок разного объема.
Критерий Бартлета 
5.8.
61
Непараметрические гипотезы
60
62
5.8.1. Проверка случайности и независимости
результатов измерений в выборках
62
5.8.2. Проверка гипотезы о законе распределения
63
5.8.3. Критерий согласия Шапиро - Уилка (W)
66
5.8.4. Критерий принадлежности двух независимых
выборок единой генеральной совокупности
Контрольные вопросы
6. Планирование эксперимента
67
68
69
6.1.
Стадии активного эксперимента
69
6.2.
Предварительное планирование эксперимента
71
Контрольные вопросы
72
Список литературы
73
4
Введение
Инженеру зачастую приходится решать задачи по планированию,
проведению
экспериментальных
исследований,
обработке
результатов
инженерного эксперимента. Развитие современных методов математического
планирования
и
обработки
результатов
инженерного
эксперимента,
расширение возможностей современной компьютерной техники позволяют
рекомендовать исследователю общие подходы, методы и процедуры
планирования и обработки его результатов.
Предлагаемое методическое указание предназначено для студентов
инженерных специальностей. Изложены основы планирования эксперимента,
анализа экспериментальных данных и порядок оформления результатов
эксперимента.
1. Эксперимент как предмет исследования
1.1.
Понятие эксперимента
Во
многих
областях
научной
и
практической
деятельности
современного человека значительное место занимают теоретические методы
изучения различных объектов и процессов окружающего нас мира. Однако,
несмотря
на
высокую
эффективность
теоретических
методов,
при
рассмотрении конкретных технологических проблем, особенно в условиях
действующего производства, инженеру зачастую приходится сталкиваться с
задачами, решение которых практически невозможно без организации и
проведения того или иного экспериментального исследования.
С общефилософской точки зрения эксперимент (от латинского
experimentium – проба, опыт) – это чувственно-предметная деятельность в
науке; в более узком смысле – опыт, воспроизведение объекта познания,
проверка гипотез и т.д.
В технической литературе термину эксперимент устанавливается
следующее определение –
система операций, воздействий
наблюдений,
на
направленных
получение
информации
об
и (или)
объекте
исследования.
5
Эксперимент, являясь источником познания, играет очень важную роль
как в науке, так и в инженерной практике. Эксперименты ставятся в
исследовательских лабораториях и на действующем производстве, в
медицинских клиниках и на опытных сельскохозяйственных полях, в
космосе и в глубинах океана.
При организации научного и инженерного эксперимента стремятся
сократить число рассматриваемых переменных, для того чтобы уменьшить
объем эксперимента, пытаются исключить влияние случайных внешних
воздействий, оценивают точность измерительных приборов и точность
получения данных.
В процессе любого эксперимента анализируют
полученные результаты и стремятся дать их интерпретацию, поскольку без
этого решающего этапа весь процесс экспериментального исследования не
имеет смысла.
Современные методы планирования эксперимента и обработки его
результатов,
разработанные
на
основе
теории
вероятностей
и
математической статистики, позволяют существенно (зачастую в несколько
раз) сократить число необходимых для проведения опытов. Знание и
использование этих методов делает работу экспериментатора более
целенаправленной
и
организованной,
существенно
повышает
как
производительность его труда, так и надежность получаемых им результатов.
Как и любая другая научная дисциплина, организация и планирование
эксперимента
имеют
свою
строго
определенную,
во
многом
регламентируемую стандартами (ГОСТ 15895-77, ГОСТ 16504-81, ГОСТ
24026-80), терминологию, для первоначального знакомства с которой мы
рассмотрим классификацию видов эксперимента.
1.2.
Классификация видов экспериментов
Любой эксперимент предполагает проведение тех или иных опытов.
Опыт – воспроизведение исследуемого явления в определенных
условиях проведения эксперимента при возможности регистрации его
результатов.
6
По цели проведения и форме представления полученных результатов
эксперимент делят на качественный и количественный.
Качественный
эксперимент
устанавливает
только
сам
факт
существования какого-либо явления, но при этом не дает никаких
количественных характеристик объекта исследования. Любой эксперимент,
каким бы сложным он ни был, всегда заканчивается представлением его
результатов,
формулировкой
выводов,
выдачей
рекомендаций.
Эта
информация может быть выражена в виде графиков, чертежей, таблиц,
формул, статистических данных или словесных описаний. Качественный
эксперимент как раз и предусматривает именно словесное описание его
результатов.
Пример 1. Если взять два куска стальной проволоки диаметром 5,0 мм,
один из которых после пластической деформации не имел термической
обработки (проволока 5,0-II ГОСТ 3282-74), а второй прошел операции
отжига (проволока 5,0-О-С ГОСТ 3282-74), и подвергнуть их нескольким
перегибам, то легко убедиться, что термически не обработанный металл
разрушается раньше (при меньшем числе перегибов), т.е. имеет меньшую
пластичность.
Однако
словесное
описание
–
не
самый
эффективный
и
информативный способ представления результатов эксперимента, поскольку
он не позволяет дать количественных рекомендаций, проанализировать
свойства объекта в иных условиях. Поэтому в инженерной практике
основное
содержание
эксперимента
представляется
числом
и
количественными зависимостями.
Количественный
эксперимент
не
только
фиксирует
факт
существования того или иного явления, но, кроме того, позволяет установить
соотношения
между
количественными
характеристиками
явления
и
количественными характеристиками способов внешнего воздействия на
объект исследования.
7
В условиях примера 1, для того чтобы перевести эксперимент из
разряда "качественный" в "количественный", необходимо:
− определить и количественно описать те параметры процесса отжига и
те свойства материала, которые по предположению могут повлиять на
пластичность
стали
(например:
температура
отжига,
ºС;
скорость
охлаждения, ºС/ч, фактический химический состав стали, из которой
изготовлена проволока и т.д.);
− выбрать ту или иную количественную характеристику пластичности
металла (например, число перегибов проволоки к моменту ее разрушения по
ГОСТ 1579-93);
− в результате эксперимента необходимо установить количественную
зависимость между пластичностью проволоки и параметрами процесса
термообработки, с учетом тех возможных колебаний химического состава,
которые допустимы для данной марки стали.
Итак, количественный эксперимент, прежде всего, предполагает
количественное определение всех тех способов внешнего воздействия на
объект исследования, от которых зависит его поведение – количественное
описание всех факторов.
Например, в качестве факторов рассматриваемого иллюстративного
эксперимента можно выбрать температуру отжига, скорость охлаждения,
процентное содержание углерода или любого другого химических элемента,
регламентированного для данной марки стали.
В отдельном конкретном опыте каждый фактор может принимать одно
из возможных своих значений – уровень фактора.
Уровень фактора – фиксированное значение фактора относительно
начала отсчета.
Например, одним уровнем такого фактора, как скорость охлаждения
при отжиге, может быть 50 ºС/ч, другим – 100 ºС/ч и т.д.
8
Фиксированный набор уровней всех факторов в каждом конкретном
опыте как раз и определяет одно из возможных состояний объекта
исследования.
Все факторы можно разбить на три группы:
− контролируемые и управляемые – это факторы, для которых можно
не только зарегистрировать их уровень, но еще и задать в каждом
конкретном опыте любое его возможное значение;
− контролируемые, но неуправляемые факторы – это факторы, уровни
которых можно только регистрировать, а вот задать в каждом опыте их
определенное значение практически невозможно;
−
неконтролируемые
–
это
факторы,
уровни
которых
не
регистрируются экспериментатором и о существовании которых он даже
может и не подозревать.
В примере 1 в качестве контролируемых и управляемых факторов
можно очень вероятно рассматривать температуру отжига и скорость
охлаждения проволоки. А вот фактическое процентное содержание
различных химических элементов стали, по всей видимости, попадет в
группу контролируемых, но неуправляемых факторов. Дело здесь в том, что
химический состав еще может и удастся зарегистрировать (переписав его из
паспорта плавки или из сопроводительных документов на данную партию
проволоки),
но
вот
задать,
в
условиях
реального
действующего
сталеплавильного производства, для каждого опыта строго определенное
процентное
содержание,
например,
углерода
–
задача
практически
невыполнимая. Наконец, к группе неконтролируемых факторов в этом
примере можно отнести массу причин, по которым может измениться
пластичность металла (неравномерность деформации металла по длине бунта
проволоки в процессе прокатки или при волочении, неблагоприятные
условия хранения металла, приводящие к его повышенной коррозии, и т.д. и
т.п., на сколько в данном случае хватит фантазии исследователя).
9
В количественном эксперименте необходимо не только регистрировать
уровни
всех
контролируемых
факторов,
устанавливать
количественное
описание
но
и
того
иметь
возможность
свойства
(отклика)
исследуемого явления, которое изучает (наблюдает) экспериментатор.
Причем поскольку на объект исследования в процессе эксперимента всегда
влияет огромное количество неконтролируемых факторов, что вносит в
получаемые результаты некоторый элемент неопределенности, значение
отклика, в каждом конкретном опыте, невозможно предсказать заранее.
Поэтому воспроизведение исследуемого явления при одном и том же
фиксированном наборе уровней всех контролируемых факторов всегда будет
приводить к различным значениям отклика, т.е. отклик – это всегда
случайная величина.
Отклик – наблюдаемая случайная переменная, по предположению
зависящая от факторов.
Откликом в условиях примера 1. является пластичность стальной
проволоки (количество перегибов к моменту разрушения). Причем, даже
если взять куски проволоки от одного и того же мотка, т.е. металл одной
плавки, одинакового химического состава, имеющий один и тот же режим
термообработки при одинаковой температуре отжига и скорости охлаждения,
то при этом для каждого куска проволоки мы получим разные, хотя и очень
близкие друг к другу, значения пластичности металла.
И наконец, в результате количественного эксперимента необходимо
найти зависимость между откликом и факторами – функцию отклика.
Причем поскольку отклик – это случайная величина, то, с точки зрения
теории вероятностей, его можно задать одним из параметров своего
распределения, например математическим ожиданием.
Функция отклика – зависимость математического ожидания отклика от
факторов.
10
В примере с проволокой – это зависимость математического ожидания
величины пластичности стали от температуры отжига, скорости охлаждения
и химического состава металла
С учетом приведенного выше деления факторов на три группы,
функцию отклика в самом общем случае можно записать в виде
My = f (xi, hj) + εδ , (1.1)
где My – математическое ожидание отклика;
xi – контролируемые и управляемые факторы;
hj – контролируемые, но неуправляемые факторы;
εδ – ошибка эксперимента, учитывающая влияние неконтролируемых
факторов.
По тому, какой группой факторов располагает исследователь,
количественный эксперимент в свою очередь можно разделить еще на два
вида. Если в распоряжении экспериментатора нет управляемых факторов, то
такой эксперимент носит название пассивного.
Пассивный эксперимент – эксперимент, при котором уровни факторов
в каждом опыте регистрируются исследователем, но не задаются.
Поскольку при пассивном эксперименте исследователь не имеет
возможность задать уровень ни одного из факторов, то при проведении
опытов
ему
остается
регистрировать
лишь
результаты.
"пассивно"
Планирование
наблюдать
за
пассивного
явлением
и
эксперимента
сводится к определению числа опытов, которые необходимо провести
исследователю для решения поставленной перед ним задачи, а конечной
целью пассивного эксперимента в большинстве случаев является получение
функции отклика в виде
My = f (hj) + εδ. (1.2)
Если
же
экспериментатор
имеет
возможность
не
только
контролировать факторы, но и управлять ими, то такой эксперимент носит
название активного.
11
Активный эксперимент – эксперимент, в котором уровни факторов в
каждом опыте задаются исследователем.
Поскольку в случае активного эксперимента исследователь имеет
возможность "активно" вмешиваться в исследуемое явление, то естественно,
что активный эксперимент всегда предполагает какой-либо план его
проведения.
План эксперимента – совокупность данных, определяющих число,
условия и порядок реализации опытов.
Поэтому
активный
эксперимент
всегда
должен
выбор
плана
начинаться
с
планирования.
Планирование
эксперимента
–
эксперимента,
удовлетворяющего поставленным требованиям.
К
требованиям,
предъявляемым
при
планировании
активного
эксперимента, можно отнести степень точности и надежности результатов,
полученных после проведения эксперимента, сроки и средства, имеющиеся в
распоряжении исследователя, и т.д.
Целью активного эксперимента может быть либо определение функции
отклика в виде
My = f (xi) + εδ, (1.3)
либо поиск такого сочетания уровней управляемых факторов xi, при котором
достигается оптимальное (экстремальное – минимальное или максимальное)
значение функции отклика. В этом последнем случае эксперимент носит еще
название поискового (экстремального) эксперимента.
Например, если в случае с разрушением проволоки мы бы поставили
перед собой целью найти такое сочетание температуры отжига и скорости
охлаждения, при которых пластичность металла была бы максимальной, то
наш эксперимент стал бы поисковым.
По условиям проведения различают лабораторный и промышленный
эксперименты.
12
Лабораторный
эксперимент.
В
лаборатории
меньше
влияние
случайных погрешностей, обеспечивается большая "стерильность" условий
проведения опытов, в большинстве случаев осуществляется и более
тщательная подготовка, одним словом, выше "культура эксперимента". Как
правило, в лабораторных условиях экспериментатор может воспроизвести
опыт "одинаково" значительно лучше, чем в промышленности. Это означает,
что при прочих равных условиях для установления некоторого факта на
заводе потребуется выполнить значительно больше опытов, чем в
лаборатории.
Другое
важное
отличие
–
это
большая
возможность
варьировать (изменять) уровни факторов. Когда в лаборатории исследуется
химическая реакция, температуру по желанию можно менять в широких
пределах, а в металлургических печах, напротив, если ее и можно менять, то
в значительно более узком диапазоне и с большей осторожностью.
Промышленный эксперимент. В промышленных условиях обеспечить
условия лабораторного эксперимента значительно труднее. Усложняются
измерения и сбор информации, значительно большее влияние на объект
исследования и измерительные приборы оказывают различного рода помехи
(резко
возрастает
промышленном
число
неконтролируемых
эксперименте
особенно
факторов),
необходимо
поэтому
в
использовать
специальные статистические методы обработки результатов. Кроме того, на
реальном действующем производстве всегда желательно по возможно
меньшему числу измерений получить наиболее достоверные результаты.
Известны также следующие виды эксперимента.
2. Сравнительный эксперимент преследует обычно весьма простую
цель: оценить влияние каждого фактора на процесс, расположить их в ряд по
степени влияния на интересующий нас показатель процесса.
3. Отсеивающий эксперимент позволяет отобрать для исследования
лишь те факторы, которые существенно влияют на процесс.
13
4. Экстремальный эксперимент. Это эксперимент, цель которого
выявление оптимальных режимов, оптимальных составов и оптимальных
конструктивных параметров.
5. Аппроксимирующий эксперимент, т.е. эксперимент, проводимый с
целью выявления математической модели процесса.
6.
Численный
эксперимент,
при
котором
вместо
физического
эксперимента производится вычисление интересующей нас величины по
известному сложному математическому выражению или их набору.
Кроме этого существуют однофакторный, многофакторный и полный
факторный эксперименты.
Однофакторный
пассивный
эксперимент
проводится
путем
выполнения n пар измерений в дискретные моменты времени единственного
входного параметра х и соответствующих значений выходного параметра у.
Аналитическая
зависимость
между
этими
параметрами
вследствие
случайного характера возмущающих воздействий рассматривается в виде
зависимости математического ожидания Му от значения Хi, носящей
название регрессионной. Целью однофакторного пассивного эксперимента
является построение регрессионной модели - установление зависимости
y  f x .
Многофакторный пассивный эксперимент проводится при контроле
значений нескольких входных параметров Х и его целью является
установление зависимости выходного параметра от двух или более
переменных y=F (x1, x2, xn).
Полный факторный эксперимент предполагает возможность управлять
объектом по одному или нескольким независимым каналам.
При многофакторном и полном факторном эксперименте выходных
параметров может быть несколько.
Управляющие
переменные,
параметры
которые
можно
Х
представляют
изменять
для
собой
управления
независимые
выходными
параметрами. Управляющие параметры называют факторами. Если i=1
14
(один
управляющий
параметр),
то
эксперимент
однофакторный.
Многофакторный эксперимент соответствует конечному числу управляющих
параметров. Полный факторный эксперимент соответствует наличию
возмущающих воздействий в многофакторном эксперименте.
Полный факторный эксперимент характеризуется тем, что при
фиксированных возмущающих воздействиях W минимальное число уровней
каждого фактора равно двум. В этом случае, зафиксировав все факторы Х
кроме одного, необходимо провести два измерения, соответствующих двум
уровням этого фактора. Последовательно осуществляя такую процедуру для
каждого из факторов Х, получим необходимое число N опытов в полном
факторном эксперименте для реализации всех возможных сочетаний уровней
k
факторов N  2 , где k - число факторов.
Контрольные вопросы
1. Что
такое эксперимент? Какова его роль в инженерной практике?
2. Приведите классификации видов экспериментальных исследований.
3.
В
чем
заключаются
принципиальные
отличия
активного
эксперимента от пассивного?
4.
Поясните
преимущества
и
недостатки
лабораторного
и
промышленного эксперимента.
5. В чем отличие количественного и качественного экспериментов?
6. Дайте определения следующим терминам: опыт, фактор, уровень
фактора, отклик, функция отклика, план и планирование эксперимента.
15
2. Краткие сведения из теории вероятности и математической
статистики
Случайные величины и их характеристики
2.1.
Случайная величина – величина, которая может принимать какое-либо
значение
с
некоторой
вероятностью
из
установленного
множества.
Экспериментальные величины являются случайными. Случайная величина
может быть дискретной или непрерывной.
Дискретная случайная величина – случайная величина, которая может
принимать значения только из конечного или счетного множества
действительных чисел.
Непрерывная случайная величина - случайная величина, которая может
принимать любые значения из конечного или бесконечного интервала.
Если при фиксированном наборе уровней всех контролируемых
факторов провести n измерений отклика X, то в результате будет получен ряд
хотя и близких, но отличающихся друг от друга значений:
Хi (i=1, 2, … n)
где хi – i-ое измерение величины Х;
х1, х2, …, хn – реализация случайной величины Х
Пример 2. В результате изучения работы доменной печи на протяжении
полутора лет было зарегистрировано следующее количество ее остановок в
течение каждого месяца (табл. 1).
Таблица 1
Число остановок доменной печи по месяцам
(общее число наблюдений n = 18)
Месяц
Число
остано
вок
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18
3
4
3
5
5
5
6
4
6
5
5
2
4
6
7
5
6
7
В данном примере число остановок доменной печи в течение месяца это дискретная случайная величина. В первом из n = 18 измерений этой
величины было получено значение x1 = 3, во втором – x2 = 4 и т.д., до x18 = 7.
16
Приведенные в табл. 1 значения – это реализация такой случайной величины,
как число остановок доменной печи в течение месяца.
Каждому значению дискретной случайной величины X (любому из
событий А, когда случайная величина X принимает какое-либо строго
определенное значение x), можно поставить в соответствие следующее
отношение:
W=
𝑚
𝑛
где m – число наблюдений, в которых дискретная случайная величина
X оказалась равна x;
n – общее количество наблюдений.
W - частота реализации события А.
В примере 2, в шести наблюдениях: i = 4, 5, 6, 10, 11 и 16, количество
остановок доменной печи в течение месяца X оказалось равным пяти (X = 5),
следовательно, частота реализации такого события, как пять остановок, равна
6/18 = 0,33. Частоты реализаций для других событий (две, три, четыре и т.д.
остановки) приведены в табл. 2.
Таблица 2
Частота остановок доменной печи
Число остановок x
2
3
4
5
6
7
Количество наблюдений m, в которых
1
2
3
6
4
2
реализовалось событие X = x
Частота реализации, W = m / n
0,06 0,11 0,17 0,33 0,22 0,11
Если продолжить наблюдения за работой доменной печи в течение еще
полутора лет, то, конечно же, совершенно не обязательно, что на протяжении
следующих
восемнадцати
месяцев
пять
остановок
будет
снова
зарегистрировано ровно в 6 случаях из 18 наблюдений, а частота реализации
этого события опять окажется равной 0,33. Однако при возрастании числа
повторений одного и того же комплекса условий частота реализации такого
события, как, например, пять остановок печи в течение месяца, будет
принимать все более и более устойчивое значение. Так, если подсчитать
частоту реализации данного события за 36 месяцев, то она уже практически
17
не будет отличаться от того значения, которое затем можно будет получить
за четыре с половиной года (при условии, что за все это время наблюдений в
работе доменной печи не произойдет никаких существенных изменений).
Предел, к которому стремится отношение m/n при неограниченном
возрастании числа опытов n, называется вероятностью случайного события.
Вероятность P(А) события А – число от нуля до единицы, которое
представляет
собой
предел
частоты
реализации
события
А
при
неограниченном числе повторений одного и того же комплекса условий.
Для дискретной случайной величины можно указать вероятность, с
которой она принимает каждое из своих возможных значений конечного или
счетного множества действительных чисел. Для непрерывной случайной
величины задают вероятность ее попадания в один из заданных интервалов
области ее определения (поскольку вероятность того, что она примет какоелибо конкретное свое значение, стремится к нулю).
Полностью свойства случайной величины описываются законом ее
распределения,
под
которым
понимают
связь
между
возможными
значениями случайной величины и соответствующими им вероятностями.
Распределение случайной величины – функция, которая однозначно
определяет вероятность того, что случайная величина принимает заданное
значение или принадлежит к некоторому заданному интервалу.
В математике используют два способа описания распределений
случайных
величин:
интегральный
(функция
распределения)
и
дифференциальный (плотность распределения).
Функция распределения F(x)– функция, определяющая для всех
действительных х вероятность того, что случайная величина Х принимает
значение не больше, чем х.
F(x)=P(X≤x)
Функция распределения F(x) имеет следующие свойства:
18
1. Ее ордината, соответствующая произвольной точке х1, представляет
собой вероятность того, что случайная величина X будет меньше, чем х1, т.е.
F(x1) = P(Х ≤ x1)
2.
Функция распределения принимает
значение, заключенное
между нулем и единицей:
0≤F(x)≤1
3. Функция распределения стремится к нулю при неограниченном
уменьшении х и стремится к единице при неограниченном возрастании х, то
есть
lim 𝐹(𝑥) = 0
𝑥→−∞
lim 𝐹(𝑥) = 1
𝑥→+∞
4.
Функция
распределения
представляет
собой
монотонно
возрастающую кривую, то есть
F(x2)>F(x1), если х2>х1
5. Ее приращение на произвольном отрезке (х1; х2) равно вероятности
того, что случайная величина X попадет в данный интервал:
F(x2)-F(x1)=P(X≤x2)-P(X≤x1)=P(x1≤X≤x2)
Пусть Х – дискретная случайная величина, принимающая возможные
значения х1, х2,…, хn с вероятностями p1, p2, …, pn . Функция распределения
вероятностей этой случайной величины Х равна
F(x)=P(X≤x)=∑ 𝑝𝑘
Плотность распределения f(x) – первая производная (если она
существует) функции распределения.
𝑑𝐹(𝑥)
f(x)=
𝑑𝑥
,
Плотность функции распределения f(x) имеет следующие свойства:
1.
Плотность
распределения
вероятностей
является
неотрицательной функцией, т.е.
f(x)≥0
19
Это свойство справедливо, так как F(x) есть неубывающая функция.
2.
Функция
распределения
случайной
величины
Х
равна
определенному интегралу от плотности распределения вероятностей в
пределах (−∞, х):
𝑥
F(x)=∫−∞ 𝑓(𝑥)𝑑𝑥
3. Вероятность события, состоящая в том, что случайная величина Х
примет значение, заключенное в полуинтервале [x1, x2], равна определенному
интегралу от плотности распределения вероятностей на этом полуинтервале:
𝑥
P(x1≤X≤x2)= F(x2)-F(x1)=∫𝑥 2 𝑓(𝑥)𝑑𝑥
1
4.Интеграл плотности распределения в бесконечно большом интервале
(-∞, + ∞) равен единице:
𝑥
∫ 𝑓(𝑥)𝑑𝑥 = 𝑃(−∞ < 𝑋 < +∞) = 1,
−∞
так как попадание случайной величины в интервал −∞ < Х< + ∞ есть
достоверное событие.
Связь
между
функцией
распределения
F(x)
и
плотностью
распределения f(x)
𝑃{𝑥 < 𝑋 < 𝑥 + ∆𝑥}
𝐹(𝑥 + ∆𝑥) − 𝐹(𝑥)
= lim
∆𝑥→0
∆𝑥→0
∆𝑥
∆𝑥
Площадь под кривой f(x)=1 или сумма всех вероятностей равна 1.
𝑓(𝑥) = 𝐹 ⋰ (𝑥) = lim
Числовые характеристики случайных величин:
- математическое ожидание (характеризует центр рассеивания);
- дисперсия (характеризует степень рассеивания);
- среднеквадратическое отклонение.
1) Математическое ожидание – центр распределения случайной
величины, около которой группируются опытные значения х.
М(х) = а,
где М(х) – математическое ожидание;
а – значение математического ожидания.
20
- для дискретной случайной величины:
𝑁
𝑀(𝑥) = ∑ 𝑥𝑖 𝑝𝑖 ,
𝑖=1
где хi-значения дискретной случайной величины.
Если в условиях примера 1 предположить, что pi ≈ Wi (см. табл. 2), то
для математического ожидания такой дискретной случайной величины, как
число остановок доменной печи в течение месяца, можно получить
следующее значение:
Mx = 2·0,06 + 3·0,11 + 4·0,17 + 5·0,33 + 6·0,22 + 7·0,11 = 4,87.
- для непрерывной случайной величины:
+∞
𝑀(𝑥) = ∫ 𝑥𝑓(𝑥)𝑑𝑥 ,
−∞
где f(x) – плотность распределения непрерывной случайной величины.
2) Дисперсия (мера рассеивания) – математическое ожидание квадрата
отклонения случайной величины от его математического ожидания
𝐷(𝑥) = 𝑀[𝑋 − 𝑀(𝑥)]2 = 𝑀[𝑋 − 𝑎]2
𝐷(𝑥) = 𝜎𝑥2
где 𝐷(𝑥) - дисперсия оператор (обозначение);
𝜎𝑥2 - значение дисперсии;
Дисперсия имеет размерность квадрата единицы измерения случайной
величины.
Для дискретной случайной
величины
дисперсия
определяется
следующим выражением:
𝑛
𝜎𝑥2 = ∑(𝑥𝑖 − 𝑀𝑥 )2 ∙ 𝑝(𝑥𝑖 )
𝑖=1
В примере 1 (опять же, если предположить, что pi ≈ Wi) значение
дисперсии числа остановок доменной печи равно:
21
2
2
2
2
σx = (2 – 4,87) ·0,06 + (3 – 4,87) ·0,11 + (4 – 4,87) ·0,17 + (5 –
2
2
2
4,87) ·0,33+ (6 – 4,87) ·0,22 + (7 – 4,87) ·0,11 = 1,7931.
Для непрерывной случайной величины дисперсия определяется
выражением:
+∞
𝜎𝑥2 = ∫ (𝑥 − 𝑀𝑥 )2 ∙ 𝑓(𝑥)𝑑𝑥,
−∞
где х – значения непрерывной случайной величины Х;
f(x) – плотность распределения;
Мх – математическое ожидание.
3)
Среднеквадратическое
отклонение
СКО
–
положительный
квадратный корень из дисперсии 𝜎𝑥2
𝜎х = +√𝜎𝑥2
Для примера 2 среднее квадратичное отклонение числа остановок
доменной печи в течение месяца равно 𝜎х =+√1,7931=1,34
Размерность среднеквадратического отклонения СКО – размерность
случайной величины.
2.2.
Нормальный закон распределения и его свойства
Для экспериментальных величин наибольшее распространение имеет
закон нормального распределения (закон Гаусса).
Р(х)
Р(х)
Р(х)
Р(х)
Равномерное
Показательное
Биноминальное
Нормальное
распределение
распределение
распределение
распределение
1. Область действия закона нормального распределения.
Ему подчиняются величины, которые приобретают то или иное
значение как результат действия большого числа взаимно некоторых
факторов, число которых, скорее всего, стремится к бесконечности. При
22
проведении опытов должны контролироваться существенные факторы, а
воздействие на отклик каждого из неконтролируемых факторов не должно
быть слишком большим по сравнению с остальными неконтролируемыми
факторами.
Следовательно, если при планировании эксперимента учтены все
наиболее
существенные
факторы
и
при
проведении
опытов
они
контролируются, то при обработке экспериментальных данных можно
предполагать,
что
отклик
не
должен
противоречить
Большинство
других
распределений,
нормальному
распределению.
которые
используются
в
математической статистик (Стьюдента, Фишера, Пирсона, Кохрена, а также
распределения, по которым составлены различные критериальные таблицы),
получены на основе нормального распределения.
Термин “нормальное распределение” применяется в условном смысле.
Неподчинение этому закону не означает об анормальном явлении. Не все
случайные величины распределены по нормальному закону. Однако на
практике, если явление подвержено действию многих случайных факторов,
то их суммарное воздействие можно описать с помощью нормального закона.
Нормальному закону подчиняются результаты испытаний стали на
прочность, производительность многих металлургических агрегатов, составы
сырья, топлива, сплавов, массы слитков, отлитых в однотипные изложницы,
случайные ошибки измерений и т.п., поэтому при обработке результатов
наблюдений исследователи, прежде всего, предполагают именно нормальное
распределение отклика.
2. Характеристики закона нормального распределения.
Нормальное распределение – такое, которое может быть представлено
в аналитической форме.
𝑓(𝑥) =
1
√2𝜋σ2x
∗
(𝑥−𝑀𝑥 )2
−
2
𝑒 2𝜎𝑥
f(x) – дифференциальная функция
23
где
𝑀𝑥
математическое
-
ожидание,
равное
а
–
значение
математического ожидания;
σ2x – дисперсия.
𝐹(𝑥) =
1
𝑎
(𝑥−𝑎)2
−
2
∫ 𝑒 2𝜎𝑥 𝑑𝑥
√2𝜋σ2x −∞
F(x) – интегральная функция распределения
Р F(x)
Р F(x)
интегральная функция нормального
дифференциальная функция нормального
закона распределения
закона распределения
рис. 1
рис. 2
Из рисунка 2 видно, что большинство получаемых результатов
группируются около некоторого значения, которому при отсутствии
систематических
ошибок
отвечает
неизвестная
истинная
измеряемая
величина (математическое ожидание или центр распределения). Отклонение
в ту или в другую сторону от центра распределения тем реже, чем больше
абсолютная величина этих отклонений.
3. Влияние на вид кривой параметров а и .
1) Изменение значения математического ожидания не меняет формы
нормальной кривой, а приводит к сдвигу кривой вдоль оси Х. Это означает,
что при повторении измерения в одинаковых условиях (одинаковый метод,
одинаковый прибор, одинаковые режимы обработки и т.д.) будем получать
кривые распределения, у которых центры группирования смещены вправо
или влево, а форма не изменяется.
2) Максимум функции наблюдается при х=а, тогда
𝑓𝑚𝑎𝑥 = 𝑃𝑚𝑎𝑥 =
1
√2𝜋σ2x
При σ2x =1 fmax = 0,4
24
При увеличении  происходит сжатие графика к кривой Ох и ее
размытие.
В ряде случаев рассматривается не сама случайная величина Х, а ее
отклонение от математического ожидания:
𝑌 =𝑋−𝑀
Такая случайная величина Y называется центрированной.
Отношение случайной величины Х к ее среднему квадратичному
отклонению
𝑉=
𝑋
𝜎𝑥
называется нормированной случайной величиной.
Математическое ожидание центрированной случайной величины
равно нулю, Му = 0, а дисперсия нормированной случайной величины равна
1, 𝜎𝑉2 =1.
Приведенная случайная величина – центрированная и нормированная
случайная величина
𝑍=
𝑥 − 𝑀𝑥
𝜎𝑥
Математическое ожидание и дисперсия приведенной случайной
величины Z равны соответственно нулю, 𝑀𝑧 = 0, и единице, 𝜎𝑧2 = 1.
Нормальное распределение с параметрами 𝑀𝑧 = 0 и 𝜎𝑧2 = 1 называют
стандартным (нормированным) нормальным распределением.
25
Для приведенной случайной величины Z нормальное стандартное
распределение принимает вид:
𝐹 (𝑧) =
2
𝑧
𝑧
−
2
𝑒
∫
√2𝜋 −∞
1
𝑓(𝑧) =
𝑑𝑧 = Ф(𝑧)- функция Лапласа
1
√2𝜋
𝑒
𝑧2
−2
= 𝜑(𝑧)
Графики этих функций показаны на рис. 3, 4
F(z)
1
3
3
Рис. 3. Функция стандартного нормального распределения F(z)
f(z)
0,4
S1
S2
3
S3
3
Рис. 4. Плотность стандартного нормального распределения f(z)
Значение стандартного нормального закона распределения СНЗР.
Со стандартным нормальным законом распределения удобно иметь
дело на практике, т.к. величина z не зависит от конкретного эксперимента и
от конкретных значений a и , а является относительной безразмерной
величиной, пригодной для объемного эксперимента. В то же время от
нормированного отклонения Z всегда может перейти к конкретной величине
Х, используя соотношение
𝑥 =𝑎+𝜎∗𝑧
26
Применение нормированного отклонения
Величина z позволяет
решать многие практические задачи. В частности бывает необходимо
вычислить вероятность того, что случайная величина находится в некоторых
пределах (например процент углерода находится в пределах марки, либо в
находится в пределах, установленных техническими условиями).
Перейдем к нормированию случайной величины z.
Неравенство х1 ≤ Х ≤ х2 (1)
𝑥1 −𝑎
𝜎
≤
𝑥−𝑎
𝜎
≤
𝑥2 −𝑎
𝜎
(2)
(1) и (2) – равносильны, поэтому вероятности выполнения этих
неравенств равны.
𝑃{х1 ≤ Х ≤ х2 } = 𝑃{𝑧1 ≤ 𝑍 ≤ 𝑧2 } = Ф(𝑧2 ) − Ф(𝑧1 )
где
Ф(𝑧2 ) и Ф(𝑧1 )
-
нормированные
функции
нормального
распределения (функции Лапласа).
𝑧
Ф(𝑧) = ∫ 𝜑(𝑧)𝑑𝑧 (3),
−∞
1 −𝑧2
𝜑(𝑧) =
𝑒 2 (4)
√2𝜋
Ф(z) показывает плотность того, что нормированная случайная
величина Z не превысит некоторого заданного значения z. Геометрически
Ф(z) представляет собой площадь под нормированной кривой плотности
распределения в промежутке (-, z).
Значения Ф(z) и 𝜑(𝑧), подсчитанные по формулам (3) и (4) сведены в
таблицы и приводятся в справочниках.
В разных справочниках приводится две разновидности
𝑧
𝑧2
1
−
Ф(𝑧) =
∫ 𝑒 2 𝑑𝑧
√2𝜋
−∞
𝑧
𝑧2
1
−
∗ (𝑧)
Ф
=
∫ 𝑒 2 𝑑𝑧
√2𝜋
0
Связь Ф(𝑧) и Ф∗ (𝑧)
Ф(𝑧) = 0,5 + Ф∗ (𝑧) (5)
27
Использование таблиц для отрицательных величин.
В таблицах Ф(𝑧) и Ф∗ (𝑧) все z > 0.
Для действий с отрицательными величинами исполняют следующие
соотношения.
Ф(-z) = 1 – Ф(z) (6)
т.к. S1=S2= 1 – S3 = 1 – Ф(z) = Ф(-z)
Ф∗ (−𝑧) = - Ф∗ (𝑧) (7)
Для определения вероятности попадания случайной величины х в
интервал используется соотношение.
𝑃{х1 ≤ Х ≤ х2 } = 𝑃{𝑧1 ≤ 𝑍 ≤ 𝑧2 } = Ф(𝑧2 ) − Ф(𝑧1 ) =
1 ∗
1 ∗
Ф ( 𝑧2 ) − Ф (𝑧1 )
2
2
Если 𝑧2 и 𝑧1 симметричны, удобно пользоваться функцией Ф∗ (𝑧)
1 ∗
1 ∗
1 ∗
1 ∗
∗
𝑃{−𝑧 ≤ 𝑍 ≤ 𝑧} = Ф (+𝑧) − Ф (−𝑧) = Ф (𝑧) + Ф (𝑧) = Ф (𝑧)
2
2
2
2
= Ф(𝑧) − Ф(−𝑧) = Ф(𝑧) − 1 + Ф(𝑧) = 2Ф(𝑧) − 1
По
рассчитанному
(выборочному)
значению
z
можно
найти
Ф∗ (𝑧)
z
0
0,2
0,4
…
1,0
2,0
3,0
Ф∗ (𝑧)
0
0,16
0,31
…
0,68
0,95
0,997
𝑧=
𝑥−𝑎
=1
𝜎
𝑥−𝑎 =𝜎
Из табл. видно, что вероятность отклонения случайной величины Х от
центра распределения а (от ее истинного значения) в обе стороны на
величину:
1 Р = 0,68 (выпад 32%)
2 Р = 0,95 (выпад 5%)
3 Р = 0,997 (процент выпала составляет 0,3%)
Отклонение, превышающие величину 3, имеют вероятность = 0,3% и
практически исключены – правило 3.
28
Пример 3. Образцы испытывали для определения в. Определить
вероятность попадания в всей партии в интервал в = 430 – 470 МПа, если
по данным выборки а̅ = 453 МПа;  = 11,3 МПа.
Решение:
1. 𝑃{х1 ≤ Х ≤ х2 } = 𝑃{𝑧1 ≤ 𝑍 ≤ 𝑧2 }
2. Расчет 𝑧1 и 𝑧2
𝑥−𝑎
𝑧=
𝜎
430 − 453
𝑧1 =
= −2,04
11,3
𝑧2 =
470 − 453
= 1,5
11,3
3. Решаем с помощью функции Лапласа Ф∗ (𝑧)
Ф∗ (𝑧2 ) = Ф∗ (1,5) = 0,8664
Ф∗ (𝑧1 ) = Ф∗ (1,5) = −0,9586
1/2Ф∗ (0,8664) = 0,4332
1/2Ф∗ (−0,9586) = −0,4793
Следовательно,  91% попадает в технические условия; 9% - выпадов.
Решаем с помощью нормированной функции Ф(z)
Ф(𝑧2 ) = Ф(1,5) = 0,93319
Ф(𝑧1 ) = Ф(−2,04) = 1 − Ф(2,04) = 1 − 0,97932 = 0,02068
Р{430 ≤ Х ≤ 470} = 0,93319 − 0,02068 = 0,91251
Часто на практике приходиться решать обратную задачу. По
известной вероятности находить значение случайной величины, которая с
этой вероятностью не будет превышена, т.е. решать вероятностные
уравнения относительно z.
Р{z1≤Z}=p
Решение этого уравнения относительно Z является квантиль и
обозначается zp. Значение zp находится в табл.
Таким образом квантиль zp нормированного нормального закона
распределения – это такое значение приведенной случайной величины z, для
29
2
которого функция распределения 𝐹(𝑧) =
𝑧
1 𝑧
−2
∫ 𝑒 𝑑𝑧
√2𝑘 −∞
= Ф(𝑧) принимает
значение Р: Ф(zp)=P
Для определения zp
можно воспользоваться значениями функции
Лапласа (например, поскольку Ф(1,64) = 0,94950, а Ф(1,65) = 0,9505, то
z0,95=1,645).
Для квантили стандартного нормального распределения справедливо
равенство:
z1-р = - zp
Площадь под графиком левее квантили zp по определению равна р.
Значит, площадь правее этой точки равна 1-р. Такая же площадь
расположена левее точки z1-p. Площади левее z1-p и правее zp равны. Так как
график симметричен относительно оси ординат, то эти точки расположены
на одинаковом расстоянии от нуля.
Зная квантиль zp нормированного нормального закона распределения
(Mz = 0 и 𝜎𝑧2 = 1), всегда можно найти квантиль Хр соответствующего
порядка р для нормального распределения с произвольными параметрами Mх
и 𝜎х2 .
Поскольку
𝑥−𝑎
𝐹(𝑥𝑝 ) = 𝑃(𝑋 ≤ 𝑥𝑝 ) = 𝑃 (
𝜎𝑥
≤
𝑥𝑝 −𝑎
𝜎𝑥
) = 𝑃 (𝑧 ≤
𝑥𝑝 −𝑎
𝜎𝑥
𝑥𝑝 −𝑎
) = Ф(
𝜎𝑥
)=
𝑃 = Ф(𝑧2 ),
то
𝑥𝑝 −𝑎
𝜎𝑥
= 𝑧𝑝 и, следовательно,
𝑥𝑝 = 𝑀𝑥 + 𝑧𝑝 𝜎𝑥
Контрольные вопросы
1. Что такое случайная величина? В чем заключаются отличия
дискретной от непрерывной случайной величины? Приведите примеры.
2. Какие вероятностные характеристики используют для описания
распределений случайных величин?
30
3. С какой целью используют законы распределения при обработке
данных экспериментальных исследований?
4. Почему нормальный закон распределения наиболее применим в
экспериментальной практике?
5. Какие параметры и свойства характерны для нормального закона
распределения?
6.
Дайте
определения
следующим
характеристикам
случайных
величин: центрированная, нормированная и приведенная.
3.
Предварительная обработка экспериментальных данных
Предварительная обработка результатов измерений и наблюдений
состоит:
1. В отсеивании грубых погрешностей и оценке достоверности
результатов измерений;
2. В проверке соответствия результатов измерения нормальному закону
и определение параметров этого распределения.
Если гипотеза о том, что отклик противоречит нормальному
распределению подтвердится, то следует определить, какому закону
распределения подчиняются опытные данные или если это возможно,
преобразовать опытное распределение к нормальному виду.
3.1. Основные понятия выборочного метода.
Совокупность
всех
возможных
значений
случайной
величины
называют генеральной совокупностью.
Пример 4. При производстве болтов были получены следующие
значения твердости НВ: 351, 370 и 365.
В этом примере под генеральной совокупностью можно понимать,
например все участки одного и того же болта, в которых в принципе можно
было бы замерить твердость, либо вообще все болты, которые когда либо
изготавливались.
31
В распоряжении исследователя, конечно же, никогда нет генеральной
совокупности, и он может изучать только ее часть – выборку, причем всегда
ограниченного объема.
Множество значений случайной величины, являющихся частью
генеральной совокупности, называют случайной выборкой (выборкой).
Значения случайной величины в выборках одной генеральной
совокупности не совпадают.
Объем – количество единиц в выборке.
При экспериментальном изучении случайной величины исследователи
не знают их истинных значений. Поэтому приходиться оценивать
характеристики
случайных
величин
по
опытным
данным.
Ввиду
ограниченности количества экспериментальных данных и случайности
состава
выборки
значениями
такие
истинных
оценки
величин
являются
и
их
лишь
приблизительными
называют
выборочными
(эмпирическими) оценками.
Оценивание – определение приближенного значения неизвестного
параметра генеральной совокупности по результатам наблюдений.
Наиболее часто приходится находить оценки:
1) истинного значения измеряемой величины (оценку математического
ожидания)
2) точности измерений – выборочные дисперсии или выборочные СКО.
Основные требования к оценкам:
1. несмещенность;
2. эффективность;
3. состоятельность.
1. Оценка называется несмещенной, если математическое ожидание
оценки совпадает с истинным
𝑀(𝑎̃) = 𝑎
Если это равенство не выполняется, то оценка либо завышает, либо
занижает истинное значение, что приводит к систематическим ошибкам
32
(ошибкам одного знака). Требование несмещенности оценки гарантирует
отсутствие систематических ошибок при оценке параметров.
2.
Оценка
называется
эффективной,
если
имеет
наименьшую
дисперсию, т.е. предпочтение отдается той оценке, которая обладает
меньшим рассеиванием около центра распределения, т.е. меньше отличается
от истинного значения и является более точной.
3. 𝑀{(𝑎̃ − 𝑎)2 } = 𝑀{(𝑎̃𝑖 − 𝑎)2 } или 𝑀{(𝑎̃ − 𝑎)2 } = 𝑚𝑖𝑛
где 𝑎̃𝑖 - другая оценка.
3. Оценка называется состоятельной, если при неограниченном
увеличении объема выборки (N) значения оценки приближаются сколь
угодно близко к истинному значению параметра
lim 𝑎̃(𝑛) = 𝑎
𝑛→∞
Состоятельность
оценки
гарантирует
исследователю
увеличение
точности оценивания с ростом N и то, что хотя бы в пределе при N он
может получить точное значение параметра а.
3.2.
Точечное оценивание параметров распределений.
Точечные оценки – оценки одним числом.
3.2.1. Оценка истинного значения измеряемой величины.
Пример 5. Пусть проведено 7 измерений случайной величины, и
результаты расположим в порядке возрастания: 1; 4; 7; 9; 10; 12; 15.
В качестве оценок можно предложить следующие характеристики:
1) медиану выборки (срединное значение к̃ = 9)
2) среднее из крайних значений к̃ = 8
3) среднее из всех значений, кроме крайних к̃ = 8,4
4) общее среднее к̃ = 8,3
5) среднее геометрическое к̃ = 6,4
Наилучшей оценкой истинного значения измеряемой величины
является средняя арифметическая, т.к. эта оценка эффективная, несмещенная
и состоятельная.
33
1. Докажем эффективность оценки среднего арифметического:
∑(𝑥𝑖 − 𝑥̅ )2 < ∑(𝑥𝑖 − 𝑐)2 , c𝑥̅
𝑥̅ =
∑ 𝑥𝑖
𝑛
𝑛
𝑛
𝑛
∑(𝑥𝑖 − 𝑐)2 = ∑ 𝑥𝑖2 − 2𝑐 ∑ 𝑥𝑖 + ∑ с2 = ∑ 𝑥𝑖2 + 𝑛(𝑐 2 − 2𝑐𝑥̅ ) (1)
𝑖=1
1
1
∑(𝑥𝑖 − 𝑥̅ )2 = ∑ 𝑥𝑖2 − 2𝑥̅ ∑ 𝑥𝑖 + ∑ 𝑥̅ 2 = ∑ 𝑥𝑖2 − 𝑛𝑥̅ 2 (2)
(1) − (2)
∑(𝑥𝑖 − 𝑐)2 − ∑(𝑥𝑖 − 𝑥̅ )2 = ∑ 𝑥𝑖2 + 𝑛(𝑐 2 − 2𝑐𝑥̅ ) −
− ∑ 𝑥𝑖2 + 𝑛𝑥̅ 2 = (𝑥̅ 2 − 2𝑐𝑥̅ + 𝑐 2 )𝑛 = (𝑥̅ − 𝑐)2 𝑛 > 0
т.е.
среднее
арифметическое
минимизирует
сумму
квадратов
отклонений – оценка эффективная.
2) Докажем, что эта оценка (средняя арифметическая) несмещенная
𝑀(𝑥̅ ) = 𝑎, если M(x)=a
𝑛
∑ 𝑥𝑖
1
1
𝑀(
) = ∑ 𝑀(𝑥) = ∑ 𝑎 = 𝑎
𝑛
𝑛
𝑛
1
Это означает, что в разных, достаточно больших сериях измерений
выборочные средние арифметические буду группироваться около истинного
значения измеряемой величины а.
3)
Математической
статистикой
доказывается,
что
средняя
арифметическая х̅ является и состоятельной оценкой.
3.2.2. Оценка точности измерений. Оценка дисперсии.
Точность
измерения
характеризуется
средним
квадратичным
отклонением.
Чем меньше СКО, тем меньше разброс точек относительно центра
распределения, тем точнее измерение.
СКО определяется положительной дисперсией.
Точечная оценка дисперсности.
34
Примем обозначения:
D(x) – оператор дисперсии С.В.
2 – значение дисперсии генеральной совокупности
𝜎̃ 2 - приближенная оценка дисперсности
𝑆∗2 - эмпирическая дисперсия (оценка смещенная)
а – истинное значение измеряемой величины
Пусть х1, х2, …, хn – результаты измерений неизвестной величины а,
при этом M(x)=a
D(x)= 2= М[Х-М(х)]2=М[х-а]
Т.к. в качестве оценки математического ожидания принята средняя
арифметическая, то оценкой генеральной дисперсии будет:
̃2 = 1 ∑𝑛 (𝑥𝑖 − 𝑎)2
𝜎
𝑖=1
𝑛
(1)
На практике (1) воспользоваться нельзя, т.к. истинное значение
математического ожидания неизвестно.
Заменив в (1) неизвестное значение с его оценкой х̅, получим новую
оценку дисперсии
n
1
𝑆∗2 =
∑(xi − x̅)2 (2)
𝑛−1
1
В качестве оценки генеральной дисперсии может выступать S2 выборочная эмпирическая дисперсия
𝑛
1
𝑆2 =
∑(𝑥𝑖 − 𝑥̅ )2 (3)
𝑛−1
1
где n – число опытов.
Эмпирическая дисперсия – сумма квадратов отклонений значений
случайной величины в выборке от средней арифметической, деленная на
число степеней свободы
1
𝑆 2 = ∑(𝑥𝑖 − 𝑥̅ )2 , (4)
𝑓
где f – число степеней свободы.
35
Число степеней свободы – объем сведений, который остается после
частичного
использования
его
для
определения
предшествующих
характеристик – это число определяется как разность констант (средних и
др.), подсчитанных по результатам тех же опытов.
В уравнении (4) f=n-1, т.к. одна степень свободы расходуется на
предшествующую оценку среднего арифметического.
3.3. Распределение среднего арифметического для выборок из
нормальной совокупности. Распределение Стьюдента
Среднее арифметическое, вычисленное по конкретной выборке есть
определенное число. Так как состав выборки случаен, то среднее
арифметическое, вычисленное для другой же выборки из той же генеральной
совокупности, определяется числом, как правило, отличимого от первого, т.е.
среднее арифметическое меняется от выборки к выборке. Таким образом,
среднюю арифметическую можно также рассматривать как случайную
величину, что позволит говорить о законе распределения выборочной
средней.
Из математической статистики известна теорема: если случайная
величина x подчиняется нормальному закону распределения, то выборочная
средняя также подчиняется этому же нормальному закону распределения.
Параметрами распределения среднего арифметического являются:
1. Центр распределения (математическое ожидание)
M(𝑥̅ ) = a,
где а – истинное значение измеряемой величины.
2. D(𝑥̅ ) =
𝜎𝑥2
𝑛
,
где σх2 – значение дисперсии генеральной совокупности.
Дисперсия средней арифметической в n раз меньше самой случайной
величины х.
Рассмотрим нормированное отклонение случайной величины 𝑥̅ :
𝑧=
𝑥̅ −𝑎
𝜎𝑥̅
=
𝑥̅ −𝑎
𝜎𝑥 √𝑛
(1)
36
В уравнении (1) входит
σx
- среднеквадратичное отклонение
генеральной совокупности, величина которой всегда неизвестна, поэтому для
практических целей большое значение имеет оценка, в которую входит не
генеральная СКО, а эмпирическая S. Получим новую статистическую оценку
Т.
Т=
𝑥̅ −а
𝑆/√𝑛
,
где S – оценка генерального среднеквадратичного отклонения,
вычисленное по выборочным данным.
Так как в выражении для оценки Т входит среднее арифметическое 𝑥̅ ,
являющееся случайной величиной, то Т является также случайной
величиной, имеющей свой закон распределения. Закон распределения оценки
Т называется t – распределением или распределением Стьюдента.
Стьюдент – псевдоним химика Госсета, работавшего в одной из
пивоваренных компаний Великобритании. Он самостоятельно разработал
статистику малых выборок. Поскольку в современной технике чаще всего
используются небольшие по объему выборки (n < 30 ), то работа Стьюдента
имеет большое практическое значение. В аналитической форме закон
распределения Стьюдента имеет следующий вид:
Интегральная форма (функция распределения)
𝑓+1
)
2
F(t) =
𝑓
√П𝑓 Г(2)
Г(
𝑡
∫−∞(1
+
𝑡 2 −𝑓+1
) 2 𝑑𝑡
𝑓
Дифференциальная форма (плотность распределения)
𝑓+1
)
2
φ(t) =
𝑓
√П𝑓 Г(2)
Г(
(1 +
𝑡 2 −𝑓+1
) 2
𝑓
Где Г(у) – γ – функция, приводится в справочнике Бромштейна;
f – число степеней свода f = n – 1;
37
t – распределение ~ от числа степеней свободы. Это распределение
отличается от нормального, но стремится к нему при n → ∞.
На рис. 5 приведено распределение Стьюдента для различных значений
m. При n → ∞ (практически при n > 30) распределение Стьюдента переходит
в стандартное нормальное распределение с единичной дисперсией.
f(x)
0.4
0.3 m=10
0.2
0.1
m=4
m=1
0
а)
F(t)
1.0
m = 10
0.8
m=4
0.5
m=1
б)
Рис. 5. Графическая интерпретация t – распределения
а). Плотность распределения б). Функция распределения Стьюдента
Кривая f(t) симметрична относительно центра распределения M(t) = 0,
σ(t) = 1. Внешне эта кривая похожа на кривую стандартного
нормального распределения. Сходство тем больше, чем больше объем
выборки, но при малых объемах n «хвосты» t и z заметно различаются.
Квантиль 𝑡𝑝 представлен в виде таблицы и приводится в справочниках.
38
Данные,
приведенные
в
них,
представляют
собой
решение
вероятностного уравнения относительно аргумента Т.
P{|T|<𝑡𝑝 } = P
Это величины, которые с определенной вероятностью не будут
превышены в выборке данного объема.
Выдержка из таблицы квантилей t-распределения
Р
0,9
0,95
0,99
2
1
6,31
12,7
63,7
3
2
2,92
4,3
9,92
5
4
2,13
2,78
4,6
41
40
1,68
2,02
2,7
101
100
1,66
1,98
2,65
∞
∞
1,65
1,96
2,58
n
f
Математической. статистикой доказывается, распределение оценки 𝑡̅ не
зависит от математического ожидания, ни от дисперсии, а зависит от объема
выборки и вероятности. С увеличением вероятности увеличивается t .
Значение t распределения.
Позволяет оценивать величину погрешности с заданной вероятностью
или при заданной точности оценивать надежность экспериментальных
результатов.
3.4.
Распределение
дисперсии
в
выборках
из
нормальной
совокупности. Распределение 𝝌𝟐 – Пирсона
Из нормальной генеральной совокупности извлечем ряд выборок, u в
каждой из них определим эмпирическую дисперсию. Так как состав выборки
случаен, то эмпирические дисперсии в выборках будут отличаться друг от
друга, т.е. иметь рассеивание. Значит 𝑆 2 можно рассматривать как случайную
величину, имеющую свой закон распределения.
39
1
𝑆 2 = (𝑥𝑖 − 𝑎)2
𝑓
|
𝑓
𝜎2
Если a - известно, то f = n, a если находим оценку, то f = n – 1
𝑛
𝑓𝑆 2
𝑥𝑖 − 𝑎 2
=
) = ∑ 𝑧𝑖2
∑(
2
𝜎
𝜎𝑖
𝑖=1
Обозначим χ2 =
Случайная
𝑓𝑆 2
𝜎2
величина,
представляющая
собой
сумму
квадратов
независимых случайных величин z, каждый из которых подчиняется
стандартному нормальному закону называется случайной величиной с
распределением Пирсона χ2 .
χ2 применяется при оценке точности дисперсии и при проверке
некоторых статистических гипотез.
Плотность
распределения
случайная
величина
χ2 описывается
уравнением :
2)
𝑓 (χ
=
1
𝑓
𝑓
22 Г( )
2
2
𝑓−2
2
(𝑥 )
𝑥
𝑒 −1/2
, 0 <<χ2 << ∞,
𝑓
где Г ( )- γ-мма функция;
2
f – число степеней свободы.
На рис. 6 приведены кривые f(χ2 ) для различных значений f.
Эти кривые ассиметричны, причем ассиметрия резко выражена при
малых значениях параметра m. Так, при f = 1 и χ2 = 0 кривая уходит в
бесконечность, а при f = 2 и χ2 = 0 она достигает максимального значения,
равного 0,5. При f > 2 кривые имеет максимум, при χ2 𝑚𝑎𝑥 = f – 2. При больших
значениях (f > 30) χ2 - распределение переходит в нормальное со средним
значением
̅̅̅̅̅̅
f(χ2 ) = √2f − 1 и дисперсией 𝜎 2 = 1.
40
f(χ2 )
0,5
f-2
0,4
f=4
0,3
0,2
f=10
0,1
f=1
2 4 6 8 10 12 14 16 18
χ2
а)
f=1
f(χ2 )
0,8
f=4
0,6
0,4
f=10
0,2
2
4
6
8
10
12
χ2
б)
Рис.6. Плотность распределения (а) и функция распределения (б) χ2
В литературе можно найти доказательство того что D(χ2 ) = 2f
Составлены табличные функции распределения Пирсона. Таблицы
позволяют вычислить квантили, определить вероятность того, что случайная
величина χ2 превышает некое фиксированное критическое значение
p(χ2 > χ2𝑓,𝑎 ) = p
или, наоборот, по заданной вероятности можно определить квантиль χ2 .
41
3.5. Распределение отношений дисперсий. Распределение Фишера
или f – распределение
Выделим из генеральной совокупности 2 экспериментальные выборки
объемом n1 и n2. Найдем эмпирические дисперсии 𝑆12 и 𝑆22 . Если отношение
этих дисперсий есть случайная величина, то отношение этих дисперсий есть
случайная величина, подчиняющаяся распределению Фишера.
𝑆12
F=
Учитывая, что
𝑓𝑆12
𝜎2
= χ2 1 и
возьмем отношение
𝑓𝑆22
𝜎2
𝑆22
(𝑆12 > 𝑆22 )
= χ2 2
χ21
χ22
𝑓𝑆12 𝜎 2
𝜎 2 𝑓𝑆 2
2
F=
𝑆12
χ2 1 /𝑓1
𝑆2
χ2 2 /𝑓2
2 =
,
– критерий Фишера через критерий Пирсона.
3.6. Интервальные оценки числовых характеристик случайной
величины
Используют два способа нахождения оценок числовых характеристик
случайных величин (центр распределения математического ожидания и
дисперсия генеральной совокупности):
- точечные оценки – оценки одними числами;
- интервальные оценки.
Недостатки точечных оценок:
- всегда приблизительны, содержат в себе погрешность в силу
ограниченности объема и случайности выборки.
- не дают представления о степени близости оценки к истинному
значению оцениваемого параметра (о величине погрешности).
В задачу исследования входит и нахождение истинного значения
измеряемой величины, и оценка погрешности, допущенной при измерении.
Учет погрешности необходим в следующих случаях:
42
При
1.
анализе
результатов
эксперимента
для
получения
конкретных выводов.
Пример 6: Сравниваются два варианта термической обработки по
величине разрушающей нагрузки.
I. партия 𝑃1 = 19000 (кг)
II. партия 𝑃2 = 21000 (кг)
Точность измерений этой нагрузки 𝜀−+ 10%.
Р1=19000±1900=17100…20900
Р2=21000±1900=18900…23100
+
−
𝑃1 = 19000±1900 (кг)
𝑃2 = 21000 (кг)
+
−
1900 = 17100….20900
1900 = 18900….23100
23100
20900
18900
17100
Однозначного вывода о преимуществе 2-ой партии сделать нельзя.
2.
Анализ погрешности необходим при выборе метода проведения
эксперимента.
Таким образом во избежание ошибочных выводов необходимо уметь
оценивать истинные значения экспериментальных величин, а также
погрешности измерений, используя интервальные оценки.
Интервальная оценка – это указание числового интервала внутри
которого с заданной вероятностью Р находится оцениваемый параметр.
𝛿1
𝑙1
𝛿2
𝑎̃ а
𝑙1 = 𝑎̃ − 𝛿1
𝑙2
𝑙2 = 𝑎̃ − 𝛿2
l
43
Рис. 7. Геометрическое представление интервальной оценки,
где a –истинное значение оцениваемого параметра;
𝑎̃ - оценка этого параметра (приближенного значения);
𝑙1 и 𝑙2 - границы интервала;
𝛿1 и 𝛿2 – ширина доверительного интервала.
Математически определение интервальной оценки записывается в виде
вероятностного утверждения:
P{𝑙1 ≪ 𝑎 ≪ 𝑙2 } = P
Вероятность, с которой можно утверждать, что оцениваемый параметр
находится в указанных пределах, называют доверительной вероятностью, а
сам интервал – доверительным интервалом.
α = 1 – p - уровень значимости.
Таким образом, интервальная оценка является совокупностью двух
чисел: ширины доверительного интервала, являющаяся мерой точности
оценки и доверительной вероятности, характеризующей достоверность или
надежность результатов.
Чем уже доверительный интервал, тем точнее определен оцениваемый
параметр. Если интервал определен с вероятностью p= 0,9 то это значит, что
из 100 измерений 90 будут находиться в указанных границах, а 10 выпадать
за пределы.
Значение доверительной вероятности исследователь задает сам. Выбор
этого значения не является математической задачей, а определяется степенью
ответственности решаемой проблемы. Интервальная оценка строится по
данным ряда измерений, которые бывают прямые и косвенные.
Прямые
–
измерение,
осуществляемые
с
помощью
приборов,
градуированных в единицах измеряемой величины.
Косвенные – измерения, полученные путем расчетов по формулам, в
которые входят одна или несколько непосредственно измеряемых, а также
табличных величин.
44
3.7. Оценка математического ожидания (истинного значения
измеряемой величины)
При
оценке
математического
ожидания
(истинного
значения
исследуемого параметра а) в качестве функции g (θ, θ̃) (выражение или
функция, в которую входит исследуемый параметр a и его оценка а̃ по
экспериментальной выборке) удобно выбирать случайную величину Т,
которая равна:
Т=
х̅−а
𝑆х̅
(1),
т.к. в неё входит оцениваемый параметр а и его оценка х̅ - среднее
арифметическое. Распределение этой функции Т известно и подчиняется
распределению Стьюдента.
Учитывая связь между 𝑆𝑥̅2 и 𝑆х2 получаем 𝑡𝑓,𝛼 =
х̅− а
(2).
𝑆/√𝑁
Выражение Р{-𝑙1 < g(𝜃, 𝜃̃) < 𝑙2 } с учетом (1) и (2) имеет вид:
Р{-𝑡𝑓,𝛼 << T << 𝑡𝑓,𝛼 }=Р
Р{-𝑡𝑓,𝛼 <<
х̅− а
𝑆/√𝑁
<< 𝑡𝑓,𝛼 }=Р
После преобразования аргумента получаем :
Р{(х̅ -
𝑡𝑓,𝛼∙𝑆
√𝑁
) << а << (х̅ +
𝑙1 = х̅ − 𝛿1
𝑡𝑓,𝛼 ∙𝑆
√𝑁
) }=Р (3)
𝑙2 = х̅ + 𝛿2
Уравнение (3) решается, если задается величиной доверительной
вероятности p:
величины х̅; S; N определяются по выборке, а величину 𝑡𝑓,𝛼 находят по
таблице распределения Стьюдента.
L = 𝑙2 − 𝑙1 = х̅ + 𝛿2 - х̅ + 𝛿1 = 2δ =
+ 𝑡𝑓,𝛼∙𝑆
− √𝑁 ,
где L – ширина доверительного интервала
Таким образом для построения доверительного интервала при прямых
измерениях необходимо :
1) произвести N измерений
2) выбрать уровень значимости
45
3) рассчитать выборочные значения х̅, 𝑆 2 , S
4) для выбранной надежности (α) по таблице найти критерий
Стьюдента 𝑡𝑓,𝛼
5) определить ширину доверительного интервала и его границы.
Примечание:
во
многих
квадратичной погрешности 𝑆𝑥̅ =
пособиях
𝑆𝑥
√𝑁
= √
находят
∑(𝑥𝑖 − 𝑥̅ )2
𝑁(𝑁−1)
величину
средней
,
тогда δ = +
−𝑡 ∙ 𝑆𝑥̅
Пример 7: По данным выборки из 5 измерений диаметра стержня
оценить истинное значение измеряемой величины с надежность. Р = 0,95
𝑑𝑖 = 6,2; 6,1; 6,0; 6,2; 6,0.
Найти: ширину полуинтервала δ и 𝑙1 и 𝑙2 .
Решение:
1)
𝑑̅ =
2)
𝑆2 =
6,2+6,1+6,0+6,2+6,0
5
= 6,1 (мм. )
2
∑(𝑑𝑖 − 𝑑̅ )
𝑁−1
1
1
𝑆 2 = [0,12 ∗ 02 ∗ 0,12 ∗ 0,12 ∗ 0,12 ] = 0,01 (мм2 . )
4
3)
Оценим С.К.О.
S = +√𝑆 2 = о,1 мм.
4)
𝑡𝑓,𝛼 = 𝑡4,0;05 = 2,776
5)
+
𝛿=+
−𝑡𝑓,𝛼 ∙ 𝑆/√𝑁 = −
2,776∙0,1
√5
+
=+
− 0,125 мм.
+
𝑑 = 𝑥̅ −𝛿 = 6,1−0,125 мм.
(6,1 – 0,125) < d < (6,1 + 0,125)
𝑙1 = 5,975 мм; 𝑙2 = 6,225 мм.
Выводы :
1.
С уменьшением объема выборки при сохранении требований к
точности измерения (ширины доверительного интервала) надежность
измерения уменьшилась. (Р сократилась с 0,95 до 0,91).
46
Из рассмотренного примера и из формулы 𝛿 =
2.
следует,
что
вероятности
величины
доверительного
взаимосвязаны:
при
интервала
постоянном
и
объеме
+
−𝑡𝑓,𝛼
∙ 𝑆/√𝑁
доверительной
выборки
при
повышении требований к надежности уменьшается точность оценки.
3.
С увеличением числа опытов при δ = const увеличивается
надежность Р.
4.
При P = const δ – уменьшается, следовательно точность оценки
возрастает.
Контрольные вопросы
1. Какие задачи решают в ходе предварительной статистической
обработки экспериментальных данных?
2. Что такое точечное оценивание? Перечислите точечные оценки
основных
параметров
нормального
распределения
для
непрерывной
случайной величины.
3. Что такое свойство несмещенности точечной оценки?
4. Что такое свойство состоятельности точечной оценки?
5. Что такое свойство эффективности точечной оценки?
6. Что необходимо знать для построения доверительного интервала?
7. В чем заключается основная идея оценивания с помощью
доверительного интервала? С помощью каких распределений происходит
построение доверительных интервалов для математического ожидания и
дисперсии?
8. Связь доверительного интервала, точности и объема информации.
4. Оценка погрешностей результатов измерений
4.1. Типы погрешностей измерений
Погрешность – количественная характеристика неоднозначности
результата измерения. Ее оценивают исходя из всей информации,
накопленной при подготовке и выполнении измерений. Эту информацию
обрабатывают для совместного определения окончательного результата
47
измерения и его погрешности. Окончательный результат нельзя расценивать
как “истинное значение” измеряемой физической величины, так как в этом
нет смысла из-за наличия погрешности.
Погрешность может быть выражена в единицах измеряемой величины
x, в таком случае она обозначается ∆х и носит название абсолютной
погрешности. Однако абсолютная погрешность не отражает качества
измерений: например, абсолютная погрешность 1 мм при измерении
размеров помещения свидетельствует о высоком качестве измерения, та же
погрешность совершенно неприемлема при измерении диаметра тонкой
проволоки.
Критерием качества измерения является отношение абсолютной
погрешности к окончательному результату измерения:
х  ∆х/х
Это отношение безразмерно. Величину δx называют относительной
погрешностью и используют как в абсолютном, так и в процентном
выражении. Высокой точности измерения соответствует малое значение
относительной погрешности.
Основные типы погрешностей:
Промахи
или
грубые
погрешности
–
возникают
вследствие
неисправности измерительных приборов или ошибок в эксперименте,
сделанных по невнимательности. Естественно стремление избегать промахи,
но если стало понятно, что они все-таки допущены, соответствующие им
результаты измерений необходимо отбросить и при возможности повторить
эксперимент в этой области значений.
Приборная
погрешность
–
систематическая
погрешность,
присутствующая в результатах измерений, выполненных с помощью любого
измерительного прибора. Приборная погрешность, как правило, неизвестна и
не может быть учтена. Ее можно оценить только путем сравнения показаний
прибора с показаниями другого, более точного. Иногда результаты
специально проведенного сравнения приводят в паспорте прибора, однако
48
чаще указывают максимально возможную погрешность для приборов
данного типа.
Модельная погрешность. В основу любого экспериментального
исследования, сопряженного с измерениями, заложена модель. Модель
содержит физическое описание исследуемого объекта или процесса, которое
позволяет составить его математическое описание, а именно, набор
функциональных соотношений, включающих физические величины. Неверно
построенная модель, в которой не нашли отражения какие-то важные
процессы или факторы, влияющие на результат измерений, также приводит к
несоответствиям. Как следствие, измеряемые в эксперименте величины,
вычисляемые по полученным из модели рабочим формулам, содержат
погрешности, которые носят название модельных погрешностей. К разряду
модельных может быть отнесена погрешность взвешивания на рычажных
весах. Согласно закону Архимеда вес тела и гирь уменьшается из-за действия
3
выталкивающей силы воздуха. Напомним, что вес 1м воздуха равен
примерно
10
ньютонов.
Для
того
чтобы
правильно
найти
массу
взвешиваемого тела, нужно ввести поправки на потерю веса гирями и самим
телом. Вместе с тем, как и при любых измерениях, здесь необходим
разумный подход. Например, при работе с грубыми техническими весами
бессмысленно вводить поправку на Архимедову силу, так как она окажется
много меньше погрешностей, вносимых в результат измерения гирями и
самими весами.
Случайные погрешности – при повторных измерениях погрешности
этого типа показывают свою случайную природу. Возникают они вследствие
множества причин, совместное воздействие которых на каждое отдельное
измерение невозможно учесть или заранее установить. Такими причинами
могут оказаться, к примеру, незначительные колебания температуры
различных деталей и узлов установки, скачки напряжения, вибрации,
турбулентные движения воздуха, трение в механизмах, ошибки считывания
показаний приборов и т.п. Единственно возможный способ объективного
49
учета случайных погрешностей состоит в определении их статистических
закономерностей, проявляющихся в результатах многократных измерений.
Рассчитанные статистические оценки вносят в окончательный результат
измерения.
Одной из грубейших ошибок, которые допускают школьники и
студенты, является нахождение погрешности измерения как
∆х=хе – хt ,
где хе – полученное в процессе эксперимента среднее значение
величины;
хt – значение, взятое из справочника или рассчитанное исходя из
теоретических представлений.
Целью эксперимента является именно проверка существующих теорий
и уточнение табличных значений.
С другой стороны, при выполнении учебных лабораторных работ полезно
сравнить полученные результаты со справочными табличными величинами и
в
случае
значительного
их
расхождения
проанализировать,
какие
экспериментальные факторы и модельные погрешности могли привести к
этому.
4.2.
Суммарная погрешность измерений
Помимо случайной погрешности, при использовании в эксперименте
каких-либо измерительных приборов необходимо учитывать приборную
(систематическую) погрешность. В паспорте прибора принято указывать
предел допустимой погрешности  , означающий максимально возможную
погрешность при рекомендованных условиях работы прибора. Если бы
приборная погрешность была распределена по нормальному закону, то из
такого определения  следовало бы, что распределение характеризуется
средним квадратичным отклонением    / 3 .
Для электроизмерительных стрелочных приборов принято указывать
класс точности, записываемый в виде числа, например, 0,05 или 4,0. Это
50
число дает максимально возможную погрешность прибора, выраженную в
процентах от наибольшего значения величины, измеряемой в данном
диапазоне прибора. Так, для вольтметра, работающего в диапазоне
измерений 0-30 В, класс точности 1,0 определяет, что указанная погрешность
при положении стрелки в любом месте шкалы не превышает 0,3 В.
Соответственно среднее квадратичное отклонение  составляет 0,1 В.
Реальная погрешность прибора существенно зависит от условий
окружающей среды, где установлен прибор. Например, погрешность
электроизмерительных приборов зависит от температуры помещения и
отличается от паспортной погрешности, которая обычно приводится для
200С. Другой причиной погрешностей может быть электромагнитное
излучение другого лабораторного оборудования, вибрация установки и т.д.
При планировании эксперимента для повышения точности измерений может
возникнуть необходимость в учете этих факторов.
Обычно цена наименьшего деления шкалы стрелочного прибора
согласована с погрешностью самого прибора. Если класс точности
используемого прибора неизвестен, за погрешность всегда принимают
половину цены его наименьшего деления. Понятно, что при считывании
показаний со шкалы нецелесообразно стараться определить доли деления,
так как результат измерения от этого не станет точнее.
Предел допустимой погрешности цифрового измерительного прибора
рассчитывают по паспортным данным, содержащим формулу для расчета
погрешности именно данного прибора. При отсутствии паспорта за оценку
погрешности
принимают
единицу
наименьшего
разряда
цифрового
индикатора.
Окончательный результат многократного измерения содержит в себе
как
случайную,
так
и
приборную
(систематическую)
погрешности.
Поскольку случайная погрешность уменьшается с увеличением количества
измерений, целесообразно сделать такое количество измерений, чтобы
(∆х) расчетный <<  ,
51
т.е. чтобы случайной погрешностью можно было пренебречь по сравнению с
приборной погрешностью. На практике достаточно, чтобы случайная
погрешность была в 2-3 раза меньше систематической. В любом случае надо
сделать 2-3 измерения, чтобы убедиться в том, что случайная погрешность
действительна мала.
Если приборная и случайная погрешности близки по значению, то
суммарная погрешность равна
∆х= (х) 2  ( ) 2
Поскольку
случайную
погрешность
обычно
оценивают
с
доверительной вероятностью 0,68, а  - оценка максимальной погрешности
прибора, то можно считать, что выражение задает доверительный интервал
также с вероятностью не меньше 0,68.
При выполнении однократного измерения оценкой погрешности
результата служит х   / 3 , учитывающая только предельно допустимую
приборную погрешность.
4.3.
Погрешности косвенных измерений
Пусть исследуемую величину S определяют по результатам прямых
измерений других независимых физических величин, например, x, y, z, с
которыми
она
связана
заранее
установленным
функциональным
математическим соотношением
S=f(x, y, z)
Также известны окончательные результаты прямых измерений х  х ,
y  y , z  z .
Предполагается, что величины х, y, z являются случайными и к
ним применимо нормальное распределение
Тогда для среднего значения
S  f (( x), ( y ), ( z ))
Для погрешности
S  ( f x' ) 2 x 2  ( f y\ )y 2  ( f z\ ) 2 z 2 ,
где f x/ , f y/ , f z/ - частные производные в точке ( x, y, z ) .
52
Следует помнить, что при непосредственных расчетах в формулу
необходимо подставлять погрешности х, y, z , найденные для одного и того
же значения доверительной вероятности. Погрешность косвенного измерения
также будет соответствовать этому значению доверительной вероятности.
Рекомендуется использовать значение вероятности  =0,95.
Сравнение между собой величин f x/ x, f y/ y, f z/ z позволяет выделить
«критический» фактор, процесс измерения которого дает наибольший вклад
в погрешность ∆S. Если, например, величина f x/ x, больше остальных более
чем в 2-3 раза, то их вкладом в погрешность ∆S можно пренебречь. Для
повышения точности измерения величины S в первую очередь надо
повышать точность измерения «критического» фактора.
Для наиболее распространенных зависимостей в табл.3 приведены
формулы для расчета погрешности.
Таблица 3
Связь погрешностей прямых и косвенных измерений
Рабочая зависимость
Формула погрешности
S=А∙х±В∙у±С∙z
S  ( A  x) 2  ( B  y ) 2  (C  z ) 2
S=Ах±α у±β z±γ
S  (  x) 2  (   y ) 2  (  z ) 2
S=lnx
S  x / x
S=ex
S  x
S=A∙sin φ
S  A  cos   
В таблице приняты следующие обозначения:
∆ - абсолютная погрешность;
Δ – относительная погрешность;
A, B, C, α, β, γ – постоянные;
x, y, z, φ – результаты прямых измерений;
S – результат косвенного измерения.
Одной из типичных ошибок планирования эксперимента является
косвенное измерение величины S через разность измеряемых напрямую
53
величин А и В, если их абсолютные значения много больше значения
величины S. При этом погрешность ∆S будет того же порядка или может
даже превосходить значение искомой величины S. Аналогично деление друг
на друга больших величин или степень с маленьким основанием и большим
показателем. Во всех этих случаях необходимо искать альтернативные пути.
4.4.
Учет погрешности в записи окончательного результата
измерения
Завершением обработки данных многократного прямого измерения при
заданной доверительной вероятности являются два числа: среднее значение
измеренной величины и его погрешность (полуширина доверительного
интервала). Оба числа есть окончательный результат многократного
измерения и должны быть совместно записаны в стандартной форме,
которая содержит только достоверные данные.
Х= х  х
Контрольные вопросы
1. Что такое погрешность измерения?
2. Какие типы погрешностей вы знаете?
3. Что принимают за абсолютную погрешность измерения? Чему она
равна?
4. Что называется относительной погрешностью?
5. Каким образом учитывается погрешность в записи окончательного
результата измерения?
5. Проверка статистических гипотез
5.1. Основные определения
Статистическая гипотеза - предположение о свойствах генеральной
совокупности или о виде закона с.в., проверяемое на основе выборочных
данных.
Гипотезу, имеющую наиболее важное значение в проводимом
исследовании называют нулевой гипотезой и обозначают Н0. Одновременно
54
формулируется альтернативная (конкурирующая) гипотеза и обозначается
Н1. Нулевую гипотезу выдвигают и затем проверяют с помощью
статистических критериев или статистики.
Критерием статистики гипотезы называется показатель, позволяющий
принять или отвергнуть гипотезу на основании выборки из генеральной
совокупности. В качестве таких показателей используются определенные
функции результатов наблюдений. Как правило это величины, имеющие
известное распределение. Все возможные значения этих статистик делятся на
2 части: область допустимых значений (область принятия гипотезы) и
критическая область.
Проверка гипотезы сводится к выяснению того, попадает или нет
значение статистики, вычисленной по выборке в критическую область: если
попадает, гипотеза принимается, если не попадает в критическую область, то
гипотеза отвергается.
/2
/2

1-
двусторонний критерий
1-
односторонний критерий
Если хотят убедиться в том, что расчетное значение критерия строго
больше или меньше критического, то используют односторонний критерий;
если же интересуются как положительными, так и отрицательными
расхождениями, то используют двусторонний критерий.
Критерии, в основе которых лежит предположение о нормальном или
логарифмически нормальном законе распределения изучаемой величины
называют параметрическими.
Критерии, которые не используют информацию о виде функции
распределения называют непараметрическими критериями.
5.2. Отсеивание грубых промыхов опыта
Проверка гипотезы о принадлежности случайной величины данной
генеральной совокупности.
55
При проведении эксперимента всегда есть разброс опытных данных. В
некоторых случаях могут появиться резко выделяющиеся результаты,
которые могут быть браком опыта, но они также могут и характеризовать
повышенный разброс результатов в данной партии, являющийся свойством
данной партии. Поэтому поправки в результаты опытов нельзя вносить
самопроизвольно. Это можно сделать на основании проверке статистической
гипотезы (с.г.). Но в этом случае является предположение о том, что резко
отличающийся результат, принадлежащий той же генеральной совокупности,
что и остальные наблюдения, т.е. браком опыта он не является.
В
качестве
критерия
используется
статистика
Т,
имеющая
распределение Стьюдента. Использование этого критерия возможно только
для нормально распределенной случайной величины.
Порядок проверки Н0:
1)
из ряда наблюдения исключают аномальный результат;
2)
по данным (n-1) наблюдений рассчитывают выборочные 𝑥̅ , S2, S и
tp – расчетное значение критерия Стьюдента:
tp =
xi −𝑥̅
𝑆
,
где xi – аномальный, отброшенный результат;
3)
находят
критическое
значение,
взятого
из
таблицы
t-
распределения
кр
𝑡𝑓, ,
4) сравнение, если
кр
|tp| < 𝑡𝑓, ,
то нулевая гипотеза Но принимается, т.е. сомнительный результат не
следует считать выбросом. Он должен учитываться как все остальные (n-1)
результаты.
кр
Если |tp| > 𝑡𝑓, ,
то Но – не принимается.
56
Пример 8. При исследовании развития коррозии четыре параллельных
опыта показали следующий результат:
3,6; 2,4; 2,3; 2,2 мг/см2 час
1)
исключение х=3,6
2)
х̅ =
2,4+2,3+2,2
3
= 2,3
1
1
𝑓
2
S2 = ∑(𝑥𝑖 − 𝑥)2 = ∑(0,12 + 0 + 12 )= 0,01
F = n -1 = 3 – 1 = 2
S = +√𝑆 2 = √0,01 = 0,1
xi −𝑥̅
3,6−2,3
3)
tp =
4)
𝑡2;0,05 = 4,303 (р = 0,95)
5)
|tp| < 𝑡𝑓,
𝑆
=
0,1
= 13
кр
кр
Вывод: сомнительный результат является браком опыта.
5.3.
Гипотеза о равенстве математического ожидания заданному
значению
Проверка гипотезы о равенстве математического ожидания заданному
значению.
Пусть сформулирована нулевая гипотеза Н0 : Мх = а
Н1 : Мх ≠ а
Оценкой
математического
ожидания,
получаемой
на
основе
экспериментальной выборки, является среднее арифметическое х, а оценкой
генеральной дисперсии является эмпирическая дисперсия S2
tp =
Критическое
𝑥̅ −𝑎
значение
𝑆𝑥̅
=
𝑥̅ −𝑎
𝑆𝑥 /√𝑁
кр
𝑡𝑓, определяется
для выбранной
доверительной вероятности p = 1 -  и заданного объема выборки.
кр
При |tp| < 𝑡𝑓, можно считать, что данные экспериментальной выборки
кр
не противоречат Н0 , если |tp| > 𝑡𝑓, , то гипотеза отвергается.
Пример 9. Дано число кручений проволоки k = 9, 12, 11, 7
K требуется ≥ 10
57
Необходимо проверить, существенно ли математическое ожидание и
его оценка 𝑘̅ отличается от заданного 10.
39
1)
𝑘̅ =
2)
S2 = (0,752 + 2,252 + 1,252 + 2,752) = 4,9
3)
S = +√𝑆 2 = √4,9 = 2,2
4)
tp =
5)
𝑡3;0,95 = 3,128
6)
|tp| < 𝑡𝑓,
4
= 9,75
1
2
(9,75− 10)2
2,2
= 0,23
кр
кр
Отличие
оценки
математического
ожидания
от
заданной
не
существенно. Проволоку пропускать можно.
5.4. Гипотеза о равенстве средних значений
Проверка гипотезы о равенстве средних значений. Пусть выборки
наблюдения объемом n1 и n2 берутся из генеральной совокупности с
нормальным законом распределения, необходимо проверить Н0
Н0: М(х1) = М(х2)
По данным выборки определяются оценки математического ожидания
х̅1 и х̅2 и эмпирические оценки 𝑆12 и 𝑆22 . Вычисляется объединенная оценка
г.д. (генеральной дисперсии) S2 по данным второй выборки
S2 =
𝑆12 (𝑛1 −1)+𝑆22 (𝑛2 −1)
𝑛1 +𝑛2 −2
=
∑ 𝑆𝑖2 𝑓𝑖
∑ 𝑓𝑖
Для определения Н0:
tp =
̅̅̅1̅ − ̅𝑥̅̅2̅|
|𝑥
𝑆
𝑛1 𝑛2
√𝑛
1 +𝑛2
f = 𝑛1 + 𝑛2 + 2
7)
кр
|tp| < 𝑡𝑓, - гипотеза принимается
Пример 10. На двух агрегатах обработано 21 и 25 мотков
n1 = 21; n2 = 25; ̅̅̅̅
𝜎в1 = 109 кгс/мм2; ̅̅̅̅
𝜎в2 = 101 кгс/мм2; S1 = 38; S2 = 47,6
Влияет ли состояние агрегата на уровень свойства 𝜎̅в (существенно ли
отличаются 𝜎в1 и 𝜎в2 ):
58
Решение:
H0: агрегат не влияет на уровень свойства.
1.
Вычисление объединенной оценки дисперсии
2
𝑆св
=
∑ 𝑆𝑖2 𝑓𝑖
∑ 𝑓𝑖
2
𝑆св
=
=
𝑆12 (𝑛1 −1)+𝑆22 (𝑛2 −1)
38∗20+47,6∗24
21+25−2
2.
2 = 43,24=6,58
𝑆св =√𝑆св
√
3.
Расчетный критерий Стьюдента
𝑓𝑝 =
𝑓𝑝 =
4.
𝑛1 +𝑛2 −2
= 43,24
|𝑥
̅̅̅1 − ̅̅̅
𝑥2 |
𝑛1 𝑛2
√
𝑆
𝑛1 + 𝑛2
109 − 101 21 ∗ 25
√
= 4,13
6,58
21 + 25
Критерий Стьюдента табличный
табл
табл
𝑡𝑓,𝛼
= 𝑡44;0,95
= 2,01
tрасч > tтабл
Состояние агрегата оказывает влияние на уровень свойства (H0
отвергается)
Вывод: агрегат нуждается в ремонте.
5.5. Гипотеза о равенстве дисперсий
Проверка
гипотезы
о
равенстве
дисперсий.
При
обработке
экспериментальных данных часто требуется решить вопрос, с одинаковой ли
точностью проведены измерения в двух или более выборках (однороден ли
ряд дисперсий).
Пусть имеется две независимых выборки объемом n1 и n2. По этим
выборкам вычислим оценки дисперсии 𝑆12 и 𝑆22 . Проверим Н0: 𝑆12 = 𝑆22 = 𝜎 2
Н1: 𝑆12 ≠ 𝑆22
Проверка Н0 производится с помощью критерия Фишера:
𝐹𝑝 =
𝑆12
𝑆22
, если 𝑆12 > 𝑆22
59
𝐹𝑓табл
1 ,𝑓2 ,𝛼
Если 𝐹 𝑝 < 𝐹 табл , то гипотеза Н0 принимается – выборочные данные не
противоречат гипотезе Н0.
Пример 11. Проверить: однородность дисперсии 𝑆12 и 𝑆22 .
Дано: 𝑆12 =38; 𝑆22 =46,7; n1 = 21; n2 = 25; Н0: 𝑆12 =𝑆22
Решение:
Вычисляем расчетный критерий Фишера
𝐹𝑝 =
𝑆12
𝑆22
=
46,7
= 1,25
38
табл
𝐹𝑓табл
= 𝐹24;20;0,95
= 2,08
1 ,𝑓2 ,𝛼
𝐹 𝑝 < 𝐹 табл
Вывод: Н0 о равенстве дисперсий не отвергается; измерения проведены
с равной точностью.
5.6. Однородность дисперсии нескольких выборок равного объема.
Критерий Кохрена (G)
Критерий Кохрена используется для выборок равного объема
𝑆 2 𝑚𝑎𝑥
𝐺 𝑝 = ∑𝑖𝑛
2
𝑖=1 𝑆𝑖
где N – число выборок
табл
𝐺𝑓,𝑁,𝛼
Пример 12. С четырех станков, настроенных на накатку резьбы болтов
взято по текущем выборке объемом n1 = 10/
Оценка дисперсий: 𝑆12 =106; 𝑆22 =294; 𝑆32 =216; 𝑆42 =410
Одинакова ли точность настройки автоматов.
Решение:
Т.к. контролируемые выборки одинакового объема, поэтому для
проверки H0 используется критерий Кохрена:
𝐺𝑝 =
410
106+294+216+410
=
410
1026
= 0,3996
табл
табл
𝐺𝑓,𝑁,𝛼
=𝐺9;4;0,95
= 0,502
𝐺 𝑝 < 𝐺 табл
60
Вывод: дисперсия однородна и точность настройки автоматов
одинакова.
5.7.
Однородность дисперсии выборок разного объема. Критерий
Бартлета 
2 ∑
 = 2,302 (lg 𝑆св
𝑓𝑖 − ∑ 𝑓𝑖 𝑙𝑔𝑆𝑖2 )
Критерий Бартлета имеет распределение 𝜒 2 , поэтому расчетный
критерий Бартлета будем сравнивать с критерием 𝜒 2 .
Табл: 𝜒
2
𝑓,2
𝑓 = ∑ 𝑓𝑖
≤ 𝜒
2
𝑓,2
- Н0 о равенстве дисперсий принимают.
Пример 13
Nвыб.
n
𝑓𝑖
𝑆𝑖2
1
5
4
100
2
5
4
90
3
6
5
100
4
7
6
120
Однородны ли дисперсии?
1. Расчет сводной дисперсии
2
𝑆св
=
∑ 𝑆𝑖2 𝑓𝑖
∑ 𝑓𝑖
=
4∗100+4∗90+5∗100+6∗120
19
=104
2
2. lg 𝑆св
= lg104 = 2,04
𝑓𝑖 𝑙𝑔𝑆𝑖2
2
lg 𝑆св
2
8
1,9542
7,8168
2
10
2,0792
12,4752
∑ 𝑓𝑖 𝑙𝑔𝑆𝑖2 = 38,292
3. 𝛽 расч = 2,302 ∗ (2,04 ∗ 19 − 38,292)=1,07
61
2/табл
19;0,05
4. 𝜒
= 30,1
5. ≪ 𝜒 2 - дисперсии однородны.
5.8. Непараметрические гипотезы
Гипотезы I-IV относятся к отдельным параметрам распределения
случайной величины, причем закон ее распределения предполагается
известным – нормальным или логарифмически нормальным. Однако во
многих практических задачах точный закон распределения случайной
величины неизвестен, т.е. является гипотезой, которую следует проверить.
Такие гипотезы относятся к непараметрическим. Это гипотезы о законе
распределения случайной величины, а также о независимости нескольких
случайных величин.
5.8.1.
Проверка
случайности
и
независимости
результатов
измерений в выборках
До статистической обработки результатов измерения необходимо
убедиться в том, что они независимы. И это будет Н0.
Н1
–
циклического
альтернативная
смещения
гипотеза
(дрейфа)
–
наличие
значения
монотонного
отклика,
или
вызванного
неконтролируемым параметром.
Пример дрейфа: смещение центра распределения размеров (проволоки
и т.д.) вследствие постепенного изнашивания инструмента или снижение
предела прочности на термическом агрегате вследствие появления подсоса
воздуха.
Лучшим критерием проверки Н0 является критерий последовательных
разностей 𝜏.
𝜏
где с2 =
1
2(𝑛−1)
расч
с2
= 2
𝑆
2
∑𝑛−1
𝑖=1 (𝑌𝑖+1 + 𝑌𝑖 ) ,
n – объем выборки;
i - порядковый номер измерения;
62
𝑆 2 - эмпирическая дисперсия (оценка дисперсии)
крит
𝜏ℎ,2 - определяется по табл.
5.8.2. Проверка гипотезы о законе распределения
Для проверки гипотезы получают выборку из n независимых
наблюдений.
Сравнение эмпирического и теоретического распределений проводится
с помощью критериев согласия. Их несколько:

𝜒 2 - Пирсона

D – Смирнова- Колмогорова

W – Шапиро-Уилка
Критерий согласия Пирсона 𝘟2 используют при больших объемах
выборки (n ≥ 100). Применим для всех видов распределения – универсален.
Для определения 𝜒 2 весь диапазон возможных значений случайных
величин разбивают на интервалы.
Для удобства оценок интервалы берут одинаковой длины:
𝑀 = √𝑁, где М – число интервала, N – объем выборки.
Интервалы, содержащие меньше 5 интервалов объединить с соседними.
Далее определяют абсолютные эмпирические частоты и рассчитывают
теоретические 𝑛𝑝𝑖 частоты попадания случайных величин в каждый
интервал.
Критерием,
характеризующим
степень
расхождения
между
эмпирическими и теоретическими частотами, является критерий Пирсона 𝘟2
𝑙
(𝑛𝑖 − 𝑛𝑝𝑖 )2
𝘟 =∑
𝑛𝑝𝑖
2
𝑖=1
где 𝑛𝑖 – абсолютная эмпирическая частота;
n – общее число наблюдений;
𝑝𝑖 - вероятность попадания случайной величины в i-ый интервал;
𝑛𝑝𝑖 - теоретическая абсолютная частота;
𝑙 - число интервалов;
63
Статистика 𝜒 2 имеет распределение Пирсона 𝑓 = 𝑙 − 𝑟 − 1, где
r – число постоянных, определяемых по выборке;
l – число интервалов (𝑥̅ , S) => r = 2.
После определения 𝘟2 расчет по выбранному уровню значимости α и
числа степеней свободы f по таблице 𝘟2 - распределения определяем
2
𝘟𝑓,𝛼
табл.
2
Если 𝘟2расч. > 𝘟𝑓,𝛼
табл. , то гипотезу 𝐻0 отвергают.
Пример 14. Проанализирована выборка N = 374 наблюдения. По
эмпирическим данным рассчитана
кг ∙ с
мм2
кг ∙ с
𝑆 = 0,94
мм2
𝑥̅ = 42,37
𝛼 = 0,01
N
Границы интервала
𝑥𝑖
𝑥𝑖+1 − 𝑥𝑖
1
40-41
20
2
41-42
112
3
42-43
154
4
43-44
73
5
44-45
13
6
45-46
2
Решение:
1)
Интервалы
5-6
объединяются.
Предполагаемый
закон
распределения – нормальный – Н0
2)
Проверка гипотезы требует использования непараметрических
критериев. Т.к. объем выборки большой (N > 100), можно использовать
критерий Пирсона 𝘟2 .
64
3)
Расчет теоретических частот попадания случайных величин в
интервалы
𝑃 = {𝑥𝑖 ≤ 𝑋 ≤ 𝑥𝑖+1 } = 𝑃{𝑧𝑖 ≤ 𝑍 ≤ 𝑧𝑖+1 }
Z – стандартное нормированное отклонение, выраженное в долях СКО
𝑃𝑖 = {40 < 𝑋 < 41} = Ф(𝑍2 ) − Ф(𝑍1 )
𝑍=
𝑥−𝑎
𝜎
1
1
1
1
2
2
2
2
𝑃1 = Ф∗ (−1,46) − Ф∗ (−2,52) = − Ф∗ (1,46) + Ф∗ (2,52) = −0,4279 +
0,4941 = 0,0664
1
1
2
2
𝑃2 = Ф∗ (−0,39) − Ф∗ (−1,46) = 0,4279 − 0,1517 = 0,2762
Аналогично рассчитываются 𝑃3 … 𝑃5
Данные сводим в таблицу:
Расчет критерия согласия
N
инте
рвал
а
Гран
ицы
интер
вала
𝑍𝑖
1
4041
4142
4243
4344
44
и↑
2,52
1,46
0,39
0,67
2
3
4
5
Σ
𝑍𝑖+1
1 ∗
Ф (𝑍1)
2
1 ∗
Ф (𝑍𝑖+1)
2
𝑃𝑖
-0,4279 0,066
1,46 0,4942
4
-0,1518 0,276
0,39 0,4279
2
0,67
0,2486 0,400
0,1518
3
1,73 0,2486 0,4583 0,209
7
1,73 3,87 0,4583 0,4999 0,041
8
1
𝑛𝑖 − 𝑛𝑝𝑖
(𝑛𝑖 − 𝑛𝑝𝑖 )2
𝑛𝑝𝑖
24,83 20
4,83
0,9395
103,2 11
2
2
149,7 15
5
4
78,39 73
8,78
0,7327
4,25
0,1206
5,39
0,3706
15,60 15
0,6
0,0231
𝑛𝑝𝑖
𝑛𝑖
37
4
2,188
𝑓 =𝑙−𝑟−1=5−2−1=2
Находим 𝘟22; 0,01 табл. = 9,21
𝘟2расч. = 2,18 < 9,21
Гипотеза Н0 о нормальном законе распределения принимается.
65
5.8.3. Критерий согласия Шапиро - Уилка (W)
Предназначен
для
проверки
гипотезы
о
нормальном
или
логарифмически нормальном распределении при ограниченном объеме
выборки (𝑛 ≤ 50). При использовании W результаты испытаний располагают
в порядке возрастания.
𝑊 расч. =
𝑏2
𝑄
,
Где 𝑄 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 – сумма квадратов отклонений случайной
величины x от ее среднего арифметического.
1
1
𝑓
𝑓
Т.к. 𝑆 2 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 = 𝑄; то 𝑄 = 𝑓𝑆 2
𝑏 = ∑𝑘𝑖=1 𝑎𝑛−𝑖+1 (𝑥𝑛−𝑖−1 − 𝑥𝑖 ); (𝑥6 − 𝑥1 ; 𝑥5 − 𝑥2 ; 𝑥4 − 𝑥3 )
𝑛
𝑘 = , если n – четное число;
2
𝑘=
𝑛−1
2
, если n – нечетное число;
𝑎𝑛−𝑖+1 – коэффициенты, которые берут из таблиц;
Найти 𝑏 2 , рассчитать 𝑊 расч. .
кр.
Если 𝑊 расч. ≥ 𝑊2
- гипотезу принимают.
Пример 15. Проверить, являются ли результаты испытания проволоки
на кручение выборкой из нормальной совокупности.
10; 12; 8; 15; 16; 4; 10; 13; (n = 8).
Подчиняются ли данные нормальному закону распределения?
Решение:
Н0 – выборка, которая подчиняется нормальному закону
1.
распределения. Для проверки этой гипотезы необходимо использовать
непараметрический критерий W Шапиро – Уилка, т.к. объем выборки
маленький.
Расположение
2.
экспериментальных
результатов
в
порядке
возрастания: 4; 8; 10; 10; 12; 13; 15; 16.
Определение 𝑥̅ , 𝑄:
3.
𝑥̅ =
88
8
= 11;
66
𝑄 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 = 49 + 9 + 1 + 1 + 1 + 4 + 16 + 25 = 106.
Определение коэффициентов по таблице:
𝑎𝑛−𝑖+1
𝑎8 = 0,6052
𝑎7 = 0,3164
𝑎6 = 0,1743
𝑎5 = 0,0561
𝑘
𝑏 = ∑ 𝑎𝑛−𝑖+1 (𝑥𝑛−𝑖−1 − 𝑥𝑖 )
𝑖=1
= 0,6052(16 − 4) + 0,3164(15 − 8) + 0,1743(13 − 10)
+ 0,0561(12 − 10) = 10,1123
𝑊
расч.
𝑏 2 (10,1123)2
=
=
= 0,96
𝑄
106
кр
𝑊8;0,05 = 0,818 - табл.
кр.
𝑊 расч. > 𝑊2 - принимаем гипотезу Н0.
5.8.4. Критерий принадлежности двух независимых выборок
единой генеральной совокупности
Очень часто при изменении режимов технологического процесса;
замене одной марки стали на другую; изменении условий эксплуатации
возникают вопросы, связанные со значимостью влияния этих изменений на
характеристики случайных величин.
Алгоритм проверки значимости
1.
Организуется
изготовление
экспериментальных
партий
по
сравниваемым вариантам. Выбирается критерий качества, проводится
испытание. Получают экспериментальные выборки значений случайных
величин.
2.
Проверка независимости случайных величин в выборках по
критерию 𝜏 2 – последующих разностей.
67
Проверка гипотезы о законе распределения случайных величин
3.
(𝘟2 или W).
Если выборки подчиняются закону нормального распределения
4.
или логарифмически нормальному закону, то производится сравнение
соизмеримости дисперсии (с одинаковой ли точностью проведены опыты в
выборках).
Если дисперсии равны, то проводится сравнение средний в
5.
выборках по критерию Стьюдента.
Если выборки не принадлежат нормальной совокупности, то t и F
6.
– критериев невозможно. Тогда непараметрические критерии:

Колмогорова - Смирнова (D) – для больших выборок ;

Уилконсона –Манна –Уитни – для малых объемов выборок.
Если критерий качества лучше по предлагаемому варианту, то замена
целесообразна. Если средние существенно не отличаются, то при решении
учитываются другие показатели.
Контрольные вопросы
1.
Что такое генеральная совокупность и выборка?
2.
В чем заключается сущность статистических гипотез? Что такое
нулевая и альтернативная статистические гипотезы?
3.
С
помощью
каких
критериев
производится
отсев
грубых
погрешностей?
4. Какие задачи возникают при сравнении двух рядов наблюдений
экспериментальных данных? С помощью каких критериев они решаются?
5. Что такое критерий согласия? Какова основная идея его
использования при проверке гипотез о виде функции распределения?
6. В чем заключается алгоритм использования критерия Пирсона для
проверки гипотезы нормального распределения экспериментальных данных?
68
6. Планирование эксперимента
Под планированием эксперимента понимается определение цели
каждого эксперимента, число серий и измерений в каждой серии, достижение
оптимума соотношения экономии материалов и адекватности проведенных
измерений. Однако мало спланировать – необходимо еще так провести
эксперимент и оформить его результаты, чтобы они могли быть адекватно
восприняты другими исследователями и могли в случае необходимости
подтвердить приоритет данного исследователя или лаборатории.
Пассивный эксперимент – эксперимент, при котором уровни факторов
в каждом опыте регистрируются исследователем, но не задаются.
Если
же
экспериментатор
имеет
возможность
не
только
контролировать факторы, но и управлять ими, то такой эксперимент носит
название активного.
Активный эксперимент – эксперимент, в котором уровни факторов в
каждом опыте задаются исследователем.
Планирование
эксперимента
–
выбор
плана
эксперимента,
удовлетворяющего поставленным требованиям.
План эксперимента – совокупность данных, определяющих число,
условия и порядок реализации опытов.
К
требованиям,
предъявляемым
при
планировании
активного
эксперимента, можно отнести степень точности и надежности результатов,
сроки и средства, имеющиеся в распоряжении исследователя и т.д.
6.1. Стадии активного эксперимента
1. Изучение объекта исследования, сбор априорной информации (по
заводским данным и по литературным источникам).
2. Предварительное планирование эксперимента – выбор параметра
оптимизации Υ (отклика), факторов Υ, влияющих на Υ.
3. Планирование эксперимента. Определение числа опытов, их
условий, порядка реализации (т.е. составление матрицы планирования).
69
4. Проведение эксперимента по правилам, исключающим влияние
систематических ошибок (рандомизация опытов).
5. Статистический анализ полученных экспериментальных данных
(отсеивание грубых промахов).
6. Составление предварительной математической модели.
7. Проверка
статистических
гипотез, отсеивание статистически
незначимых коэффициентов, получение окончательной математической
модели.
8.
Проверка
адекватности
модели
(сходимость
расчетных
и
экспериментальных данных).
9. Анализ модели и ее интерпретация (истолкование).
10. Принятие решений о дальнейших исследованиях.
11. Выдача рекомендаций и проверка их в производственных условиях.
При проведении эксперимента задача исследователя – получить
математическую модель – аналитическое выражение между параметрами
оптимизации и факторами.
𝛶 = 𝑓(𝑥2 , 𝑥2 , … , 𝑥𝑛 ),
где 𝛶 - параметр оптимизации;
𝑥2 , 𝑥2 , … , 𝑥𝑛 - факторы;
𝑓 - функция отклика.
Это уравнение описывает некоторую поверхность в многомерном
пространстве
факторов,
называемым
факторным
пространством,
а
исследуемая поверхность называется поверхностью отклика. Функция
отклика представляется в виде полиномов разных степеней. Обычно
используют разложение неизвестной функции отклика в ряду Тейлора:
𝛶 = 𝛽0 + ∑𝑘1 𝛽𝑗 𝑥𝑗 + ∑𝑘1 𝛽𝑗𝑢 𝑥𝑗 𝑥𝑢 + ∑𝑘1 𝛽𝑗𝑗 𝑥𝑗2
𝛶 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + 𝛽12 𝑥1 𝑥2 + 𝛽1 𝑥12 + 𝛽2 𝑥22 – для двухфакторной
модели, где:
𝛽0 , 𝛽𝑗 , 𝛽𝑗𝑢 , 𝛽𝑗𝑗 - истинные (генеральные) коэффициенты регрессии при
соответствующих переменных.
70
Для определения истинных (генеральных) значений коэффициентов
необходимо бесконечно большое число опытов. На практике число опытов
ограничено, поэтому можно определить лишь приближенное значение
коэффициентов (оценки) истинных значений.
𝑦 = 𝑏0 + ∑𝑘1 𝑏𝑗 𝑥𝑗 + ∑𝑘1 𝑏𝑗𝑢 𝑥𝑗 𝑥𝑢 + ∑𝑘1 𝑏𝑗𝑗 𝑥𝑗2 + ⋯
где у – выборочная оценка параметра оптимизации (функции отклика).
Построить модель – значит выбрать ее вид на основе априорной
информации и определить коэффициенты на основе экспериментальных
данных.
6.2. Предварительное планирование эксперимента
Включает в себя следующие этапы:
1)
Постановка
задачи
–
четкое
определение
цели
работы,
определение объекта исследование. Объект исследования д.б. управляем,
факторы д.б. регулируемые.
2)
Выбор параметра оптимизации 𝛶. Желательно, чтобы он был
единственным, характеризующийся числом (типа балл, класс, сорт), имел
ясный физический смысл.
В качестве характеристики пластичности для хрупких материалов
следует выбрать относительное удлинение, для вязких – относительное
сужение.
Однозначность в статистическом смысле означает, что заданному
набору будет соответствовать одно значение параметра оптимизации 𝛶 с
точностью до ошибки эксперимента.
Построение
модели
значительно
упрощается,
если
параметр
оптимизации – единственный. Однако на практике это требование
выполняется редко. Тогда прибегают к способу уменьшения числа
параметров оптимизации у:
1.
Корреляционный анализ: методом корреляционного анализа
устанавливается связь между параметром оптимизации, выявляется наиболее
влиятельное свойство, через него выражаются все остальные;
71
2.
Априорное ранжирование (Новик, Арсов);
3.
Решение компромиссных задач.
3)
Выбор
измеряемыми,
факторов.
управляемые.
Они
должны
Совокупность
быть
факторов
независимыми,
должна
быть
совместимой. При решении задач моделирования на выбор факторов следует
обращать серьезное внимание, т.к. если хотя бы один из сильно влияющих
факторов (или их взаимодействует) – пропущен, то модель будет
неадекватной.
Однако
чрезмерное
увеличение
факторов
ведет
к
значительному увеличению объема эксперимента.
Контрольные вопросы
1.
Что понимают под планированием эксперимента?
2.
Что такое активный и пассивный эксперимент?
3.
Назовите стадии активного эксперимента.
4.
Какие
этапы
включаете
предварительное
планирование
эксперимента?
72
Список литературы:
1.
Безарашвили Г.С. Планирование эксперимента: (Крат. курс лекций
для спец. "Катализ и техн. химия") –Тбилиси: Изд-во Тбил. гос. ун-та, 1989. –
108 с.
2. Прохоров В.Т. Планирование эксперимента: Учеб. пособие по
дисциплине "Основы науч. исслед." / Моск. тех-нол. ин-т. М, 1988. – 64 с.
3. Джонсон Н., Лион Ф. Статистика и планирование эксперимента в
технике и науке: Методы планирования эксперимента. – М.: Мир, 1981. –
520с .
4. Красовский Г.И., Филаретов Г.Ф. Планирование эксперимента. –
Мн.: Изд-во БГУ, 1982. – 302 с.
5. Методы планирования и обработки результатов инженерного
эксперимента: Конспект лекций (отдельные главы из учебника для вузов) /
Н.А.Спирин, В.В.Лавров. Под общ. ред. Н.А.Спирина. Екатеринбург: ГОУ
ВПО УГТУ-УПИ, 2004. – 257 с.
73
74
Скачать