Uploaded by baranova

Планирование эксперимента1

advertisement
ПЛАНИРОВАНИЕ
ЭКСПЕРИМЕНТА И
ОБРАБОТКА РЕЗУЛЬТАТОВ
Краткий курс лекций
Д.В. Степовой,
М.Н. Середина,
Н.М. Удинцова,
Т.В. Жидченко
𝑛𝑛𝑖𝑖
ℎ
2
1,6
1,2
0,8
0,4
45
55
65
75 85 95 105 115 𝑥𝑥
УЧЕБНОЕ ПОСОБИЕ
1
МИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА РОССИЙСКОЙ ФЕДЕРАЦИИ
ДЕПАРТАМЕНТ НАУЧНО-ТЕХНОЛОГИЧЕСКОЙ ПОЛИТИКИ И
ОБРАЗОВАНИЯ
ФЕЛЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ОБРАЗОВАНИЯ «ДОНСКОЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ»
(ФГБОУ ВО Донской ГАУ)
АЗОВО-ЧЕРНОМОРСКИЙ ИНЖЕНЕРНЫЙ ИНСТИТУТ – ФИЛИАЛ
ФЕДЕРАЛЬНОГО ГОСУДАРСТВЕННОГО БЮДЖЕТНОГО ОБРАЗОВАТЕЛЬНОГО
УЧРЕЖДЕНИЯ ВЫСШЕГО ОБРАЗОВАНИЯ
«ДОНСКОЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ» В Г. ЗЕРНОГРАДЕ
(Азово-Черноморский инженерный институт ФГБОУ ВО Донской ГАУ)
Степовой Д.В., Середина М.Н., Удинцова Н.М., Жидченко Т.В.
ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА И
ОБРАБОТКА РЕЗУЛЬТАТОВ
Краткий курс лекций
Учебное пособие
Зерноград – 2023
Об издании 1,2
Содержание
© Д.В. Степовой, М.Н. Середина,
Н.М. Удинцова, Т.В. Жидченко 2023.
© Азово-Черноморский инженерный институт
ФГБОУ ВО Донской ГАУ, 2023
2
УДК 512, 514
Издается по решению методических комиссий по направлениям подготовки 23.04.01 «Технология транспортных процессов», 23.04.03 «Эксплуатация транспортно-технологических машин и комплексов» Азово-Черноморского инженерного института ФГБОУ ВО Донской ГАУ
Рецензенты:
канд. техн. наук, заведующий кафедрой «Эксплуатация и технический сервис
наземных транспортно-технологических средств» Оберемок В.А.
канд. соц. наук, доцент кафедры «Математика и биоинформатика»
Серегина В.В.
Планирование эксперимента и обработка результатов. Краткий курс лекций /
Степовой Д.В., Середина М.Н., Удинцова Н.М., Жидченко Т.В. [Электронный
ресурс]: учебное пособие/ Д.В. Степовой., Середина М.Н., Удинцова Н.М.
Жидченко Т.В. − Электрон. дан. – Зерноград: Азово-Черноморский инженерный институт ФГБОУ ВО Донской ГАУ, 2023 – 151 с. – Режим доступа: сетевое распространение.
Учебное пособие предназначено для студентов очной и заочной форм
обучения по направлениям подготовки 23.04.01 «Технология транспортных
процессов», 23.04.03 «Эксплуатация транспортно-технологических машин и
комплексов».
Рассмотрено и одобрено на заседании кафедры математики и
биоинформатики.
Протокол № 9 от 20 апреля 2023 г.
Рассмотрено и одобрено методической комиссией по направлениям
подготовки 23.03.01 и 23.04.01 «Технология транспортных процессов».
Протокол № 7 от 25 апреля 2023 г.
Рассмотрено и одобрено методической комиссией по направлениям
подготовки 23.03.03 и 23.04.03 «Эксплуатация транспортных и транспортнотехнологических машин и комплексов».
Протокол № 4 от 16 июня 2023 г.
© Д.В. Степовой, М.Н. Середина,
Н.М. Удинцова, Т.В. Жидченко 2023.
© Азово-Черноморский инженерный институт
ФГБОУ ВО Донской ГАУ, 2023
3
Содержание
Содержание
Введение ................................................................................................................... 7
1.
ЭКСПЕРИМЕНТ, КАК ИНСТРУМЕНТ НАУЧНЫХ ИССЛЕДОВАНИЙ
8
1.1. Понятие эксперимента .................................................................................... 8
1.2. Виды экспериментальных исследований ..................................................... 9
2.
КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ........................ 15
2.1. Случайные события.................................................................................. 15
2.1.1. Основные понятия ................................................................................ 15
2.1.2. Классическое определение вероятности ...................................... 16
2.1.3. Относительная частота события ..................................................... 17
2.1.4. Статистическая вероятность............................................................. 18
2.2. Случайные величины .............................................................................. 18
2.2.1. Понятие случайной величины ......................................................... 18
2.2.2. Закон распределения дискретной случайной величины ........ 19
2.2.3. Математическое ожидание дискретной случайной величины
20
2.2.4. Дисперсия дискретной случайной величины ............................. 21
2.2.5. Функция распределения случайной величины .......................... 23
2.2.6. Функция плотности распределения ............................................... 23
2.2.7. Числовые характеристики непрерывных случайных величин
24
2.2.8. Нормальное распределение .............................................................. 26
Ответы. 6) 2,2. 7) 𝟑𝟑𝟑𝟑𝟑𝟑. .......................................................................................... 32
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ
ДАННЫХ ............................................................................................................... 32
3.1. Выборочный метод ........................................................................................ 32
3.1.1. Задачи математической статистики .......................................................... 32
3.1.2. Выборка ........................................................................................................ 32
4
Содержание
3.1.3. Статистическое распределение выборки (эмпирический закон
распределения) ...................................................................................................... 33
3.1.4. Полигон и гистограмма. Статистическая кривая распределения .......... 35
3.2. Статистические оценки параметров распределения .................................. 37
3.2.1. Оценка среднего значения генеральной совокупности........................... 37
3.2.2. Оценка дисперсии генеральной совокупности ........................................ 39
3.2.3. Коэффициент вариации .............................................................................. 41
3.2.4. Доверительная вероятность. Доверительный интервал .......................... 42
3.2.5. Доверительные интервалы для оценки параметров нормального
распределения ........................................................................................................ 43
3.3. Проверка статистических гипотез ............................................................... 44
3.3.1. Статистические гипотезы ......................................................................... 44
3.3.2. Статистический критерий проверки нулевой гипотезы ....................... 45
3.3.3. Критерий согласия Пирсона .................................................................... 46
3.3.4. Проверка гипотезы о нормальном распределении количественного
признака генеральной совокупности .................................................................. 48
3.3.5. Проверка гипотезы о показательном распределении количественного
признака генеральной совокупности .................................................................. 51
3.4.
Отсев грубых погрешностей .................................................................... 57
3.4.1. Критерий Н.В. Смирнова ......................................................................... 58
3.4.2. Критерий Диксона..................................................................................... 59
4.
АНАЛИЗ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА .......................................... 62
4.1.
Характеристика взаимосвязей признаков .............................................. 62
4.2.
Понятие регрессии .................................................................................... 63
4.3.
Средняя ошибка аппроксимации............................................................. 66
4.4.
Линейная парная регрессия...................................................................... 67
4.5.
Параболическая парная регрессия .......................................................... 72
4.6.
Гиперболическая парная регрессия ........................................................ 74
4.7. Полулогарифмическая парная регрессия ................................................... 76
4.8.
Степенная парная регрессия .................................................................... 77
5
Содержание
4.9.
Показательная парная регрессия ............................................................. 79
4.10.
Оценка тесноты связи между факторами ............................................... 84
5.
4.10.1.
Линейный коэффициент корреляции ............................................ 84
4.10.2.
Коэффициент детерминации .......................................................... 85
4.10.3.
Оценка значимости линейного коэффициента корреляции ....... 86
4.10.4.
Корреляция для нелинейной регрессии. Индекс детерминации 89
4.10.5.
Индекс корреляции ......................................................................... 92
4.10.6.
Проверка качества уравнения регрессии. F-критерий Фишера . 93
МЕТОДЫ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА ................................... 96
5.1.
Основные понятия и определения........................................................... 96
5.2.
Планирование первого порядка ............................................................. 100
5.2.1. Выбор основных факторов и их уровней ............................................. 101
5.2.2. Планирование эксперимента ................................................................. 102
5.2.3. Вычисление коэффициентов уравнения регрессии ............................. 104
5.2.4. Статистический анализ результатов эксперимента............................. 106
5.2.5. Дробный факторный эксперимент ........................................................ 108
5.2.6. Математическая модель гидравлического режима методической печи
112
6.
6.1.
МЕТОДЫ ОПТИТМИЗАЦИИ................................................................... 116
Элементы линейного программирования ............................................. 117
6.1.1. Общая задача линейного программирования ...................................... 117
6.1.2. Стандартная форма задачи линейного программирования ................ 119
6.1.3. Графический метод решения задач линейного программирования .. 120
6.2.
Элементы нелинейного программирования ......................................... 124
6.2.1. Метод покоординатного спуска ............................................................ 125
6.2.2. Метод градиентного спуска ................................................................... 126
Приложение 1. Таблица значений функции Лапласа ................................ 129
Приложение 2. Таблица значений 𝑡𝑡 = 𝑡𝑡(𝛾𝛾, 𝑛𝑛) .............................................. 130
Приложение 3. Таблица значений 𝑞𝑞 = 𝑞𝑞(𝛾𝛾, 𝑛𝑛) ............................................. 130
6
Содержание
Приложение 4. Виды распределений случайных величин ....................... 131
Равномерное распределение дискретной случайной величины ............ 131
Биномиальное распределение дискретной случайной величины ......... 131
Гипергеометрическое распределение .......................................................... 132
Геометрическое распределение дискретной случайной величины....... 134
Распределение Пуассона дискретной случайной величины ................... 135
Равномерное распределение непрерывной случайной величины ......... 135
Показательное распределение непрерывной случайной величины ..... 136
Распределение «хи-квадрат» .......................................................................... 137
𝐹𝐹-распределение (распределение Фишера ) .............................................. 138
Распределение Стьюдента .............................................................................. 138
Приложение 5. Критические точки распределения 𝜒𝜒2 ............................. 139
Приложение 6. Понятие о числе степеней свободы ................................... 140
Приложение 7. Критические значения t–критерия Стьюдента на уровнях
значимости 0,1; 0,05; 0,01 ................................................................................... 141
Приложение 8. Шкала Чеддока. .................................................................. 141
Приложение 9. Таблица значений F-критерия Фишера .................................. 142
Приложение 10. Критические значения критерия Н.В. Смирнова 𝒖𝒖𝒖𝒖, 𝒏𝒏 в
зависимости от объема выборки 𝒏𝒏 и уровня значимости 𝒖𝒖 ........................... 143
Приложение 11. Коэффициенты Диксона в зависимости от объема выборки 𝒏𝒏
и уровня значимости 𝒖𝒖 ....................................................................................... 144
Приложение 12. Распределение Кохрена ......................................................... 145
Литература ........................................................................................................... 146
Предметный указатель ........................................................................................ 147
7
Содержание
Введение
Студенты, обучающиеся по направлению подготовки 23.04.01 «Технология транспортных процессов», изучают дисциплину «Планирование эксперимента и обработка результатов».
Изучение данной дисциплины формирует у обучающихся следующие универсальную
и общепрофессиональную компетенции:
− способен управлять проектом на всех этапах его жизненного цикла (УК-2);
− способен проводить исследования, организовывать самостоятельную и коллективную научно-исследовательскую деятельность при решении инженерных и
научнотехнических задач, включающих планирование и постановку эксперимента, критическую оценку и интерпретацию результатов (ОПК-4).
Студенты, обучающиеся по направлению подготовки 23.04.03 «Эксплуатация транспортно-технологических машин и комплексов», изучают дисциплину «Планирование эксперимента и обработка результатов».
Изучение данной дисциплины формирует у обучающихся следующие универсальную и общепрофессиональную компетенции:
− способен управлять проектом на всех этапах его жизненного цикла (УК-2);
− способен ставить и решать научно-технические задачи в сфере своей профессиональной деятельности и новых междисциплинарных направлений с использованием естественнонаучных и математических моделей с учетом последних достижений науки и техники(ОПК-1).
8
Содержание
1. ЭКСПЕРИМЕНТ, КАК ИНСТРУМЕНТ НАУЧНЫХ
ИССЛЕДОВАНИЙ
Научному сотруднику, инженеру приходится решать задачи по планированию и проведению экспериментальных исследований, обработке результатов инженерного эксперимента. Развитие современных методов математического планирования и обработки результатов инженерного эксперимента, расширение возможностей современной компьютерной техники позволяют рекомендовать исследователю общие подходы, методы и процедуры планирования
эксперимента и обработки его результатов.
1.1. Понятие эксперимента
Во многих областях научной и практической деятельности современного
человека значительное место занимают теоретические методы изучения различных объектов и процессов окружающего нас мира. Однако, несмотря на
высокую эффективность теоретических методов, при рассмотрении конкретных технологических проблем, особенно в условиях действующего производства, инженеру зачастую приходится сталкиваться с задачами, решение которых практически невозможно без организации и проведения того или иного
экспериментального исследования.
В технической литературе термину эксперимент устанавливается следующее определение − система операций, воздействий и (или) наблюдений,
направленных на получение информации об объекте исследования. Планирование эксперимента − выбор плана эксперимента, удовлетворяющего заданным требованиям, совокупность действий, направленных на разработку стратегии экспериментального исследования (от получения априорной информации до получения работоспособной математической модели или определения
оптимальных условий). Это целенаправленное управление экспериментом, реализуемое в условиях неполного знания механизма изучаемого явления.
Хотя объекты исследований очень разнообразны, методы экспериментальных исследований имеют много общего:
− каким бы простым ни был эксперимент, вначале выбирают план
его проведения;
− стремятся сократить число рассматриваемых переменных, для того
чтобы уменьшить объем эксперимента;
− стараются контролировать ход эксперимента;
9
Содержание
− пытаются исключить влияние случайных внешних воздействий;
− оценивают точность измерительных приборов и точность получения данных;
− и наконец, в процессе любого эксперимента анализируют полученные результаты и стремятся дать их интерпретацию, поскольку без
этого решающего этапа весь процесс экспериментального исследования не имеет смысла.
Если работа экспериментатора будет хаотична и не организованна, а ее
эффективность так мала, что полученные результаты не в состоянии оправдать
даже тех средств, которые были израсходованы на проведение опытов, то очевидно, что такая деятельность экономически нецелесообразна. Поэтому вопросы организации эксперимента, снижения затрат на его проведение и обработку полученных результатов являются весьма актуальными.
Современные методы планирования эксперимента и обработки его результатов, разработанные на основе теории вероятностей и математической
статистики, позволяют существенно (зачастую в несколько раз) сократить
число необходимых для проведения опытов. Знание и использование этих методов делает работу экспериментатора более целенаправленной и организованной, существенно повышает как производительность его труда, так и
надежность получаемых им результатов.
1.2. Виды экспериментальных исследований
Прежде всего, отметим, что любой эксперимент предполагает проведение
тех или иных опытов.
Опыт − воспроизведение исследуемого явления в определенных условиях проведения эксперимента при возможности регистрации его результатов.
По цели проведения и форме представления полученных результатов эксперимент делят на качественный и количественный.
Качественный эксперимент устанавливает только сам факт существования какого-либо явления, но при этом не дает никаких количественных характеристик объекта исследования. Любой эксперимент, каким бы сложным
он ни был, всегда заканчивается представлением его результатов, формулировкой выводов, выдачей рекомендаций. Эта информация может быть выражена в виде графиков, чертежей, таблиц, формул, статистических данных или
словесных описаний. Качественный эксперимент как раз и предусматривает
10
Содержание
именно словесное описание его результатов. Зачастую качественный эксперимент существенно проще количественного и не требует специальной аппаратуры.
Пример 1.1. Если взять два одинаковых участка земли на поле и на одном
из них внести удобрения, то урожай на участке с удобрениями окажется большим. Это означает, что внесение удобрений повышает урожайность.
Однако словесное описание − не самый эффективный и информативный
способ представления результатов эксперимента, поскольку он не позволяет
дать количественных рекомендаций, проанализировать свойства объекта в
иных условиях. Поэтому в инженерной практике основное содержание эксперимента представляется количественными зависимостями.
Количественный эксперимент не только фиксирует факт существования того или иного явления, но, кроме того, позволяет установить соотношения между количественными характеристиками явления и количественными
характеристиками способов внешнего воздействия на объект исследования.
В условиях примера 1.1, для того чтобы перевести эксперимент из разряда
«качественный» в «количественный», необходимо в результате эксперимента
установить количественную зависимость между урожайностью и объемом
вносимых удобрений.
Итак, количественный эксперимент, прежде всего, предполагает количественное определение всех тех способов внешнего воздействия на объект исследования, от которых зависит его поведение − количественное описание
всех факторов.
Фактор − переменная величина, по предположению влияющая на результаты эксперимента.
Например, в качестве факторов, влияющих на урожайность, можно выбрать объем вносимых удобрений, запасы влаги в почве, осадки, температуру
воздуха и т.п.
В отдельном конкретном опыте каждый фактор может принимать одно из
своих возможных значений − уровень фактора.
Уровень фактора − фиксированное значение фактора относительно
начала отсчета.
Например, одним уровнем такого фактора, как объем вносимых удобрений, может быть 50 кг/га, другим – 100 кг/га и т.д.
Фиксированный набор уровней всех факторов в каждом конкретном
опыте как раз и определяет одно из возможных состояний объекта исследования. При проведении опытов очень многое зависит от того, насколько активно
11
Содержание
экспериментатор может «вмешиваться» в исследуемое явление, имеет он или
нет возможность устанавливать те уровни факторов, которые представляют
для него интерес.
С этой точки зрения все факторы можно разбить на три группы:
− контролируемые и управляемые − это факторы, для которых можно
не только зарегистрировать их уровень, но еще и задать в каждом
конкретном опыте любые их возможные значения;
− контролируемые, но неуправляемые факторы − это факторы,
уровни которых можно только регистрировать, а вот задать в каждом опыте их определенное значение практически невозможно;
− неконтролируемые − это факторы, уровни которых не регистрируются экспериментатором и о существовании которых он может и не
подозревать.
В примере 1.1 в качестве контролируемых и управляемых факторов
можно рассматривать объем вносимых удобрений, предпосевная обработка
семян, предшественники. А вот фактическое выпадение осадков попадет в
группу контролируемых, но неуправляемых факторов (если на поле отсутствует система орошения), т.е. количество осадков можно регистрировать, но
не управлять ими.
Наконец, к группе неконтролируемых факторов в этом примере можно
отнести массу причин, по которым может измениться урожайность (неблагоприятные условия хранения или перевозки посевного материала и многое другое).
В количественном эксперименте необходимо не только регистрировать
уровни всех контролируемых факторов, но и иметь возможность устанавливать количественное описание того свойства (отклика) исследуемого явления,
которое изучает (наблюдает) экспериментатор. На объект исследования в процессе эксперимента всегда влияет огромное количество неконтролируемых
факторов, это вносит в получаемые результаты некоторый элемент неопределенности, значение отклика, в каждом конкретном опыте, невозможно предсказать заранее. Поэтому воспроизведение исследуемого явления при одном и
том же фиксированном наборе уровней всех контролируемых факторов всегда
будет приводить к различным значениям отклика, т.е. отклик − это всегда случайная величина.
Отклик − наблюдаемая случайная переменная, по предположению зависящая от факторов.
12
Содержание
Откликом в условиях примера 1.1 является урожайность. При этом даже
если взять два участка земли равной площади, то для каждого участка мы получим разные (хотя и очень близкие друг к другу) значения урожайности.
И наконец, в результате количественного эксперимента необходимо
найти зависимость между откликом и факторами − функцию отклика. Причем,
поскольку отклик − это случайная величина, то, с точки зрения теории вероятностей, его можно задать одним из параметров своего распределения, например математическим ожиданием.
Функция отклика − зависимость математического ожидания отклика от
факторов. В примере с посевами − это зависимость математического ожидания
величины урожайности от объема вносимых удобрений, предпосевной обработки семян, предшественников.
С учетом приведенного выше деления факторов на три группы, функцию
отклика в самом общем случае можно записать в виде:
𝑀𝑀𝑦𝑦 = 𝑓𝑓�𝑥𝑥𝑖𝑖 , ℎ𝑗𝑗 � + 𝜀𝜀𝛿𝛿 ,
(1.1)
где 𝑀𝑀𝑦𝑦 − математическое ожидание отклика; 𝑥𝑥𝑖𝑖 − контролируемые и управляемые факторы; ℎ𝑗𝑗 − контролируемые, но неуправляемые факторы; 𝜀𝜀𝛿𝛿 − ошибка
эксперимента, учитывающая влияние неконтролируемых факторов.
По тому, какой группой факторов располагает исследователь, количественный эксперимент в свою очередь можно разделить еще на два вида.
Если в распоряжении экспериментатора нет управляемых факторов, то
такой эксперимент носит название пассивного.
Пассивный эксперимент − эксперимент, при котором уровни факторов
в каждом опыте регистрируются исследователем, но не задаются.
Поскольку при пассивном эксперименте исследователь не имеет возможность задать уровень ни одного из факторов, то при проведении опытов ему
остается лишь «пассивно» наблюдать за явлением и регистрировать результаты.
Планирование пассивного эксперимента сводится к определению числа
опытов, которые необходимо провести исследователю для решения поставленной перед ним задачи, а конечной целью пассивного эксперимента в большинстве случаев является получение функции отклика в виде:
𝑀𝑀𝑦𝑦 = 𝑓𝑓�ℎ𝑗𝑗 � + 𝜀𝜀𝛿𝛿 .
(1.2)
Если же экспериментатор имеет возможность не только контролировать
факторы, но и управлять ими, то такой эксперимент носит название активного.
13
Содержание
Активный эксперимент − эксперимент, в котором уровни факторов в каждом опыте задаются исследователем. Поскольку в этом случае экспериментатор имеет возможность «активно» вмешиваться в исследуемое явление, то
естественно, что активный эксперимент всегда предполагает какой-либо план
его проведения.
План эксперимента — совокупность данных, определяющих число,
условия и порядок реализации опытов.
Поэтому активный эксперимент всегда должен начинаться с планирования.
Планирование эксперимента − выбор плана эксперимента, удовлетворяющего поставленным требованиям.
К требованиям, предъявляемым при планировании активного эксперимента, можно отнести степень точности и надежности результатов, полученных после проведения эксперимента, сроки и средства, имеющиеся в распоряжении исследователя, и т.д.
Целью активного эксперимента может быть либо определение функции
отклика в виде:
𝑀𝑀𝑦𝑦 = 𝑓𝑓(𝑥𝑥𝑖𝑖 ) + 𝜀𝜀𝛿𝛿 ,
(1.3)
либо поиск такого сочетания уровней управляемых факторов 𝑥𝑥𝑖𝑖 , при котором
достигается оптимальное (экстремальное — минимальное или максимальное)
значение функции отклика. В этом последнем случае эксперимент носит еще
название поискового (экстремального) эксперимента.
Например, если в случае с посевами мы бы поставили перед собой целью
найти такое сочетание объема вносимых удобрений и предпосевной обработкой семян, при которых урожайность была бы максимальной, то наш эксперимент стал бы поисковым.
И наконец, по условиям проведения различают лабораторный и промышленный эксперименты.
Лабораторный эксперимент. В лаборатории меньше влияние случайных погрешностей, обеспечивается большая «стерильность» условий проведения опытов, в большинстве случаев осуществляется и более тщательная подготовка эксперимента.
Как правило, в лабораторных условиях экспериментатор может воспроизвести опыт «одинаково» значительно лучше, чем на производстве. Это означает, что при прочих равных условиях для установления некоторого факта на
производстве потребуется выполнить значительно больше опытов, чем в лаборатории.
14
Содержание
Другое важное отличие — это большая возможность варьировать (изменять) уровни факторов. Например, в теплице исследователь может менять климат в широких пределах или, наоборот, поддерживать его на определенном
уровне. На поле напротив, поддержка климатических условий практически не
возможна.
В лабораторном эксперименте существенную роль играет субъект исследования, экспериментатор, который создает установку или условия для проведения опытов.
Промышленный эксперимент. В промышленных условиях обеспечить
условия лабораторного эксперимента значительно труднее. Усложняются измерения и сбор информации, значительно большее влияние на объект исследования и измерительные приборы оказывают различного рода помехи (резко
возрастает число неконтролируемых факторов), поэтому в промышленном
эксперименте особенно необходимо использовать специальные статистические методы обработки результатов.
Кроме того, на реальном действующем производстве всегда желательно
по возможно меньшему числу измерений получить наиболее достоверные результаты. Необходимо отметить, что промышленный эксперимент характеризуется весьма большими объемами данных (тысячи событий в минуту), которые необходимо сохранить и обработать, поэтому сложно представить эксперимент такого рода без применения средств автоматизации: ЭВМ и соответствующего программного обеспечения.
Контрольные вопросы
1. Что такое эксперимент? Какова его роль в инженерной практике?
2. Какие общие черты имеют научные методы исследований для изучения закономерностей различных процессов и явлений в промышленности?
3. Приведите классификации видов экспериментальных исследований,
исходя из цели проведения эксперимента и формы представления результатов, а также в зависимости от условий его реализации.
4. В чем заключаются принципиальные отличия активного эксперимента
от пассивного?
5. Поясните преимущества и недостатки лабораторного и промышленного эксперимента.
6. В чем отличие количественного и качественного экспериментов?
15
Содержание
7. Дайте определения следующим терминам: опыт, фактор, уровень фактора, отклик, функция отклика, план и планирование эксперимента.
2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ
2.1. Случайные события
2.1.1. Основные понятия
Под экспериментом (опытом, испытанием) мы будем понимать определенный набор условий, реализация которых приводит к некоторым результатам.
Результаты испытаний (экспериментов) называются событиями.
Наблюдаемые события можно разделить на три вида: достоверные, невозможные, случайные.
Достоверным называют событие, которое обязательно произойдет в результате испытания.
Пример 2.1. Бросаем игральный кубик, грани которого пронумерованы
от 1 до 6 (проводим испытание). Событие «выпало менее 7 очков» является
достоверным.
Невозможным называется событие, которое не может наступить в результате испытания.
Пример 2.2. Бросаем игральный кубик. Событие «выпало 8 очков» является невозможным.
Событие называется случайным, если оно либо произойдет, либо не произойдет в результате испытания.
Пример 2.3. Бросаем игральный кубик. Событие «выпало 5 очков» является случайным.
Если опыты проводятся большое число раз, то случайные события начинают проявлять закономерность (несмотря на свой случайный характер в одном, отдельно взятом, опыте).
Так, например, известный французский естествоиспытатель Ж. Бюффон 1
4040 раз подряд подбросил монету, при этом в 2048 случаях выпал герб. В ана-
Жорж-Луи Лекле́рк, граф де Бюффо́н (фр. Georges-Louis Leclerc, Comte de Buffon) или просто Бюффон; 7
сентября 1707, Монбар, Бургундия − 16 апреля 1788, Париж) − французский натуралист, биолог, математик, естествоиспытатель и писатель XVIII века. Высказал идею о единстве растительного и животного мира.
1
16
Содержание
логичных опытах, проделанных К. Пирсоном 2, при 24 тысячах подбрасываниях монеты выпадение герба было зафиксировано 12012 раз. Повторение подобного опыта приводит к тому же результату: при большом числе подбрасываний практически в половине случаев выпадает решка, в половине − герб.
Теоретический анализ результатов многократно повторяющихся экспериментов составляет основное содержание теории вероятностей.
Случайные события обозначаются большими латинскими буквами 𝐴𝐴, 𝐵𝐵,
𝐶𝐶 и т.д.
Два события 𝐴𝐴 и 𝐵𝐵 называются несовместными, если они не могут наступить одновременно в одном испытании.
Если события могут произойти одновременно в одном испытании, то они
называются совместными.
Пример 2.4. Бросаем игральную кость 3. Рассмотрим следующие события: 𝐴𝐴 – «выпало 2 очка», 𝐵𝐵 – «выпало 3 очка», 𝐶𝐶 – «выпало четное количество
очков». События 𝐴𝐴 и 𝐵𝐵 являются несовместными, а события 𝐴𝐴 и 𝐶𝐶 – совместны.
Говорят, что несколько событий образуют полную группу, если в результате испытания наступит хотя бы одно из них.
Численная мера возможности осуществления события 𝐴𝐴 называется его
вероятностью и обозначается 𝑃𝑃(𝐴𝐴).
2.1.2. Классическое определение вероятности
Пусть в ящике лежат 3 белых шара, 2 красных и 5 синих шаров. Случайным образом будем из ящика вынимать один шар.
Каждый из возможных результатов испытания назовем исходом. В нашем
случае возможно 10 исходов:
• вынут белый шар – 3 исхода;
• вынут красный шар – 2 исхода;
• вынут синий шар – 5 исходов.
Рассмотрим событие 𝐴𝐴 – появился цветной (красный или синий) шар.
Вероятностью 𝑃𝑃(𝐴𝐴) события 𝐴𝐴 называют отношение числа 𝑚𝑚 исходов,
в которых это событие наступает, к общему числу 𝑛𝑛 всех равновозможных
несовместных исходов, образующих полную группу, т.е.
𝑚𝑚
𝑃𝑃(𝐴𝐴) = .
(2.1)
𝑛𝑛
Карл Пи́рсон (англ. Karl (Carl) Pearson, 27 марта 1857, Лондон − 27 апреля 1936, там же) − английский математик, статистик, биолог и философ; основатель математической статистики, один из основоположников биометрики. Автор свыше 650 опубликованных научных работ.
3
Раньше игральные кубики делались из костей, поэтому до сих пор иногда их называют костями.
2
17
сти.
Содержание
Данное определение называется классическим определением вероятно-
В нашем примере с шарами число исходов, в которых событие 𝐴𝐴 наступает, 𝑚𝑚 = 2 + 5 = 7, а число всех возможных результатов испытания равно
общему количеству способов вынуть любой шар, значит 𝑛𝑛 = 10. Поэтому
7
𝑃𝑃(𝐴𝐴) = .
10
Из классического определения вероятности следует, что вероятность любого события 𝐴𝐴 удовлетворяет неравенству:
0 ≤ 𝑃𝑃(𝐴𝐴) ≤ 1.
Для достоверного события 𝑚𝑚 = 𝑛𝑛, поскольку событие обязательно наступит в любом исходе. Значит, если событие достоверно, то его вероятность
равна единице.
Вероятность невозможного события равна нулю, т.к. событие не наступит
ни в одном исходе, а значит 𝑚𝑚 = 0.
Пример 2.5. Из колоды в 36 карт вынимают одну карту. Какова вероятность появления карты бубновой масти?
Событие 𝐴𝐴 – вынута карта бубновой масти. В нашем случае 𝑛𝑛 = 36 –
число всех возможных исходов испытания (число всех способов вынуть любую карту); 𝑚𝑚 = 9 – число всех исходов, в которых наступает событие 𝐴𝐴
(число способов вынуть карту бубновой масти). Поэтому 𝑃𝑃(𝐴𝐴) =
2.1.3. Относительная частота события
9
36
1
= .
4
Относительной частотой события 𝐴𝐴 называют отношение числа 𝑚𝑚
испытаний, в которых событие наступило, к общему числу 𝑛𝑛 фактически проведенных испытаний, т.е.
𝑚𝑚
𝑊𝑊 (𝐴𝐴) = .
𝑛𝑛
Замечание. Вычисление вероятности события не требует проведения испытаний в действительности, а относительная частота вычисляется после фактического проведения испытаний.
Пример 2.6. По цели произведено 25 выстрелов. Зарегистрировано 20 попаданий. Тогда относительная частота поражения цели
20 4
= .
𝑊𝑊 (𝐴𝐴) =
25 5
Относительная частота события имеет свойство устойчивости, т.е. если
проводятся опыты, в каждом из которых велико число испытаний, то значения
18
Содержание
относительной частоты в каждом опыте колеблется около некоторого постоянного числа. Это число есть вероятность события.
Таким образом, относительную частоту события можно принять за приближенное значение вероятности.
𝑃𝑃(𝐴𝐴) ≈ 𝑊𝑊 (𝐴𝐴).
Пример 2.7. Ж. Бюффон 4040 раз подряд подбросил монету, при этом в
2048 случаях выпал герб. Значит относительная частота выпадения герба
2048
= 0,5069.
𝑊𝑊1 (𝐴𝐴) =
4040
В аналогичных опытах, проделанных К. Пирсоном, при 24 тысячах подбрасываниях монеты выпадение герба было зафиксировано 12012 раз. Отсюда
относительная частота выпадения герба
12012
= 0,5005.
𝑊𝑊2 (𝐴𝐴) =
24000
В этих двух опытах с большим числом испытаний значения относительных частот очень близки к вероятности выпадения герба, которая равна:
1
𝑃𝑃(𝐴𝐴) = = 0,5.
2
2.1.4. Статистическая вероятность
Очень часто практически невозможно представить результат испытания
в виде совокупности исходов. Еще труднее доказать равновозможность исходов.
Поэтому ввели понятие статистической вероятности, которая равна
относительной частоте или числу близкому к ней.
Для существования статистической вероятности требуется два условия:
1) возможность проводить неограниченное число испытаний, в каждом
из которых событие 𝐴𝐴 наступает либо не наступает;
2) устойчивость относительной частоты события 𝐴𝐴 в различных опытах
из большого числа испытаний.
2.2. Случайные величины
2.2.1. Понятие случайной величины
Очень часто на практике приходится иметь дело с величинами, значения
которых нельзя точно предсказать заранее. К таким величинам относятся,
например, число клиентов, обратившихся в банк в течение дня, количество попаданий в мишень при нескольких выстрелах, температура воздуха завтра в 12
часов дня, количество осадков за определенный промежуток времени и т. д.
19
Содержание
На каждую из этих величин действует большое количество мелких факторов,
которые трудно, иногда и невозможно, а иногда и не нужно учитывать по отдельности. Например, на полет снаряда, кроме основных – калибра орудия,
величины заряда и наводки — влияют скорость и направление ветра, плотность воздуха, зависящая от температуры, осадки и т. п. Поскольку сами эти
факторы не остаются неизменными, то и их влияние на определяемую в опыте
величину будет также меняться. В результате от опыта к опыту будет получаться несколько иное значение измеряемой величины.
Случайной называют величину, которая в результате испытания примет
только одно из своих возможных значений, заранее неизвестное и зависящее
от случайных причин.
Некоторые из случайных величин, например, число клиентов в банке, количество попаданий в мишень, могут принимать отдельные, изолированные
значения, которые можно перечислить.
Случайная величина, которая принимает отдельные, изолированные значения называется дискретной (краткое обозначение ДСВ).
Случайная величина, которая может принимать любые значения из некоторого числового промежутка, называется непрерывной (краткое обозначение
НСВ).
Например, температура воздуха в 12 часов дня является непрерывной случайной величиной.
Случайные величины принято обозначать большими (прописными) латинскими буквами 𝑋𝑋, 𝑌𝑌, 𝑍𝑍,…, а их возможные значения обозначают малыми
(строчными) буквами 𝑥𝑥, 𝑦𝑦, 𝑧𝑧, ….
2.2.2. Закон распределения дискретной случайной величины
Чтобы описать случайную величину, нужно не только знать, какие значения она принимает, но и как часто, т. е. с какой вероятностью, она принимает
те или иные значения.
Законом распределения ДСВ называют соответствие между ее возможными значениями и вероятностями их появления.
Закон распределения ДСВ удобно задавать таблицей. Первая строка таблицы содержит возможные значения, а вторая – их вероятности:
…
𝑋𝑋
𝑥𝑥1
𝑥𝑥2
𝑥𝑥𝑛𝑛
…
𝑃𝑃(𝑋𝑋 = 𝑥𝑥𝑖𝑖 )
𝑝𝑝1
𝑝𝑝2
𝑝𝑝𝑛𝑛
Равенство 𝑋𝑋 = 𝑥𝑥𝑖𝑖 означает, что случайная величина 𝑋𝑋 приняла значение
𝑥𝑥𝑖𝑖 .
Содержание
20
Так как в результате испытания случайная величина примет одно из своих
возможных значений, то события 𝑋𝑋 = 𝑥𝑥1 , 𝑋𝑋 = 𝑥𝑥2 , …, 𝑋𝑋 = 𝑥𝑥𝑛𝑛 образуют полную
группу, следовательно, сумма вероятностей этих событий равна единице, т.е.
𝑝𝑝1 + 𝑝𝑝2 + ⋯ + 𝑝𝑝𝑛𝑛 = 1.
Пример 2.8. Монета бросается три раза. Найти закон распределения случайной величины 𝑋𝑋 – числа выпадений орла.
При трех бросаниях орел может либо не появиться ни разу, либо появиться один раз, два или три раза. Следовательно, возможные значения случайной величины: 𝑥𝑥1 = 0, 𝑥𝑥2 = 1, 𝑥𝑥3 = 2, 𝑥𝑥4 = 3.
Найдем вероятности этих значений. Проводится три испытания (бросаем
монету три раза). В каждом испытании вероятность наступления события (вы1
1
падение орла) одинакова и равна 𝑝𝑝 = , следовательно, 𝑞𝑞 = 1 − 𝑝𝑝 = .
По формуле Бернулли получим:
2
2
1 0 1 3
1 3 1
3!
∙� � ∙� � =� � = ;
𝑃𝑃(𝑋𝑋 = 0) = 𝑃𝑃3 (0) =
=
2
2
8
0! ∙ 3! 2
1
2
3
3!
1
1
1
3
∙� � ∙� � =3∙� � = ;
𝑃𝑃(𝑋𝑋 = 1) = 𝑃𝑃3 (1) = 𝐶𝐶31 𝑝𝑝1 𝑞𝑞2 =
1! ∙ 2! 2
2
2
8
2
1
3
3!
1
1
1
3
𝑃𝑃(𝑋𝑋 = 2) = 𝑃𝑃3 (2) = 𝐶𝐶32 𝑝𝑝2 𝑞𝑞1 =
∙� � ∙� � =3∙� � = ;
2! ∙ 1! 2
2
2
8
3
0
3
1
1
1
1
3!
∙� � ∙� � =� � = .
𝑃𝑃(𝑋𝑋 = 3) = 𝑃𝑃3 (3) = 𝐶𝐶33 𝑝𝑝3 𝑞𝑞0 =
2
2
8
3! ∙ 0! 2
Отсюда искомый закон распределения:
0
1
2
3
𝑋𝑋
3/8
1/8
𝑃𝑃(𝑋𝑋 = 𝑥𝑥𝑖𝑖 ) 1/8 3/8
𝐶𝐶30 𝑝𝑝0 𝑞𝑞3
2.2.3. Математическое ожидание дискретной случайной величины
Пусть ДСВ задана своим законом распределения:
…
𝑋𝑋
𝑥𝑥1
𝑥𝑥2
𝑥𝑥𝑛𝑛
…
𝑃𝑃(𝑋𝑋 = 𝑥𝑥𝑖𝑖 )
𝑝𝑝1
𝑝𝑝2
𝑝𝑝𝑛𝑛
Математическим ожиданием дискретной случайной величины 𝑋𝑋
называют число, обозначаемое 𝑀𝑀(𝑋𝑋) и вычисляемое по формуле
𝑛𝑛
𝑀𝑀(𝑋𝑋) = 𝑥𝑥1 𝑝𝑝1 + 𝑥𝑥2 𝑝𝑝2 + ⋯ + 𝑥𝑥𝑛𝑛 𝑝𝑝𝑛𝑛 = � 𝑥𝑥𝑖𝑖 𝑝𝑝𝑖𝑖 .
𝑖𝑖=1
(2.2)
Пусть произведено 𝑘𝑘 испытаний, в которых случайная величина 𝑋𝑋 приняла 𝑚𝑚1 раз значение 𝑥𝑥1 , 𝑚𝑚2 раз значение 𝑥𝑥2 , …, 𝑚𝑚𝑛𝑛 раз значение 𝑥𝑥𝑛𝑛 , причем
𝑚𝑚1 + 𝑚𝑚2 + ⋯ + 𝑚𝑚𝑛𝑛 = 𝑘𝑘.
21
Содержание
Сумма всех значений, принятых 𝑋𝑋, равна:
𝑥𝑥1 𝑚𝑚1 + 𝑥𝑥2 𝑚𝑚2 + ⋯ + 𝑥𝑥𝑛𝑛 𝑚𝑚𝑛𝑛 .
Среднее арифметическое всех значений
𝑥𝑥1 𝑚𝑚1 + 𝑥𝑥2 𝑚𝑚2 + ⋯ + 𝑥𝑥𝑛𝑛 𝑚𝑚𝑛𝑛
𝑥𝑥 =
𝑘𝑘
или, разделив почленно числитель на знаменатель,
𝑚𝑚1
𝑚𝑚2
𝑚𝑚𝑛𝑛
𝑥𝑥 = 𝑥𝑥1
+ 𝑥𝑥2
+ ⋯ + 𝑥𝑥𝑛𝑛
.
𝑘𝑘
𝑘𝑘
𝑘𝑘
𝑚𝑚
Заметим, что 𝑖𝑖 , по определению, является относительной частотой 𝑤𝑤𝑖𝑖 значе𝑘𝑘
ния 𝑥𝑥𝑖𝑖 , следовательно,
𝑥𝑥 = 𝑥𝑥1 𝑤𝑤1 + 𝑥𝑥2 𝑤𝑤2 + ⋯ + 𝑥𝑥𝑛𝑛 𝑤𝑤𝑛𝑛 .
Известно, что если число испытаний велико, то относительная частота
приближенно равна вероятности наступления события, т.е.
𝑤𝑤𝑖𝑖 ≈ 𝑝𝑝𝑖𝑖 ,
следовательно,
𝑥𝑥 ≈ 𝑥𝑥1 𝑝𝑝1 + 𝑥𝑥2 𝑝𝑝2 + ⋯ + 𝑥𝑥𝑛𝑛 𝑝𝑝𝑛𝑛 .
Последняя сумма, по определению, есть математическое ожидание 𝑀𝑀(𝑋𝑋).
В результате мы получили, что
𝑥𝑥 ≈ 𝑀𝑀(𝑋𝑋).
То есть математическое ожидание приближенно равно среднему арифметическому наблюдаемых значений случайной величины при большом числе испытаний.
2.2.4. Дисперсия дискретной случайной величины
Отклонением случайной величины называют разность между случайной величиной и ее математическим ожиданием.
Пусть задан закон распределения дискретной случайной величины 𝑋𝑋:
…
𝑋𝑋
𝑥𝑥1
𝑥𝑥2
𝑥𝑥𝑛𝑛
…
𝑃𝑃(𝑋𝑋 = 𝑥𝑥𝑖𝑖 )
𝑝𝑝1
𝑝𝑝2
𝑝𝑝𝑛𝑛
Тогда отклонение имеет следующий закон распределения:
𝑋𝑋 − 𝑀𝑀(𝑋𝑋) 𝑥𝑥1 − 𝑀𝑀(𝑋𝑋) 𝑥𝑥2 − 𝑀𝑀(𝑋𝑋) … 𝑥𝑥𝑛𝑛 − 𝑀𝑀(𝑋𝑋)
…
𝑝𝑝𝑖𝑖
𝑝𝑝1
𝑝𝑝2
𝑝𝑝𝑛𝑛
Дисперсией дискретной случайной величины называют математическое
ожидание квадрата ее отклонения и обозначают 𝐷𝐷(𝑋𝑋), т.е.
𝐷𝐷 (𝑋𝑋) = 𝑀𝑀(𝑋𝑋 − 𝑀𝑀(𝑋𝑋))2 .
По определению вычислять дисперсию часто неудобно, поэтому используют следующую расчетную формулу:
Содержание
22
2
(2.3)
𝐷𝐷(𝑋𝑋) = 𝑀𝑀(𝑋𝑋 2 ) − �𝑀𝑀(𝑋𝑋)� ,
то есть дисперсия равна разности между математическим ожиданием квадрата
случайной величины и квадратом ее математического ожидания.
Пример 2.9. Вычислить дисперсию случайной величины 𝑋𝑋, заданной законом распределения:
2
3
5
𝑋𝑋
0,1
0,6
0,3
𝑃𝑃(𝑋𝑋 = 𝑥𝑥𝑖𝑖 )
Найдем математическое ожидание. По формуле (2.2) получим:
𝑀𝑀(𝑋𝑋) = 2 ∙ 0,1 + 3 ∙ 0,6 + 5 ∙ 0,3 = 0,2 + 1,8 + 1,5 = 3,5.
Вычислим математическое ожидание квадрата случайной величины (вероятности остаются прежними, а значения случайной величины возводим в квадрат):
𝑀𝑀(𝑋𝑋 2 ) = 22 ∙ 0,1 + 32 ∙ 0,6 + 52 ∙ 0,3 = 0,4 + 5,4 + 7,5 = 13,3.
По расчетной формуле (2.3) вычислим дисперсию:
𝐷𝐷(𝑋𝑋) = 13,3 − (3,5)2 = 13,3 − 12,25 = 1,05.
Математическое ожидание характеризует среднее значение случайной величины (оно приближенно равно среднему арифметическому наблюдаемых
значений случайной величины при большом числе испытаний). Но одного
среднего значения недостаточно, чтобы судить о значениях случайной величины. Чтобы ответить на вопрос: «в какой степени мы можем ожидать, что в
результате испытания случайная величина примет значение близкое к среднему?», мы должны знать, как рассеяны значения случайной величины относительно среднего значения. Дисперсия как раз и является мерой рассеянности
значений случайной величины вокруг ее среднего значения.
Чем меньше значение дисперсии, тем плотнее значения случайной величины сосредоточены вокруг среднего и тем больше вероятность того, что в
результате испытания случайная величина примет значение, близкое к среднему.
И наоборот, чем больше дисперсия, тем более рассеяны значения случайной величины и тем меньше вероятность того, что случайная величина в единичном испытании примет значение близкое к среднему. В этом случае среднее значение очень слабо характеризует значения случайной величины.
Средним квадратическим отклонением (или стандартным отклонением) случайной величины 𝑋𝑋 называют квадратный корень из ее дисперсии и
обозначают 𝜎𝜎(𝑋𝑋), т.е.
𝜎𝜎(𝑋𝑋) = �𝐷𝐷(𝑋𝑋).
Содержание
23
Среднее квадратическое отклонение также дает оценку рассеянности возможных значений случайной величины вокруг ее среднего значения.
При этом среднее квадратическое отклонение имеет ту же размерность,
что и сама случайная величина. Например, если 𝑋𝑋 измеряется в рублях, то
𝜎𝜎(𝑋𝑋) также выражается в рублях, а 𝐷𝐷(𝑋𝑋) в рублях квадратных (не ясная размерность).
2.2.5. Функция распределения случайной величины
Функцией распределения называют функцию 𝐹𝐹(𝑥𝑥), равную вероятности
того, что случайная величина 𝑋𝑋 примет значение меньше 𝑥𝑥, т.е.
𝐹𝐹 (𝑥𝑥) ≝ 𝑃𝑃(𝑋𝑋 < 𝑥𝑥 ).
Геометрически значение функции 𝐹𝐹 (𝑥𝑥 ) равно вероятности того, что случайная величина 𝑋𝑋 примет значение в интервале (−∞; 𝑥𝑥).
Функция распределения является одним из способов задания закона распределения дискретных и непрерывных случайных величин.
Функция распределения обладает следующими свойствами:
1. Значения функции распределения принадлежат отрезку [0;1], т.е.
0 ≤ 𝐹𝐹 (𝑥𝑥 ) ≤ 1,
∀𝑥𝑥 ∈ ℝ.
2. 𝐹𝐹(𝑥𝑥) неубывающая функция, т.е. 𝐹𝐹 (𝑥𝑥2 ) ≥ 𝐹𝐹 (𝑥𝑥1 ) при 𝑥𝑥2 > 𝑥𝑥1 .
3. Вероятность того, что случайная величина примет значение в полуинтервале (𝑎𝑎; 𝑏𝑏], равна приращению функции распределения на
этом промежутке, т.е.
𝑃𝑃(𝑎𝑎 < 𝑋𝑋 ≤ 𝑏𝑏) = 𝐹𝐹 (𝑏𝑏) − 𝐹𝐹 (𝑎𝑎).
4. Вероятность того, что непрерывная случайная величина примет
одно определенное значение, равна нулю, т.е.
𝑃𝑃(𝑋𝑋 = 𝑎𝑎) = 0.
5. Если все возможные значения случайной величины принадлежат
интервалу (𝑎𝑎; 𝑏𝑏), то
𝐹𝐹 (𝑥𝑥 ) = 0 при 𝑥𝑥 ≤ 𝑎𝑎; 𝐹𝐹 (𝑥𝑥 ) = 1 при 𝑥𝑥 ≥ 𝑏𝑏.
В общем случае lim 𝐹𝐹(𝑥𝑥) = 0; lim 𝐹𝐹(𝑥𝑥) = 1.
𝑥𝑥→−∞
𝑥𝑥→+∞
2.2.6. Функция плотности распределения
Как уже было сказано, функция распределения является универсальным
способом задания закона распределения как для дискретных, так и для непрерывных случайных величин. Но закон распределения дискретной случайной
величины удобнее задавать таблицей. Для непрерывных случайных величин
Содержание
24
также существует другой, более удобный способ задания закона распределения через функцию плотности распределения.
Пусть непрерывная случайная величина 𝑋𝑋 задана функцией распределения 𝐹𝐹(𝑥𝑥).
Производную функции 𝐹𝐹(𝑥𝑥)
𝑓𝑓(𝑥𝑥 ) = 𝐹𝐹 ′ (𝑥𝑥)
называют функцией плотности распределения вероятностей непрерывной
случайной величины 𝑋𝑋.
Функция плотности распределения вероятностей обладает следующими
свойствами:
1. Функцию распределения можно определить через функцию плотности распределения, как интеграл с переменным верхним пределом, а именно:
𝑥𝑥
𝐹𝐹 (𝑥𝑥 ) = � 𝑓𝑓(𝑡𝑡)𝑑𝑑𝑡𝑡.
−∞
2. Вероятность того, что непрерывная случайная величина 𝑋𝑋 примет
значение в интервале (𝑎𝑎; 𝑏𝑏), равна:
𝑏𝑏
𝑃𝑃(𝑎𝑎 < 𝑋𝑋 < 𝑏𝑏) = � 𝑓𝑓(𝑥𝑥 )𝑑𝑑𝑥𝑥 .
𝑎𝑎
3. Функция плотности распределения неотрицательна, т.е.
𝑓𝑓(𝑥𝑥 ) ≥ 0 ∀𝑥𝑥 ∈ ℝ.
4. Какова бы ни была функция плотности распределения,
+∞
� 𝑓𝑓(𝑥𝑥 )𝑑𝑑𝑥𝑥 = 1.
−∞
5. Если все возможные значения непрерывной случайной величины 𝑋𝑋
принадлежат интервалу (𝑎𝑎; 𝑏𝑏), то
𝑏𝑏
� 𝑓𝑓(𝑥𝑥 )𝑑𝑑𝑥𝑥 = 1.
𝑎𝑎
2.2.7. Числовые характеристики непрерывных случайных величин
Пусть непрерывная случайная величина 𝑋𝑋 задана функцией плотности
распределения 𝑓𝑓(𝑥𝑥).
Содержание
25
Математическим ожиданием непрерывной случайной величины
называют число, вычисляемое по формуле
+∞
𝑀𝑀(𝑋𝑋) = � 𝑥𝑥 ∙ 𝑓𝑓(𝑥𝑥 )𝑑𝑑𝑥𝑥 .
−∞
Если все возможные значения случайной величины принадлежат интервалу (𝑎𝑎; 𝑏𝑏), то
𝑏𝑏
𝑀𝑀(𝑋𝑋) = � 𝑥𝑥 ∙ 𝑓𝑓(𝑥𝑥 )𝑑𝑑𝑥𝑥 .
𝑎𝑎
Дисперсией непрерывной случайной величины 𝑋𝑋 называют математическое ожидание квадрата ее отклонения, т.е.
+∞
𝐷𝐷 (𝑋𝑋) = � (𝑥𝑥 − 𝑀𝑀(𝑋𝑋))2 ∙ 𝑓𝑓(𝑥𝑥 )𝑑𝑑𝑥𝑥 .
−∞
Если все возможные значения случайной величины принадлежат интервалу (𝑎𝑎; 𝑏𝑏), то
𝑏𝑏
𝐷𝐷(𝑋𝑋) = �(𝑥𝑥 − 𝑀𝑀(𝑋𝑋))2 ∙ 𝑓𝑓(𝑥𝑥)𝑑𝑑𝑥𝑥 .
𝑎𝑎
Для нахождения дисперсии используют расчетную формулу:
2
+∞
2
𝐷𝐷(𝑋𝑋) = 𝑀𝑀(𝑋𝑋 2 ) − �𝑀𝑀(𝑋𝑋)� = � 𝑥𝑥 2 𝑓𝑓(𝑥𝑥 )𝑑𝑑𝑥𝑥 − �𝑀𝑀(𝑋𝑋)� .
−∞
(2.4)
В случае, если все возможные значения случайной величины принадлежат интервалу (𝑎𝑎; 𝑏𝑏), то
𝑏𝑏
2
𝐷𝐷(𝑋𝑋) = � 𝑥𝑥 2 𝑓𝑓(𝑥𝑥)𝑑𝑑𝑥𝑥 − �𝑀𝑀(𝑋𝑋)� .
𝑎𝑎
(2.5)
Пример 2.10. Вычислить дисперсию непрерывной случайной величины,
заданной функцией распределения:
0, при 𝑥𝑥 ≤ 0;
𝑥𝑥
𝐹𝐹 (𝑥𝑥 ) = � , при 0 < 𝑥𝑥 ≤ 4;
4
1, при 𝑥𝑥 > 4.
Сначала найдем функцию плотности распределения:
Содержание
26
0, при 𝑥𝑥 ≤ 0;
1
𝑓𝑓(𝑥𝑥) = 𝐹𝐹′(𝑥𝑥) = � , при 0 < 𝑥𝑥 ≤ 4;
4
0, при 𝑥𝑥 > 4.
Так как функция плотности распределения отлична от нуля только на полуинтервале (0; 4], то все свои значения случайная величина принимает на отрезке [0; 4].
Найдем математическое ожидание:
𝑏𝑏
4
4
1
1 𝑥𝑥 2
1 42
1 02
𝑀𝑀(𝑋𝑋) = � 𝑥𝑥 ∙ 𝑓𝑓(𝑥𝑥 )𝑑𝑑𝑥𝑥 = � 𝑥𝑥 ∙ 𝑑𝑑𝑥𝑥 = � ∙ �� = � ∙ � − � ∙ � = 2.
4
4 2 0
4 2
4 2
𝑎𝑎
0
По формуле (2.5) вычислим дисперсию:
𝑏𝑏
4
1
2
𝐷𝐷(𝑋𝑋) = � 𝑥𝑥 2 𝑓𝑓(𝑥𝑥 )𝑑𝑑𝑥𝑥 − �𝑀𝑀(𝑋𝑋)� = � 𝑥𝑥 2 ∙ 𝑑𝑑𝑥𝑥 − 22 =
4
3
𝑎𝑎
4
3
0
1 𝑥𝑥
1 4
16
16 12 4
= � ∙ �� − 4 = � ∙ � − 4 =
−4=
−
= .
4 3 0
4 3
3
3
3
3
Средним квадратическим отклонением непрерывной случайной величины 𝑋𝑋 называют квадратный корень из ее дисперсии и обозначают 𝜎𝜎(𝑋𝑋), т.е.
𝜎𝜎(𝑋𝑋) = �𝐷𝐷(𝑋𝑋).
2.2.8. Нормальное распределение
При решении целого ряда теоретических и прикладных вопросов теории
вероятностей и математической статистики возникает задача нахождения закона распределения случайной величины. Потому что, зная закон распределения случайной величины, мы, с помощью методов теории вероятностей, можем получить достаточно исчерпывающую информацию об этой величине,
т.е. можем прогнозировать (с определенной вероятностью) поведение этой
случайной величины.
В теории вероятностей и математической статистике важнейшую роль играет так называемое нормальное распределение, или распределение Гаусса 4,
Иога́нн Карл Фри́дрих Га́усс (нем. Johann Carl Friedrich Gauß; 30 апреля 1777, Брауншвейг — 23 февраля 1855, Гёттинген) — немецкий математик, механик, физик, астроном и геодезист. Считается одним из
величайших математиков всех времён, «королём математиков». Лауреат медали Копли (1838), иностранный
член Шведской (1821) и Российской (1824) академий наук, Лондонского Королевского общества.
С именем Гаусса связаны фундаментальные исследования почти во всех основных областях математики:
в алгебре, теории чисел, дифференциальной и неевклидовой геометрии, математическом анализе, теории
функций комплексного переменного, теории вероятностей, а также в аналитической и небесной механике, астрономии, физике и геодезии.
4
Содержание
27
поскольку большинство случайных величин имеет это распределение. Нормальное распределение почти всегда имеет место, когда наблюдаемые случайные величины формируются под влиянием большого числа случайных факторов, ни один из которых существенно не превосходит остальные.
Нормальным называют распределение вероятностей непрерывной случайной величины, которое описывается функцией плотности распределения
следующего вида:
1
2
2
𝑒𝑒 −(𝑥𝑥−𝑎𝑎) ⁄(2𝜎𝜎 ) ,
𝑓𝑓(𝑥𝑥) =
𝜎𝜎√2𝜋𝜋
здесь 𝑎𝑎 = 𝑀𝑀(𝑋𝑋) – математическое ожидание, 𝜎𝜎 = 𝜎𝜎(𝑋𝑋) – среднее квадратическое отклонение.
Постоянные 𝑎𝑎 и 𝜎𝜎 называют параметрами распределения.
График функции плотности нормального распределения называют нормальной кривой или кривой Гаусса (рисунок 2.1).
1
𝑦𝑦
𝜎𝜎√2𝜋𝜋
𝑂𝑂
𝑓𝑓(𝑥𝑥) =
𝑎𝑎 − 𝜎𝜎 𝑎𝑎
𝑎𝑎 + 𝜎𝜎
Рисунок 2.1 – Нормальная кривая
1
𝜎𝜎√2𝜋𝜋
𝑒𝑒 −(𝑥𝑥−𝑎𝑎)
2 ��2𝜎𝜎 2 �
𝑥𝑥
Функция плотности нормального распределения достигает своего максимума в точке 𝑥𝑥 = 𝑎𝑎, причем
1
𝑓𝑓max = 𝑓𝑓(𝑎𝑎) =
.
𝜎𝜎√2𝜋𝜋
Точки 𝑥𝑥 = 𝑎𝑎 + 𝜎𝜎; 𝑥𝑥 = 𝑎𝑎 − 𝜎𝜎 являются абсциссами точек перегиба кривой
Гаусса.
Изменение величины параметра 𝑎𝑎 (математического ожидания) не меняет
форму нормальной кривой, а приводит к ее сдвигу вдоль оси 𝑂𝑂𝑥𝑥 вправо, если
𝑎𝑎 возрастает, и влево, если 𝑎𝑎 убывает (рисунок 2.2).
Содержание
28
𝑦𝑦
𝑎𝑎1 < 𝑎𝑎1
𝑎𝑎1
𝑎𝑎2
𝑥𝑥
𝑂𝑂
Рисунок 2.2 – Влияние параметра 𝑎𝑎 на вид кривой Гаусса
Так как 𝑓𝑓max =
1
𝜎𝜎 √2𝜋𝜋
, то при возрастании параметра 𝜎𝜎 максимум функции
𝑓𝑓max убывает, а при убывании 𝜎𝜎 максимум функции 𝑓𝑓max возрастает (рисунок
2.3).
𝑦𝑦
𝜎𝜎 = 1
𝜎𝜎 = 3
𝑥𝑥
𝑂𝑂
Рисунок 2.3 – Влияние параметра 𝜎𝜎 на форму кривой Гаусса
При любых значениях параметров распределения 𝑎𝑎 и 𝜎𝜎 площадь фигуры,
ограниченной нормальной кривой и осью 𝑂𝑂𝑥𝑥, всегда постоянна и равна единице (это следует из 4-го свойства функции плотности распределения).
Приведем основные свойства нормального распределения.
1. Вероятность того, что нормальная случайная величина 𝑋𝑋 примет
значение в интервале (𝛼𝛼; 𝛽𝛽), равна:
𝛽𝛽 − 𝑎𝑎
𝛼𝛼 − 𝑎𝑎
𝑃𝑃(𝛼𝛼 < 𝑋𝑋 < 𝛽𝛽) = Φ �
�− Φ�
�,
(2.6)
𝜎𝜎
𝜎𝜎
2
𝑥𝑥
1
здесь Φ(𝑥𝑥) =
∫0 𝑒𝑒 −𝑡𝑡 ⁄2 𝑑𝑑𝑡𝑡 − функция Лапласа5.
√2𝜋𝜋
Пьер-Симо́н, маркиз де Лапла́с (фр. Pierre-Simon de Laplace; 23 марта 1749 — 5 марта 1827) — французский математик, механик, физик и астроном; известен работами в области небесной механики, дифференциальных уравнений, один из создателей теории вероятностей. Заслуги Лапласа в области чистой
и прикладной математики и особенно в астрономии громадны: он усовершенствовал почти все разделы
этих наук.
Лаплас состоял членом шести академий наук и королевских обществ, в том числе Петербургской академии (1802), и членом Французского географического общества. Его имя внесено в список величайших
учёных Франции, помещённый на первом этаже Эйфелевой башни.
5
29
2
Содержание
Интеграл ∫ 𝑒𝑒 −𝑡𝑡 ⁄2 𝑑𝑑𝑡𝑡 не выражается через элементарные функции, поэтому при решении задач используют таблицу функции
Лапласа. В конце любого учебника по теории вероятностей приводится таблица значений функции Лапласа для 𝑥𝑥 ∈ [0; 5) (приложение 1).
Если 𝑥𝑥 < 0, то используют свойство нечетности функции Φ(𝑥𝑥 ),
т.е. Φ(−𝑥𝑥 ) = −Φ(𝑥𝑥). Если 𝑥𝑥 ≥ 5, то полагают Φ(𝑥𝑥 ) = 0,5.
2. Вероятность того, что абсолютная величина отклонения нормально
распределенной случайной величины меньше положительного
числа 𝜀𝜀, равна:
𝜀𝜀
𝑃𝑃(|𝑋𝑋 − 𝑎𝑎| < 𝜀𝜀 ) = 2Φ � �.
𝜎𝜎
3. Третье свойство носит название «правило трех сигма».
Рассмотрим следующую вероятность:
3𝜎𝜎
𝑃𝑃(|𝑋𝑋 − 𝑎𝑎| < 3𝜎𝜎) = 2Φ � � = 2Φ(3) =
𝜎𝜎
(по таблице функции Лапласа определяем, что Φ(3) = 0,49865)
= 2 ∙ 0,49865 = 0,9973.
То есть, вероятность того, что абсолютная величина отклонения
нормально распределенной случайной величины будет меньше трех
средних квадратических отклонений, равна 0,9973.
Отсюда следует правило трех сигма: если случайная величина
распределена нормально, то можно быть практически уверенным (с
вероятностью 0,9973) что в единичном испытании она примет значение в интервале (𝑎𝑎 − 3𝜎𝜎; 𝑎𝑎 + 3𝜎𝜎).
С другими, часто используемыми распределениями, можно ознакомиться
в приложении 4.
Не вдаваясь в подробную математическую теорию, отметим, что, согласно центральной предельной теореме математической статистики, «при
определенных условиях распределение нормированной суммы 𝑛𝑛 независимых
случайных величин, распределенных по произвольному закону, стремится к
нормальному, когда 𝑛𝑛 стремится к бесконечности». Необходимые условия,
при которых эта теорема оказывается справедливой, состоят в том, что различные случайные величины должны иметь конечные дисперсии и дисперсия любой случайной величины не должна быть слишком большой по сравнению с
дисперсиями других.
30
Содержание
При обработке экспериментальных данных эта теорема имеет очень большое значение, поскольку отклик становится случайной величиной в результате влияния неконтролируемых факторов, число которых скорее всего стремится к бесконечности. Кроме того, если при проведении опытов все наиболее
существенные факторы контролируются, то воздействие на отклик каждого из
неконтролируемых факторов не должно быть слишком большим по сравнению с остальными неконтролируемыми факторами. Другими словами, та дисперсия (рассеивание) отклика, которую вызывает какой-либо из неконтролируемых факторов, не должна сильно отличаться от дисперсий, связанных с
влиянием остальных неконтролируемых факторов. В противном случае фактор, дисперсия от которого существенно отличается от других, обязательно
должен быть переведен в разряд контролируемых.
Следовательно, если при планировании эксперимента учтены все наиболее существенные факторы и затем, при проведении опытов, они контролируются, то при обработке экспериментальных данных можно предполагать, что
отклик не должен противоречить нормальному распределению.
Как правило, нормальному закону подчиняются результаты испытаний
стали на прочность, производительность многих металлургических агрегатов,
составы сырья, топлива, сплавов, массы слитков, отлитых в однотипные изложницы, случайные ошибки измерений и т.п., поэтому при обработке результатов наблюдений исследователи, прежде всего, предполагают именно нормальное распределение отклика.
Большинство других распределений, которые используются в математической статистике (Стьюдента, Фишера, Пирсона, Кохрена, а также распределения, по которым составлены различные критериальные таблицы), получены
на основе нормального распределения.
Нельзя, однако, абсолютизировать значение нормального распределения.
Не все случайные величины распределены по нормальному закону. Тем не менее на практике, если явление подвержено действию многих случайных факторов, их суммарное воздействие вполне оправданно можно описать с помощью нормального закона.
В ряде случаев рассматривается не сама случайная величина 𝑋𝑋, а
ее отклонение от математического ожидания:
𝑌𝑌 = 𝑋𝑋 − 𝑀𝑀(𝑋𝑋).
Случайная величина Y называется центрированной.
Отношение случайной величины 𝑋𝑋 к ее среднему квадратичному отклонению
Содержание
31
𝑋𝑋
𝜎𝜎(𝑋𝑋)
называется нормированной случайной величиной.
Таким образом, центрированная случайная величина − разность между
данной случайной величиной и ее математическим ожиданием, а нормированная случайная величина − отношение данной случайной величины к ее
среднему квадратичному отклонению.
Очевидно, что математическое ожидание центрированной случайной величины равно нулю, 𝑀𝑀(𝑌𝑌) = 0, а среднее квадратическое отклонение нормированной случайной величины равна единице, 𝜎𝜎(𝑉𝑉 ) = 1.
Центрированная и нормированная случайная величина называется приведенной случайной величиной:
𝑋𝑋 − 𝑀𝑀(𝑋𝑋)
.
𝑍𝑍 =
𝜎𝜎(𝑋𝑋)
Математическое ожидание и среднее квадратическое отклонение приведенной случайной величины 𝑍𝑍 соответственно равны нулю, 𝑀𝑀(𝑍𝑍) = 0, и единице, 𝜎𝜎(𝑍𝑍) = 1.
Нормальное распределение с параметрами 𝑀𝑀(𝑍𝑍) = 0 и 𝜎𝜎(𝑍𝑍) = 1 называется стандартным (нормированным).
Функция распределения нормального стандартного распределения имеет
вид:
𝑉𝑉 =
1
𝑧𝑧
−
𝑧𝑧2
2
� 𝑒𝑒 𝑑𝑑𝑧𝑧,
√2𝜋𝜋
−∞
а функция плотности распределения:
1 −𝑧𝑧2
(
)
𝑒𝑒 2 .
𝑓𝑓 𝑧𝑧 =
2𝜋𝜋
√
𝐹𝐹 (𝑧𝑧) =
Контрольные вопросы и задания
В этом разделе предлагаются вопросы для самоконтроля и укрепления полученных знаний. Попытайтесь самостоятельно ответить на вопросы и выполнить задания.
1. Дайте определения математического ожидания и дисперсии дискретной случайной величины.
2. Что характеризуют математическое ожидание и дисперсия?
3. Что такое функция распределения?
4. Дайте определение функции плотности распределения вероятностей непрерывной случайной величины.
5. Сформулируйте определения математического ожидания и дисперсии непрерывной случайной величины.
6. Вычислить среднее квадратическое отклонение дискретной случайной величины, заданной законом распределения:
32
Содержание
2
4
8
𝑥𝑥𝑖𝑖
0,1 0,5 0,4
𝑝𝑝𝑖𝑖
7. Вычислить среднее квадратическое отклонение непрерывной случайной величины, заданной функцией распределения:
0, при 𝑥𝑥 ≤ 0;
𝐹𝐹 (𝑥𝑥) = �𝑥𝑥 3 , при 0 < 𝑥𝑥 ≤ 1;
1, при 𝑥𝑥 > 1.
𝟑𝟑
Ответы. 6) 2,2. 7) � .
𝟑𝟑𝟑𝟑
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ
ДАННЫХ
3.1. Выборочный метод
3.1.1. Задачи математической статистики
В результате наблюдений случайных явлений получают статистические
данные или статистический материал.
Поэтому первая задача математической статистики – создание методов
обработки и анализа статистического материала.
Если мы знаем закон распределения случайной величины, то методы теории вероятностей позволяют получить исчерпывающую информацию об этой
величине. Поэтому вторая задача математической статистики – на основании
статистических данных определить закон распределения рассматриваемой
случайной величины, а также оценить значения параметров распределения.
3.1.2. Выборка
Пусть требуется изучить совокупность однородных объектов относительно некоторого признака, характеризующего эти объекты. На практике исследование каждого объекта, как правило, невозможно.
Если совокупность содержит очень большое количество объектов, то провести сплошное обследование физически невозможно. Например, определить
урожайность сорта пшеницы, взвешивая зерна каждого растения на поле – физически невыполнимая задача. А если обследование связано с уничтожением
объекта, то проводить сплошное обследование не имеет смысла. Например,
33
Содержание
каждая крупная автомобильная компания проводит краш-тесты выпускаемых
автомобилей. Разбивать на тесте всю выпускаемую продукцию экономически
бессмысленно.
Поэтому из всей совокупности случайно отбирают ограниченное число
объектов и исследуют их.
Выборочной совокупностью или выборкой называется совокупность
случайно отобранных объектов.
Генеральной совокупностью называется совокупность объектов, из которых производится выборка.
Число объектов в генеральной совокупности и выборке называют их объемом.
Выборка называется повторной, если отобранный объект возвращается
обратно в генеральную совокупность перед отбором следующего. Бесповторной называют выборку, в которой объект не возвращается в генеральную совокупность.
Главная цель выборочного метода – по данным исследования выборки
возможно точнее охарактеризовать всю генеральную совокупность. Для этого
нужно, чтобы объекты выборки правильно представляли генеральную совокупность, т.е. выборка должна сохранять пропорции генеральной совокупности. В этом случае говорят, что выборка должна быть репрезентативной.
3.1.3. Статистическое распределение выборки (эмпирический
закон распределения)
Пусть из генеральной совокупности произведена выборка объема 𝑛𝑛. В результате обследования элементов выборки относительно количественного
признака 𝑋𝑋, значение признака 𝑥𝑥1 наблюдалось 𝑛𝑛1 раз; значение 𝑥𝑥2 − наблюдалось 𝑛𝑛2 раз; … ; 𝑥𝑥𝑘𝑘 − наблюдалось 𝑛𝑛𝑘𝑘 раз, причем ∑𝑘𝑘𝑖𝑖=1 𝑛𝑛𝑖𝑖 = 𝑛𝑛.
Наблюдаемые значения признака 𝑥𝑥𝑖𝑖 называют вариантами (𝑥𝑥1 – первая
варианта, 𝑥𝑥2 – вторая варианта и т.д.). Полученный таким образом ряд варьирующих величин можно упорядочить – расположить значения признака 𝑥𝑥𝑖𝑖 в
порядке возрастания. Такое упорядочение ряда называют ранжированием.
Последовательность вариант, записанных в возрастающем порядке называют вариационным рядом.
Числа 𝑛𝑛𝑖𝑖 , которые характеризуют, сколько раз повторяется каждое значе𝑛𝑛
ние признака, называются частотами, а их отношение к объему выборки 𝑖𝑖 =
𝑤𝑤𝑖𝑖 – относительными частотами.
𝑛𝑛
34
Содержание
Статистическим распределением выборки или эмпирическим 6 законом распределения называют перечень вариант и соответствующих им частот
(или относительных частот).
Статистическое распределение выборки записывают в виде таблицы (таблица 3.1).
Таблица 3.1 – Статистическое распределение выборки
…
𝑥𝑥1
𝑥𝑥2
𝑥𝑥𝑘𝑘
…
𝑛𝑛1
𝑛𝑛2
𝑛𝑛𝑘𝑘
Статистическое распределение выборки таблицы 3.1 иногда называют
дискретным рядом распределения.
Если количественный признак 𝑋𝑋 является непрерывной случайной величиной, а объем выборки не менее 20 (𝑛𝑛 ≥ 20), то эмпирический закон распределения записывают в виде последовательности интервалов и соответствующих им частот, где частота интервала равна сумме частот вариант, попавших
в этот интервал.
Пример 3.1. Предположим, что некоторая организация регистрировала
расход топлива служебного автомобиля в конце каждой рабочей недели. В результате измерений в течении 50 недель были получены следующие данные (в
литрах):
90
76
79
45
72
70
79
77
92
89
109
82
84
59
68
67
78
76
91
85
99
80
84
60
80
100
83
88
76
93
100
68
108
63
81
103
92
89
79
90
115
69
83
78
84
69
93
68
73
79
Разобьем диапазон изменения величины 𝑋𝑋 на 𝑘𝑘 интервалов. Строгого
определения количества интервалов нет, однако, число интервалов должно
быть не менее 5 и не более 20.
Иногда рекомендуют брать количество интервалов, округляя до целого
число
𝑘𝑘 ≈ 1 + 3,2 ∙ lg 𝑛𝑛,
(3.1)
где 𝑛𝑛 – объем выборки.
Длину каждого интервала ℎ определяют по формуле (с точностью значений элементов выборки):
𝑥𝑥max − 𝑥𝑥min
ℎ≈
.
(3.2)
𝑘𝑘
Закон называется эмпирическим потому, что он получен эмпирически, т.е. в результате опыта (обследования объектов выборки).
6
35
Содержание
Округление ведется в сторону увеличения. Здесь 𝑥𝑥max , 𝑥𝑥min – соответственно
наибольшее и наименьшее значения признака выборки.
Разность
𝑅𝑅 = 𝑥𝑥max − 𝑥𝑥min
называют размахом варьирования признака выборки.
В нашем случае определим количество интервалов по формуле (3.1):
1 + 3,2 ∙ lg 𝑛𝑛 = 1 + 3,2 ∙ lg 50 = 1 + 3,2 ∙ 1,69897 = 6,4367.
Значит число интервалов можно взять равным 6 или 7.
Размах варьирования 𝑅𝑅 = 𝑥𝑥max − 𝑥𝑥min = 115 − 45 = 70. Если возьмем
количество интервалов 𝑘𝑘 = 7, то
𝑥𝑥max − 𝑥𝑥min 70
=
= 10
ℎ=
7
𝑘𝑘
будет целым числом (что удобно для расчетов).
Составим статистическое распределение выборки (таблица 3.2):
(если варианта совпадает с границей интервала, то, для определенности, будем
включать ее в интервал, для которого она является началом)
Таблица 3.2 – Статистическое распределение выборки по данным измерений
расхода топлива
№
Интервалы Частоты интервалов Относительные частоты
𝑛𝑛𝑖𝑖
𝑛𝑛𝑖𝑖
𝑤𝑤𝑖𝑖 =
𝑛𝑛
1
[45;55)
1
0,02
2
[55;65)
3
0,06
3
[65;75)
9
0,18
4
[75;85)
19
0,38
5
[85:95)
11
0,22
6
[95;105)
4
0,08
7
[105;115]
3
0,06
7
7
∑
� 𝑛𝑛𝑖𝑖 = 𝑛𝑛 = 50
𝑖𝑖=1
� 𝑤𝑤𝑖𝑖 = 1
𝑖𝑖=1
Статистическое распределение выборки таблицы 3.2 иногда называют
интервальным рядом распределения.
3.1.4. Полигон и гистограмма. Статистическая кривая распределения
Любой человек лучше ориентируется в графически представленных данных, чем в числах. Поэтому для наглядного изображения статистического распределения пользуются его графическим изображением.
Содержание
36
Если количественный признак 𝑋𝑋 выборки является дискретной случайной
величиной, то статистическое распределение выборочной совокупности изображается полигоном.
Пусть известен эмпирический закон распределения выборки:
…
𝑥𝑥1
𝑥𝑥2
𝑥𝑥𝑘𝑘
…
𝑛𝑛1
𝑛𝑛2
𝑛𝑛𝑘𝑘
Полигоном частот называют ломаную, отрезки которой соединяют
точки с координатами (𝑥𝑥1 ; 𝑛𝑛1 ), (𝑥𝑥2 ; 𝑛𝑛2 ); … ; (𝑥𝑥𝑘𝑘 ; 𝑛𝑛𝑘𝑘 ).
Полигоном относительных частот называют ломаную, отрезки которой соединяют точки с координатами (𝑥𝑥1 ; 𝑤𝑤1 ), (𝑥𝑥2 ; 𝑤𝑤2 ); …; (𝑥𝑥𝑘𝑘 ; 𝑤𝑤𝑘𝑘 ).
Пример 3.2. Дано статистическое распределение выборки:
1
3
5
7
𝑋𝑋
0,1
0,2
0,4
0,3
𝑤𝑤
Полигон относительных частот изображен на рисунке 3.1.
Статистическое распределение непрерывной случайной величины изображают гистограммой.
Пусть известно статистическое распределение выборки непрерывной случайной величины, состоящее из последовательности интервалов длины ℎ и
соответствующих им частот 𝑛𝑛𝑖𝑖 .
Гистограммой частот называют ступенчатую фигуру, состоящую из
𝑛𝑛
прямоугольников с основаниями длины ℎ и высотами 𝑖𝑖 .
Отношение
𝑛𝑛𝑖𝑖
ℎ
называют плотностью частоты 𝑛𝑛𝑖𝑖 .
ℎ
Пример 3.3. Гистограмма частот для статистического распределения выборки таблицы 3.2 изображена на рисунке 3.2.
𝑛𝑛𝑖𝑖
ℎ
𝑤𝑤
2
1,6
1,2
0,8
0,4
0,4
0,3
0,2
0,1
1
3
5
7
𝑥𝑥
Рисунок 3.1 – Полигон относительных
частот
45
55
65
75 85 95 105 115
𝑥𝑥
Рисунок 3.2 – Гистограмма частот и
вариационная кривая
Содержание
37
Площадь 𝑖𝑖-го прямоугольника равна ℎ ∙
𝑛𝑛𝑖𝑖
ℎ
= 𝑛𝑛𝑖𝑖 (частота 𝑖𝑖-го интервала).
Поэтому площадь гистограммы частот равна сумме всех частот, т.е. объему
выборки.
Гистограммой относительных частот называют ступенчатую фи𝑤𝑤
гуру, состоящую из прямоугольников с основаниями длины ℎ и высотами 𝑖𝑖.
Отношение
𝑤𝑤𝑖𝑖
ℎ
называют плотностью относительной частоты 𝑤𝑤𝑖𝑖 .
ℎ
Площадь 𝑖𝑖-го прямоугольника гистограммы относительных частот равна
ℎ ∙ = 𝑤𝑤𝑖𝑖 (относительная частота 𝑖𝑖-го интервала). Поэтому площадь гисто𝑤𝑤𝑖𝑖
ℎ
граммы относительных частот равна сумме всех относительных частот, т.е.
равна единице.
Если середины верхних сторон прямоугольников соединить гладкой линией, то полученную кривую называют статистической кривой распределения
или вариационной кривой (рисунок 3.2).
3.2. Статистические оценки параметров распределения
Под статистической оценкой параметра будем понимать его приближенное значение, вычисляемое по определенному правилу.
3.2.1. Оценка среднего значения генеральной совокупности
Пусть для изучения генеральной совокупности относительно дискретного
количественного признака 𝑋𝑋 извлечена выборка объема 𝑛𝑛 и составлено статистическое распределение выборки
Содержание
38
…
𝑥𝑥1
𝑥𝑥2
𝑥𝑥𝑘𝑘
…
𝑛𝑛1
𝑛𝑛2
𝑛𝑛𝑘𝑘 .
Выборочной средней называют среднее арифметическое значений признака выборки и обозначают 𝑥𝑥, т.е.
∑𝑘𝑘𝑖𝑖=1 𝑛𝑛𝑖𝑖 𝑥𝑥𝑖𝑖
,
(3.3)
𝑥𝑥 =
𝑛𝑛
здесь ∑𝑘𝑘𝑖𝑖=1 𝑛𝑛𝑖𝑖 = 𝑛𝑛 – объем выборки.
Если все значения признака выборки 𝑥𝑥1 , 𝑥𝑥2 , …, 𝑥𝑥𝑛𝑛 различны, то
∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖
𝑥𝑥 =
.
(3.4)
𝑛𝑛
Если количественный признак 𝑋𝑋 является непрерывной случайной величиной и по выборке объема 𝑛𝑛 составлено статистическое распределение выборки, состоящее из последовательности интервалов длины ℎ и соответствующих им частот 𝑛𝑛𝑖𝑖
…
(𝑥𝑥0 ; 𝑥𝑥1 ) (𝑥𝑥1 ; 𝑥𝑥2 )
(𝑥𝑥𝑘𝑘−1 ; 𝑥𝑥𝑘𝑘 )
…
,
𝑛𝑛1
𝑛𝑛2
𝑛𝑛𝑘𝑘
то выборочную среднюю так же вычисляют по формуле (3.3). Здесь в качестве
значений признака 𝑥𝑥1 , 𝑥𝑥2 , …, 𝑥𝑥𝑘𝑘 берут середины интервалов.
Середина 𝑖𝑖-го интервала вычисляется по формуле
𝑥𝑥𝑖𝑖−1 + 𝑥𝑥𝑖𝑖
.
(3.5)
𝑥𝑥𝑖𝑖∗ =
2
Если среднее значение генеральной совокупности неизвестно, то в качестве его оценки (приближенного значения) принимают выборочную среднюю
𝑥𝑥.
Пример 3.4. В таблице 3.2 примера 3.1 приведено статистическое распределение выборки по данным 50 измерений расхода топлива.
Для нахождения выборочной средней найдем, по формуле (3.5), середины
интервалов:
𝑥𝑥1∗ =
𝑥𝑥4∗ =
𝑥𝑥7∗ =
𝑥𝑥0 +𝑥𝑥1
2
𝑥𝑥3 +𝑥𝑥5
2
𝑥𝑥6 +𝑥𝑥7
2
=
=
=
45+55
2
75+85
= 50; 𝑥𝑥2∗ =
= 80; 𝑥𝑥5∗ =
2
105+115
2
= 110.
𝑥𝑥1 +𝑥𝑥2
2
𝑥𝑥4 +𝑥𝑥5
2
=
=
55+65
2
85+95
2
= 60; 𝑥𝑥3∗ =
= 90; 𝑥𝑥6∗ =
𝑥𝑥2 +𝑥𝑥3
2
𝑥𝑥5 +𝑥𝑥6
2
=
=
65+75
2
95+105
2
= 70;
= 100;
Интервальный ряд распределения таблицы 3.2 заменим следующим дискретным рядом:
50
60
70
80
90
100
110
𝑥𝑥𝑖𝑖∗
1
3
9
19
11
4
3
.
𝑛𝑛𝑖𝑖
39
Содержание
Найдем выборочную среднюю по формуле (3.3):
𝑥𝑥 =
∑𝑘𝑘𝑖𝑖=1 𝑛𝑛𝑖𝑖 𝑥𝑥𝑖𝑖 1 ∙ 50 + 3 ∙ 60 + 9 ∙ 70 + 19 ∙ 80 + 11 ∙ 90 + 4 ∙ 100 + 3 ∙ 110
=
=
50
𝑛𝑛
=
50 + 180 + 630 + 1520 + 990 + 400 + 330 4100
=
= 82.
50
50
3.2.2. Оценка дисперсии генеральной совокупности
Пусть для изучения генеральной совокупности относительно дискретного
количественного признака 𝑋𝑋 извлечена выборка объема 𝑛𝑛 и составлено статистическое распределение выборки
…
𝑥𝑥1
𝑥𝑥2
𝑥𝑥𝑘𝑘
…
𝑛𝑛1
𝑛𝑛2
𝑛𝑛𝑘𝑘 .
Выборочной дисперсией называют число, обозначаемое 𝐷𝐷 и вычисляемое по формуле
∑𝑘𝑘𝑖𝑖=1 𝑛𝑛𝑖𝑖 (𝑥𝑥𝑖𝑖 − 𝑥𝑥 )2
𝐷𝐷 =
.
(3.6)
𝑛𝑛
Здесь 𝑥𝑥 – выборочная средняя.
Если все значения признака выборки 𝑥𝑥1 , 𝑥𝑥2 , …, 𝑥𝑥𝑛𝑛 различны, то
∑𝑛𝑛𝑖𝑖=1(𝑥𝑥𝑖𝑖 − 𝑥𝑥 )2
𝐷𝐷 =
.
(3.7)
𝑛𝑛
Как правило, по определению, т.е. по формулам (3.6)−(3.7), дисперсию не
вычисляют, а используют удобную для расчетов формулу:
𝐷𝐷 = 𝑥𝑥 2 − (𝑥𝑥 )2 .
(3.8)
Здесь 𝑥𝑥 2 – среднее арифметическое квадратов значений признака выборки, т.е.
∑𝑘𝑘𝑖𝑖=1 𝑛𝑛𝑖𝑖 (𝑥𝑥𝑖𝑖 )2
2
.
(3.9)
𝑥𝑥 =
𝑛𝑛
Если количественный признак 𝑋𝑋 выборки является непрерывной случайной величиной, то интервальный ряд распределения заменяют дискретным рядом, где в качестве значений признака 𝑥𝑥1 , 𝑥𝑥2 , …, 𝑥𝑥𝑘𝑘 берут середины интервалов. Затем по расчетной формуле (3.8) вычисляют дисперсию.
Если дисперсия генеральной совокупности неизвестна, то в качестве ее
оценки (приближенного значения) используют исправленную выборочную
дисперсию, обозначаемую 𝑠𝑠 2 и вычисляемую по формуле
𝑛𝑛
𝑠𝑠 2 =
𝐷𝐷.
(3.10)
𝑛𝑛 − 1
Размерность исправленной выборочной дисперсии равна квадрату размерности изучаемого признака, что не совсем удобно. Поэтому используют
40
Содержание
другую характеристику, имеющую размерность варьирующей величины и
называемую исправленным средним квадратическим отклонением. Его получают извлечением квадратного корня из исправленной выборочной дисперсии:
(3.11)
𝑠𝑠 = �𝑠𝑠 2 .
Для оценки неизвестного среднего квадратического отклонения генеральной совокупности используют исправленное среднее квадратическое отклонение выборки.
Исправленное среднее квадратическое отклонение выборки является мерой разброса наблюдаемых значений признака 𝑥𝑥1 , 𝑥𝑥2 , …, 𝑥𝑥𝑘𝑘 вокруг выборочной средней 𝑥𝑥.
Выборочная средняя и исправленное среднее квадратическое отклонение
являются основными статистическими характеристиками, при помощи которых получают закон распределения генеральной совокупности.
Пример 3.5. В таблице 3.2 примера 3.1 приведено статистическое распределение выборки по данным 50 измерений расхода топлива.
В примере 3.4 интервальный ряд распределения таблицы 3.2 заменили
дискретным рядом распределения:
50
60
70
80
90
100
110
𝑥𝑥𝑖𝑖∗
1
3
9
19
11
4
3
,
𝑛𝑛𝑖𝑖
где 𝑥𝑥𝑖𝑖∗ − середины интервалов. Так же в примере 3.4 была вычислена выборочная средняя 𝑥𝑥 = 82.
Выборочную дисперсию вычислим по расчетной формуле (3.8). Выборочная средняя уже известна, осталось вычислить 𝑥𝑥 2 . По формуле (3.9) получим:
𝑥𝑥 2
=
1 ∙ 502 + 3 ∙ 602 + 9 ∙ 702 + 19 ∙ 802 + 11 ∙ 902 + 4 ∙ 1002 + 3 ∙ 1102
=
50
2500 + 10800 + 44100 + 121600 + 89100 + 40000 + 36300 344400
=
= 6888.
=
50
50
Отсюда следует, что выборочная дисперсия равна:
𝐷𝐷 = 𝑥𝑥 2 − (𝑥𝑥 )2 = 6888 − 822 = 164.
Найдем исправленную дисперсию по формуле (3.10):
50
𝑛𝑛
𝐷𝐷 =
∙ 164 ≈ 167,35.
𝑠𝑠 2 =
49
𝑛𝑛 − 1
Исправленное среднее квадратическое отклонение вычислим по формуле
(3.11):
𝑠𝑠 = �167,35 ≈ 13.
41
Содержание
Итак, статистические характеристики расхода топлива в течении 50
недель имеют следующие значения:
𝑥𝑥 = 82; 𝑠𝑠 2 = 167,35; 𝑠𝑠 = 13.
Какие выводы можно сделать, исходя из полученных статистических характеристик?
Среднее квадратическое отклонение служит показателем, который дает
представление о наиболее вероятном отклонении значения единичного наблюдения от среднего значения. В интервале (𝑥𝑥 − 𝑠𝑠; 𝑥𝑥 + 𝑠𝑠) содержится примерно
2/3 всех наблюдаемых значений признака, точнее 68,3% всех вариант.
Возможны отклонения значений признака от 𝑥𝑥, превосходящие по абсолютной величине значение 𝑠𝑠, но вероятность таких отклонений по мере удаления от интервала (𝑥𝑥 − 𝑠𝑠; 𝑥𝑥 + 𝑠𝑠) все время уменьшается. Так, вероятность
встретить варианту вне интервала (𝑥𝑥 − 3𝑠𝑠; 𝑥𝑥 + 3𝑠𝑠) равна 0,003. Поэтому принято считать, что почти все значения признака в вариационном ряду укладываются в интервал (𝑥𝑥 − 3𝑠𝑠; 𝑥𝑥 + 3𝑠𝑠).
Для статистических характеристик примера 3.5 мы можем сделать следующие выводы: примерно 2/3 измерений расхода топлива, заключенны в интервале (𝑥𝑥 − 𝑠𝑠; 𝑥𝑥 + 𝑠𝑠) = (82 − 13; 82 + 13) = (69; 95), т.е. 2/3 измерений от общего числа замеров расхода топлива имеет величину от 69 до 95 литров. При
этом величина недельного расхода топлива практически всех недель принадлежат интервалу (𝑥𝑥 − 3𝑠𝑠; 𝑥𝑥 + 3𝑠𝑠) = (82 − 3 ∙ 13; 82 + 3 ∙ 13) = (43; 121). В
нашем примере расход топлива в каждой из 50 недель принадлежат этому интервалу.
3.2.3. Коэффициент вариации
Коэффициентом вариации 𝑉𝑉 называют отношение среднего квадратического отклонения к выборочной средней, выраженное в процентах, т.е.
𝑠𝑠
𝑉𝑉 = ∙ 100%.
(3.12)
𝑥𝑥
Коэффициент вариации является относительным показателем изменчивости (мерой рассеянности значений признака). Использование коэффициента
вариации имеет смысл при изучении признака, принимающего только положительные значения. Например, не имеет смысла коэффициент вариации, вычисленный для характеристики колебания среднегодовой температуры в городе Зернограде, так как варьирующий признак принимает как положительные, так и отрицательные значения.
42
Содержание
Коэффициент вариации служит мерой рассеянности значений признака
вокруг выборочной средней. Принято считать, что разброс значений признака
незначительный, если коэффициент вариации не превышает 10%. Если 𝑉𝑉
выше 10%, но менее 20%, то степень рассеянности считается средней. В случае, когда коэффициент вариации более 20% делают вывод, что разброс значений признака значительный.
Коэффициент вариации является безразмерной величиной и дает возможность сравнивать варьирование признаков разной размерности, например,
длины и массы, содержание азота и площади листьев, а также при сравнении
изменчивости величин, уровень которых резко различен (например, доходы
директоров крупных компаний и простых рабочих).
3.2.4. Доверительная вероятность. Доверительный интервал
Выборочная средняя и исправленное среднее квадратическое отклонение
являются оценками (приближенными значениями) соответствующих параметров генеральной совокупности. Возникает вопрос: с какой точностью мы оцениваем неизвестные среднее значение и среднее квадратическое отклонение
генеральной совокупности?
Точечной называют оценку неизвестного параметра, которая определяется одним числом (точкой на числовой оси).
Например, выборочная средняя и исправленное среднее квадратическое
отклонение являются точечными оценками.
Интервальной называют оценку, определяемую двумя числами – концами интервала.
Доверительным называют интервал, который с заданной вероятностью
𝛾𝛾 покрывает оцениваемый параметр.
Вероятность 𝛾𝛾, с которой доверительный интервал покрывает оцениваемый параметр, называется доверительной вероятностью (надежностью
оценки).
Центром доверительного интервала является точечная оценка параметра.
Например, центром доверительного интервала для среднего значения генеральной совокупности является выборочная средняя, а центром доверительного интервала для среднего квадратического отклонения генеральной совокупности является исправленное среднее квадратическое отклонение выборки.
43
Содержание
Границы доверительного интервала определяются статистическими характеристиками выборки и значением доверительной вероятности. Чем выше
значение 𝛾𝛾, тем шире доверительный интервал.
Как правило, значение 𝛾𝛾 выбирают равным 𝛾𝛾 = 0,95 или 𝛾𝛾 = 0,99, или
𝛾𝛾 = 0,999.
3.2.5. Доверительные интервалы для оценки параметров
нормального распределения
Пусть количественный признак 𝑋𝑋 генеральной совокупности имеет нормальное распределение, причем нам неизвестны математическое ожидание 𝑎𝑎Г
и среднее квадратическое отклонение 𝜎𝜎Г генеральной совокупности.
Тогда доверительный интервал, покрывающий неизвестное математическое ожидание 𝑎𝑎Г с надежностью 𝛾𝛾 имеет вид:
𝑡𝑡 ∙ 𝑠𝑠
𝑡𝑡 ∙ 𝑠𝑠
; 𝑥𝑥 +
�,
(3.13)
�𝑥𝑥 −
√𝑛𝑛
√𝑛𝑛
то есть, с доверительной вероятностью 𝛾𝛾 осуществляется неравенство:
𝑡𝑡 ∙ 𝑠𝑠
𝑡𝑡 ∙ 𝑠𝑠
< 𝑎𝑎Г < 𝑥𝑥 +
.
(3.14)
𝑥𝑥 −
√𝑛𝑛
√𝑛𝑛
Здесь 𝑛𝑛 – объем выборки, 𝑥𝑥 – выборочная средняя, 𝑠𝑠 – исправленное среднее
квадратическое отклонение выборки. Значение 𝑡𝑡 находят по таблице значений
𝑡𝑡 = 𝑡𝑡(𝛾𝛾; 𝑛𝑛) (приложение 2).
Пример 3.6. Количественный признак 𝑋𝑋 генеральной совокупности распределен нормально. По выборке объема 𝑛𝑛 = 20 найдены выборочная средняя
𝑥𝑥 = 10 и исправленное среднее квадратическое отклонение 𝑠𝑠 = 1. Оценить
математическое ожидание генеральной совокупности при помощи доверительного интервала с надежностью 𝛾𝛾 = 0,95.
В нашем случае 𝑛𝑛 = 20, 𝑥𝑥 = 10, 𝑠𝑠 = 1. По таблице приложения 2 находим
значение 𝑡𝑡 = 𝑡𝑡(𝛾𝛾, 𝑛𝑛) = 𝑡𝑡(0,95;20)=2,093. Следовательно,
𝑡𝑡 ∙ 𝑠𝑠 2,093 2,093
=
=
= 0,468.
4,472
√20
√𝑛𝑛
Отсюда, по формуле (3.13), получим искомый доверительный интервал:
(10 − 0,468; 10 + 0,468) = (9,532; 10,468).
Итак, с доверительной вероятностью 0,95 неизвестное математическое ожидание 𝑎𝑎Г генеральной совокупности удовлетворяет неравенству:
9,532 < 𝑎𝑎Г < 10,468.
44
Содержание
Пусть количественный признак 𝑋𝑋 генеральной совокупности распределен
нормально.
Доверительный интервал, покрывающий с надежностью 𝛾𝛾 неизвестное
среднее квадратическое отклонение 𝜎𝜎Г генеральной совокупности, имеет вид:
𝑠𝑠 ∙ (1 − 𝑞𝑞) < 𝜎𝜎Г < 𝑠𝑠 ∙ (1 + 𝑞𝑞).
(3.15)
Здесь 𝑠𝑠 – исправленное среднее квадратическое отклонение выборки. Значение 𝑞𝑞 находят по таблице значений 𝑞𝑞 = 𝑞𝑞(𝛾𝛾; 𝑛𝑛) (приложение 3).
3.3. Проверка статистических гипотез
3.3.1. Статистические гипотезы
При изучении случайных величин одним из основных является вопрос о
виде их распределения.
Если закон распределения неизвестен, то на основе опытных данных (данных выборки) выдвигают гипотезу о том, что генеральная совокупность распределена по закону 𝐺𝐺.
Предположим, что закон распределения известен, а его параметр неизвестен. Если есть основание предположить, что неизвестный параметр Θ («тэта»
− буква греческого алфавита) равен Θ0 , то выдвигают гипотезу: Θ = Θ0 .
Гипотезу о виде неизвестного распределения или о значении параметра
известного распределения называют статистической.
Например, статистическими являются гипотезы:
a) генеральная совокупность имеет нормальное распределение;
b) математические ожидания двух нормально распределенных величин равны.
Нулевой (основной) называют выдвигаемую гипотезу 𝐻𝐻0 . Конкурирующей (альтернативной) называют гипотезу 𝐻𝐻1 , противоречащую нулевой гипотезе.
Нулевая гипотеза может быть как верной, так и ошибочной. Поэтому возникает необходимость ее проверки.
При проверке статистических гипотез возможны следующие варианты:
1. 𝐻𝐻0 верна, и она принимается.
2. 𝐻𝐻0 верна, но она отвергается (ошибка первого рода).
3. 𝐻𝐻0 неверна, и она отвергается.
4. 𝐻𝐻0 неверна, но она принимается (ошибка второго рода).
45
Содержание
3.3.2. Статистический критерий проверки нулевой гипотезы
Для проверки нулевой гипотезы используют специально подобранную
случайную величину, точное или приближенное распределение которой известно. Обозначим эту величину через 𝐾𝐾.
Статистическим критерием называют случайную величину 𝐾𝐾, которая служит для проверки нулевой гипотезы.
Например, если проверяется гипотеза о равенстве дисперсий двух генеральных совокупностей, имеющих нормальное распределение, то в качестве
критерия 𝐾𝐾 принимают отношение исправленных выборочных дисперсий:
𝑠𝑠12
𝐾𝐾 = 2 .
𝑠𝑠2
Наблюдаемым значением 𝐾𝐾набл называют значение критерия, вычисленное по данным выборки.
Например, если по двум выборкам найдены выборочные дисперсии
2
𝑠𝑠1 = 20 и 𝑠𝑠22 = 22, то
20
𝐾𝐾набл = .
22
Вероятность 𝛼𝛼 допустить ошибку первого рода (отвергнуть верную гипотезу) называется уровнем значимости критерия.
Чем меньше уровень значимости, тем меньше вероятность отвергнуть
верную гипотезу. Обычно 𝛼𝛼 полагают равным 0,05 (пятипроцентный уровень
значимости) или 0,01 (однопроцентный уровень значимости).
Множество всех значений критерия разбивают на два непересекающихся
подмножества: одно подмножество содержит значения критерия, при которых
нулевая гипотеза отвергается, а другое – при которых нулевая гипотеза принимается.
Здесь следует подчеркнуть, что никакая гипотеза не может быть окончательно принята или отвергнута. Всегда остается вероятность, равная уровню
значимости, при которой мы можем совершить ошибку первого рода. Также
всегда есть шанс совершить ошибку второго рода.
Поэтому используемые в дальнейшем утверждения «принять» или «отвергнуть» гипотезу следует понимать, как сокращения выражений вида «данные выборки не противоречат выдвинутой гипотезе» и «данные выборки противоречат выдвинутой гипотезе».
Критической областью 𝑊𝑊 проверяемой гипотезы называют множество
значений критерия, при которых гипотезу отвергают.
Содержание
46
Областью принятия гипотезы называют множество значений критерия, при которых гипотезу принимают.
Критической точкой 𝑘𝑘кр называют точку числовой оси, отделяющую
критическую область от области принятия гипотезы (рисунок 3.3).
Для каждого критерия имеются таблицы, по которым находят критическую точку для заданного уровня значимости 𝛼𝛼.
𝑘𝑘кр
𝑊𝑊
Рисунок 3.3 – Критическая область
Вероятность 1 − 𝛼𝛼, равная вероятности того, что верная гипотеза 𝐻𝐻0 будет принята, называется надежностью критерия.
Проверка гипотезы включает в себя следующие этапы:
1) выбирается статистический критерий 𝐾𝐾;
2) по данным выборки вычисляется наблюдаемое значение критерия
𝐾𝐾набл ;
3) по известному закону распределения критерия и заданному уровню
значимости 𝛼𝛼 определяется критическая точка 𝑘𝑘кр . Затем устанавливается вид критической области 𝑊𝑊;
4) если наблюдаемое значение критерия 𝐾𝐾набл принадлежит области
принятия гипотезы, то нулевая гипотеза принимается. Если же значение 𝐾𝐾набл попало в область 𝑊𝑊, то гипотеза отвергается.
3.3.3. Критерий согласия Пирсона
Предположим, что закон распределения генеральной совокупности нам
неизвестен, но по данным выборки есть основание предположить, что изучаемый признак распределен по закону 𝐺𝐺. Тогда формулируется нулевая гипотеза: изучаемый признак генеральной совокупности имеет распределение 𝐺𝐺.
Очевидно, что требуется проверка справедливости нулевой гипотезы.
Критерием согласия называют статистический критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Мы рассмотрим один из известных критериев согласия, который носит
название критерия Пирсона.
Критерий Пирсона, как и любой другой критерий, не доказывает справедливость гипотезы, а устанавливает на принятом уровне значимости ее согласие
или не согласие с данными выборки.
Содержание
47
В качестве статистического критерия проверки гипотезы Пирсон предложил случайную величину:
𝑙𝑙
(𝑛𝑛𝑖𝑖 − 𝑛𝑛𝑖𝑖′ )2
.
�
𝑛𝑛𝑖𝑖′
(3.16)
𝑖𝑖=1
Здесь 𝑙𝑙 − число интервалов выборки, на которые разбита вся область значений признака выборки; 𝑛𝑛𝑖𝑖 – частота 𝑖𝑖-го интервала (число членов выборки,
попавших в 𝑖𝑖-й интервал); 𝑛𝑛𝑖𝑖′ − теоретическая частота 𝑖𝑖-го интервала (указывает, сколько значений случайной величины должно быть в 𝑖𝑖-том интервале,
если случайная величина имеет проверяемый закон распределения).
Случайная величина (3.16), при 𝑙𝑙 → ∞, стремится к распределению 𝜒𝜒 2
(«хи-квадрат») с 𝑘𝑘 = 𝑙𝑙 − 𝑟𝑟 − 1 степенями свободы (понятие о числе степеней
свободы поясняется в приложении 6), где 𝑟𝑟 – число параметров предполагаемого закона распределения.
Случайную величину (3.16) обозначают 𝜒𝜒 2 и пишут:
𝑙𝑙
(𝑛𝑛𝑖𝑖 − 𝑛𝑛𝑖𝑖′ )2
𝜒𝜒 = �
.
𝑛𝑛𝑖𝑖′
2
(3.17)
𝑖𝑖=1
Поэтому критерий Пирсона иногда называют критерием 𝝌𝝌𝟐𝟐 .
2
нужно опредеДля вычисления наблюдаемого значения критерия 𝜒𝜒набл
лить значения теоретических частот 𝑛𝑛𝑖𝑖′ .
Поскольку теоретическая относительная частота 𝑖𝑖-го интервала равна
𝑛𝑛𝑖𝑖′
𝑛𝑛
= 𝑤𝑤𝑖𝑖 , а относительна частота 𝑤𝑤𝑖𝑖 приближенно равна вероятности 𝑝𝑝𝑖𝑖 попада-
ния случайной величины в 𝑖𝑖-й интервал, то
𝑛𝑛𝑖𝑖′
𝑛𝑛
≈ 𝑝𝑝𝑖𝑖 . Отсюда получаем формулу,
по которой можно найти теоретические частоты:
𝑛𝑛𝑖𝑖′ = 𝑛𝑛 ∙ 𝑝𝑝𝑖𝑖 ,
(3.18)
где 𝑛𝑛 − объем выборки.
Вероятность 𝑝𝑝𝑖𝑖 = 𝑃𝑃(𝑥𝑥𝑖𝑖−1 < 𝑋𝑋 ≤ 𝑥𝑥𝑖𝑖 ) попадания случайной величины в 𝑖𝑖-й
полуинтервал (𝑥𝑥𝑖𝑖−1 ; 𝑥𝑥𝑖𝑖 ] вычисляют по формуле
𝑝𝑝𝑖𝑖 = 𝑃𝑃(𝑥𝑥𝑖𝑖−1 < 𝑋𝑋 ≤ 𝑥𝑥𝑖𝑖 ) = 𝐹𝐹 (𝑥𝑥𝑖𝑖 ) − 𝐹𝐹(𝑥𝑥𝑖𝑖−1 )
или по формуле
𝑥𝑥𝑖𝑖
𝑝𝑝𝑖𝑖 = 𝑃𝑃(𝑥𝑥𝑖𝑖−1 < 𝑋𝑋 ≤ 𝑥𝑥𝑖𝑖 ) = � 𝑓𝑓(𝑡𝑡)𝑑𝑑𝑡𝑡.
𝑥𝑥𝑖𝑖−1
Здесь 𝐹𝐹(𝑥𝑥) и 𝑓𝑓(𝑥𝑥) соответственно функция распределения и функция плотности предполагаемого закона распределения.
48
Содержание
Проверка гипотезы по критерию Пирсона проводится по следующей
2
схеме: по данным выборки по формуле (3.17) вычисляют 𝜒𝜒набл
. Для заданного
уровня значимости 𝛼𝛼 и числа степеней свободы 𝑘𝑘 по таблице приложения 5
2
2
2
находят критическую точку 𝑘𝑘кр = 𝜒𝜒кр
(𝛼𝛼; 𝑘𝑘). Если 𝜒𝜒набл
≥ 𝜒𝜒кр
, то гипотезу от-
2
2
вергают, а если 𝜒𝜒набл
< 𝜒𝜒кр
, то гипотезу принимают с надежностью 1 − 𝛼𝛼.
Замечание. При использовании критерия 𝜒𝜒 2 желательно иметь не менее
50 наблюдений (𝑛𝑛 ≥ 50), при этом частота каждого интервала должна быть не
менее 5 (𝑛𝑛𝑖𝑖 ≥ 5, 𝑖𝑖 = 1,2, … , 𝑙𝑙).
3.3.4. Проверка гипотезы о нормальном распределении
количественного признака генеральной совокупности
Рассмотрим пример применения критерия согласия Пирсона проверки гипотезы о нормальном распределении количественного признака генеральной
совокупности.
Пример 3.7. По данным еженедельного расхода топлива в течении 50
недель, при уровне значимости 𝛼𝛼 = 0,05, выдвинуть гипотезу о предполагаемом законе распределения объема расхода топлива в генеральной совокупности и проверить эту гипотезу с помощью критерия Пирсона.
В таблице 3.2 примера 3.1 приведено статистическое распределение выборки по данным измерений расхода топлива в течении 50 недель. В примере
3.3 были построены гистограмма частот и вариационная кривая для этого статистического распределения (рисунок 3.2).
Нетрудно видеть, что форма вариационной кривой (рисунок 3.2) очень
похожа на форму нормальной кривой (рисунок 2.1). Поэтому у нас есть основание выдвинуть нулевую гипотезу 𝐻𝐻0 : еженедельный расход топлива служебного автомобиля имеет нормальное распределение.
Используя найденный в примере 3.1 интервальный вариационный ряд
(таблица 3.2), составим новый интервальный вариационный ряд. Объединим
первые три интервала, чтобы сумма частот этих интервалов была не меньше 5
(частоты первого и второго интервала меньше 5, а сумма частот 𝑛𝑛1 + 𝑛𝑛2 = 4
также меньше 5). Объединим шестой и седьмой интервалы, так как их частоты
меньше 5. Получим интервальный ряд, состоящий из четырех интервалов (таблица 3.3).
Содержание
49
Таблица 3.2 – Статистическое распределение выборки по данным измерений расхода топлива
№
Интервалы (𝑥𝑥𝑖𝑖−1 ; 𝑥𝑥𝑖𝑖 )
Частоты интервалов 𝑛𝑛𝑖𝑖
1
[45;55)
1
2
[55;65)
3
3
[65;75)
9
4
[75;85)
19
5
[85:95)
11
6
[95;105)
4
7
[105;115]
3
7
∑𝑖𝑖=1 𝑛𝑛𝑖𝑖 = 𝑛𝑛 = 50
∑
Таблица 3.3 – Исправленный интервальный вариационный ряд с частотами, большими 5
№
Интервалы Частоты интервалов
(𝑥𝑥𝑖𝑖−1 ; 𝑥𝑥𝑖𝑖 )
𝑛𝑛𝑖𝑖
1
[45;75)
13
2
[75;85)
19
3
[85:95)
11
4
[95;115]
7
4
∑𝑖𝑖=1 𝑛𝑛𝑖𝑖 = 𝑛𝑛 = 50
∑
Заменим наименьшее значение 𝑥𝑥0 = 45 на −∞, а наибольшее значение
𝑥𝑥4 = 115 на +∞, получим ряд (таблица 3.4):
Таблица 3.4 – Интервальный вариационный ряд, подготовленный для
расчетов
№
1
2
3
4
∑
Интервалы
(𝑥𝑥𝑖𝑖−1 ; 𝑥𝑥𝑖𝑖 )
(−∞;75)
[75;85)
[85:95)
[95;+∞)
Частоты интервалов
𝑛𝑛𝑖𝑖
13
19
11
7
∑4𝑖𝑖=1 𝑛𝑛𝑖𝑖 = 𝑛𝑛 = 50
Наблюдаемое значение критерия будем вычислять по формуле (3.17).
В нашем случае, при 𝑙𝑙 = 4, формула имеет следующий вид:
Содержание
50
2
𝜒𝜒набл
4
(𝑛𝑛𝑖𝑖 − 𝑛𝑛𝑖𝑖′ )2
.
=�
𝑛𝑛𝑖𝑖′
(3.19)
𝑖𝑖=1
Поскольку мы проверяем гипотезу о нормальном распределении, то вероятность 𝑝𝑝𝑖𝑖 попадания случайной величины в 𝑖𝑖-й интервал найдем по свойству
нормального распределения:
𝛽𝛽 − 𝑎𝑎
𝛼𝛼 − 𝑎𝑎
𝑃𝑃(𝛼𝛼 < 𝑋𝑋 < 𝛽𝛽) = Φ �
� − Φ�
�,
𝜎𝜎
𝜎𝜎
где
Φ(𝑥𝑥) =
1
√2𝜋𝜋
𝑥𝑥
� 𝑒𝑒 −𝑡𝑡
0
2 ⁄2
𝑑𝑑𝑡𝑡 − функция Лапласа.
Так как выборочная средняя и исправленное выборочное среднее квадратическое отклонение являются оценками для математического ожидания и
среднего квадратического отклонения генеральной совокупности, то полагаем
𝑎𝑎 ≈ 𝑥𝑥, 𝜎𝜎 ≈ 𝑠𝑠. В примере 3.4 мы вычислили выборочную среднюю 𝑥𝑥 = 82, а в
примере 3.5 нашли, что 𝑠𝑠 = 13. Следовательно, в нашем случае,
𝑥𝑥𝑖𝑖−1 − 𝑥𝑥
𝑥𝑥𝑖𝑖 − 𝑥𝑥
� − Φ�
�=
𝑝𝑝𝑖𝑖 = 𝑃𝑃(𝑥𝑥𝑖𝑖−1 < 𝑋𝑋 < 𝑥𝑥𝑖𝑖 ) = Φ �
𝑠𝑠
𝑠𝑠
𝑥𝑥𝑖𝑖 − 82
𝑥𝑥𝑖𝑖−1 − 82
= Φ�
� − Φ�
�.
13
13
2
Для удобства вычисления 𝜒𝜒набл
составим расчетную таблицу (таблица
3.5). Значения функции Лапласа Φ(𝑥𝑥 ) находятся по таблице приложения 1.
Проверим правильность вычислений в расчетной таблице 3.5. Сумма вероятностей 𝑝𝑝𝑖𝑖 (чисел в девятом столбце) должна равняться единице, а сумма
теоретических частот 𝑛𝑛𝑖𝑖′ (чисел в десятом столбце) равна объему выборки 𝑛𝑛 =
50.
Сумма чисел последнего столбца равна наблюдаемому значению критерия
2
𝜒𝜒набл
= 1,6758.
Найдем критическую точку критерия. Число степеней свободы вычисляется по формуле
𝑘𝑘 = 𝑙𝑙 − 𝑟𝑟 − 1,
где 𝑟𝑟 – число параметров предполагаемого закона распределения. Функция
плотности нормального распределения
1
2
2
𝑓𝑓(𝑥𝑥 ) =
(3.20)
𝑒𝑒 −(𝑥𝑥−𝑎𝑎) ⁄(2𝜎𝜎 )
𝜎𝜎√2𝜋𝜋
Содержание
51
имеет два параметра: 𝑎𝑎 = 𝑀𝑀(𝑋𝑋) – математическое ожидание, и 𝜎𝜎 = 𝜎𝜎(𝑋𝑋) –
среднее квадратическое отклонение. Следовательно, 𝑟𝑟 = 2. Отсюда получаем,
что число степеней свободы равно: 𝑘𝑘 = 4 − 2 − 1 = 1.
Таблица 3.5 – Расчетная таблица
№
1
2
3
4
�
(𝑥𝑥𝑖𝑖−1 ; 𝑥𝑥𝑖𝑖 )
𝑛𝑛𝑖𝑖
−∞
75
85
95
13
19
11
7
𝑥𝑥𝑖𝑖−1
𝑥𝑥𝑖𝑖
75
85
95
+∞
50
𝑥𝑥𝑖𝑖−1 − 𝑥𝑥
=
𝑠𝑠
𝑥𝑥𝑖𝑖−1 − 82
=
13
−∞
−0,54
0,23
1
𝑥𝑥𝑖𝑖 − 𝑥𝑥
=
𝑠𝑠
𝑥𝑥𝑖𝑖 − 82
=
13
−0,54
0,23
1
+∞
Φ1 =
𝑥𝑥𝑖𝑖−1 − 𝑥𝑥
�
= Φ�
𝑠𝑠
−0,5
−0,2054
0,0910
0,3413
Φ2 =
𝑥𝑥𝑖𝑖 − 𝑥𝑥
�
= Φ�
𝑠𝑠
−0,2054
0,0910
0,3413
0,5
𝑝𝑝𝑖𝑖 =
= Φ2 −
−Φ1
𝑛𝑛𝑖𝑖′ =
= 𝑛𝑛 ∙ 𝑝𝑝𝑖𝑖
= 50𝑝𝑝𝑖𝑖
1
50
0,2946
0,2964
0,2503
0,1587
14,73
14,82
12,515
7,935
(𝑛𝑛𝑖𝑖 − 𝑛𝑛𝑖𝑖′ )2
𝑛𝑛𝑖𝑖′
0,2032
1,1790
0,1834
0,1102
2
𝜒𝜒набл
=
= 1,6758
Используя таблицу критических точек распределения 𝜒𝜒 2 (приложение 5),
2
найдем критическую точку 𝜒𝜒кр
(𝛼𝛼; 𝑘𝑘):
2 (
2 (
𝛼𝛼; 𝑘𝑘 ) = 𝜒𝜒кр
0,05; 1) = 3,84146.
𝜒𝜒кр
2
2
Так как 𝜒𝜒набл
< 𝜒𝜒кр
(1,6758 < 3,84146), то гипотеза согласуется с результатами выборки.
Итак, с надежностью (вероятностью) 1 − 𝛼𝛼 = 0,95 можно утверждать,
что еженедельный расход топлива служебного автомобиля имеет нормальное
распределение с математическим ожиданием 𝑎𝑎 = 𝑥𝑥 = 82 и средним квадратическим отклонением 𝜎𝜎 = 𝑠𝑠 = 13.
Подставив значения параметров 𝑎𝑎 и 𝜎𝜎 в формулу (3.20), получим функцию плотности нашего распределения:
1
2
2
𝑓𝑓(𝑥𝑥 ) =
𝑒𝑒 −(𝑥𝑥−82) ⁄(2∙13 )
13√2𝜋𝜋
или
2
𝑓𝑓(𝑥𝑥 ) = 0,03 ∙ 𝑒𝑒 −(𝑥𝑥−82) ⁄338 .
3.3.5. Проверка гипотезы о показательном распределении
количественного признака генеральной совокупности
Пример 3.8. Из генеральной совокупности извлечена выборка объема
𝑛𝑛 = 50. Исследуемая непрерывная случайная величина 𝑋𝑋 приняла следующие
значения:
23
47
76
149
135
286
334
104
51
205
5
10
11
29
30
31
32
32
36
39
38
38
42
43
47
52
58
77
82
93
355
126
145
299
269
253
232
221
195
169
93
94
95
99
100
104
118
135
159
161
Содержание
52
При уровне значимости 𝛼𝛼 = 0,05 выдвинуть гипотезу о предполагаемом
законе распределения количественного признака 𝑋𝑋 генеральной совокупности
и проверить эту гипотезу по критерию Пирсона.
Сначала составим интервальный вариационный ряд.
Определим количество интервалов по формуле (3.1):
1 + 3,2 ∙ lg 𝑛𝑛 = 1 + 3,2 ∙ lg 50 = 1 + 3,2 ∙ 1,69897 = 6,4367.
Значит, число интервалов можно взять равным 6 или 7.
Размах варьирования 𝑅𝑅 = 𝑥𝑥max − 𝑥𝑥min = 355 − 5 = 350. Если возьмем
количество интервалов 𝑘𝑘 = 7, то длина каждого интервала
𝑥𝑥max − 𝑥𝑥min 350
=
= 50
ℎ=
7
𝑘𝑘
будет целым числом (что удобно для расчетов).
Составим интервальный вариационный ряд с длиной интервалов ℎ = 50
(таблица 3.6) и построим гистограмму частот (рисунок 1.4).
Таблица 3.6 – Статистическое распределение выборки
𝑛𝑛𝑖𝑖 𝑛𝑛𝑖𝑖
Частоты интервалов
№
Интервалы
=
𝑛𝑛𝑖𝑖
ℎ 50
(𝑥𝑥𝑖𝑖−1 ; 𝑥𝑥𝑖𝑖 )
1
[5;55)
19
0,38
2
[55;105)
12
0,24
3
[105;155)
6
0,12
4
[155;205)
4
0,08
5
[205;255)
4
0,08
6
[255;305)
3
0,06
7
[305;355]
2
0,04
7
7
∑
∑
𝑛𝑛
=
𝑛𝑛
=
50
𝑖𝑖=1 𝑖𝑖
𝑖𝑖=1 𝑤𝑤𝑖𝑖 = 1
∑
Для нахождения выборочной средней найдем, по формуле (3.5), середины
интервалов:
𝑥𝑥1∗ =
𝑥𝑥4∗ =
𝑥𝑥0 +𝑥𝑥1
2
𝑥𝑥3 +𝑥𝑥5
2
𝑥𝑥6∗ =
=
=
5+55
2
155+205
𝑥𝑥5 +𝑥𝑥6
2
= 30; 𝑥𝑥2∗ =
2
=
𝑥𝑥1 +𝑥𝑥2
2
= 180; 𝑥𝑥5∗ =
255+305
2
=
55+105
𝑥𝑥4 +𝑥𝑥5
2
= 280; 𝑥𝑥7∗ =
2
=
205+255
𝑥𝑥6 +𝑥𝑥7
2
= 80; 𝑥𝑥3∗ =
2
=
𝑥𝑥2 +𝑥𝑥3
= 230;
305+355
2
2
= 330.
=
105+155
2
= 130;
53
Содержание
𝑛𝑛𝑖𝑖
ℎ
0,38
0,24
0,12
0,08
0,04
5
55
105 155 205 255 305 355 𝑥𝑥
Рисунок 3.3 – Гистограмма частот и вариационная кривая
Интервальный ряд распределения таблицы 3.6 заменим следующим дискретным рядом:
30
80
130
180
230
280
330
𝑥𝑥𝑖𝑖∗
19
12
6
4
4
3
2
.
𝑛𝑛𝑖𝑖
Найдем выборочную среднюю по формуле (3.3):
∑𝑘𝑘𝑖𝑖=1 𝑛𝑛𝑖𝑖 𝑥𝑥𝑖𝑖 19 ∙ 30 + 12 ∙ 80 + 6 ∙ 130 + 4 ∙ 180 + 4 ∙ 230 + 3 ∙ 280 + 2 ∙ 330
𝑥𝑥 =
=
=
50
𝑛𝑛
570 + 960 + 780 + 720 + 920 + 840 + 660 5450
=
= 109.
50
50
Выборочную дисперсию вычислим по расчетной формуле (3.8). Выбороч=
ная средняя уже известна, осталось вычислить 𝑥𝑥 2 . По формуле (3.9), получим:
𝑥𝑥 2
=
19 ∙ 302 + 12 ∙ 802 + 6 ∙ 1302 + 4 ∙ 1802 + 4 ∙ 2302 + 3 ∙ 2802 + 2 ∙ 3302
=
50
17100 + 76800 + 101400 + 129600 + 211600 + 235200 + 217800 989500
=
=
=
50
50
= 19790.
Отсюда следует, что выборочная дисперсия равна:
𝐷𝐷 = 𝑥𝑥 2 − (𝑥𝑥 )2 = 19790 − 1092 = 19790 − 11881 = 7909.
Найдем исправленную дисперсию по формуле (3.10):
𝑛𝑛
50
𝑠𝑠 2 =
𝐷𝐷 =
∙ 7909 ≈ 8070,41.
𝑛𝑛 − 1
49
Исправленное среднее квадратическое отклонение вычислим по формуле
(3.11):
54
ния:
Содержание
𝑠𝑠 = �8070,41 ≈ 90.
Итак, статистические характеристики выборки имеют следующие значе-
𝑥𝑥 = 109; 𝑠𝑠 2 = 8070,41; 𝑠𝑠 = 90.
Форма вариационной кривой на рисунке 3.3 похожа на форму графика
функции плотности показательного распределения (рисунок 3.4).
𝜆𝜆
𝑓𝑓(𝑥𝑥)
𝑥𝑥
𝑂𝑂
Рисунок 3.4 – График функции плотности показательного распределения
Функция плотности распределения вероятностей показательно распределенной случайной величины имеет следующий вид (более подробно показательное распределение рассмотрено в приложении 4):
0,
𝑥𝑥 < 0;
𝑓𝑓(𝑥𝑥 ) = � −𝜆𝜆𝑥𝑥
𝜆𝜆𝑒𝑒 , 𝑥𝑥 ≥ 0.
Здесь 𝜆𝜆 – параметр, 𝜆𝜆 > 0.
По виду вариационной кривой можно выдвинуть следующую гипотезу
𝐻𝐻0 : количественный признак 𝑋𝑋 генеральной совокупности имеет показательное распределение.
Параметр 𝜆𝜆 связан с математическим ожиданием 𝑀𝑀(𝑋𝑋) показательно распределенной случайной величины следующим соотношением:
1
𝑀𝑀(𝑋𝑋) = .
(3.21)
𝜆𝜆
Поскольку оценкой математического ожидания является выборочная
средняя, то, полагая 𝑀𝑀(𝑋𝑋) ≈ 𝑥𝑥, получим
1
𝑥𝑥 ≈ ,
𝜆𝜆
следовательно,
1
1
≈ 0,009.
𝜆𝜆 ≈ =
𝑥𝑥 109
Значит плотность распределения вероятностей количественного признака 𝑋𝑋
генеральной совокупности имеет следующий вид:
Содержание
55
0,
𝑥𝑥 < 0;
0,009 ∙ 𝑒𝑒 −0,009𝑥𝑥 , 𝑥𝑥 ≥ 0.
Проверим нашу нулевую гипотезу 𝐻𝐻0 по критерию Пирсона.
Используя интервальный вариационный ряд таблицы 3.6, составим новый
интервальный вариационный ряд. Объединим третий интервал с четвертым
(так как частота четвертого интервала меньше 5). Так же объединим последние
три интервала (их частоты меньше 5). Получим следующий интервальный ряд:
Частоты интервалов
№
Интервалы
𝑛𝑛𝑖𝑖
(𝑥𝑥𝑖𝑖−1 ; 𝑥𝑥𝑖𝑖 )
1
[5;55)
19
2
[55;105)
12
3
[105;205)
10
4
[205;355)
9
4
∑
𝑓𝑓(𝑥𝑥 ) = �
� 𝑛𝑛𝑖𝑖 = 𝑛𝑛 = 50
𝑖𝑖=1
Заменим наименьшее значение 𝑥𝑥0 = 5 на значение 0 (заменяем на ноль,
потому что функция плотности показательного распределения имеет ненулевые значения на промежутке [0; +∞)), а наибольшее значение 𝑥𝑥4 = 355 на
+∞. Получим следующий интервальный вариационный ряд:
Частоты интервалов
№
Интервалы
𝑛𝑛𝑖𝑖
(𝑥𝑥𝑖𝑖−1 ; 𝑥𝑥𝑖𝑖 )
1
[0;55)
19
2
[55;105)
12
3
[105;205)
10
4
9
[205;+∞)
4
∑
� 𝑛𝑛𝑖𝑖 = 𝑛𝑛 = 50
𝑖𝑖=1
Наблюдаемое значение критерия будем вычислять по формуле (3.17).
В нашем случае, при 𝑙𝑙 = 4, формула имеет следующий вид:
2
𝜒𝜒набл
Теоретические частоты
𝑛𝑛𝑖𝑖′
4
(𝑛𝑛𝑖𝑖 − 𝑛𝑛𝑖𝑖′ )2
=�
.
𝑛𝑛𝑖𝑖′
𝑖𝑖=1
вычисляются по формуле
𝑛𝑛𝑖𝑖′ = 𝑛𝑛 ∙ 𝑝𝑝𝑖𝑖 ,
где 𝑛𝑛 − объем выборки.
Вероятность 𝑝𝑝𝑖𝑖 = 𝑃𝑃(𝑥𝑥𝑖𝑖−1 < 𝑋𝑋 ≤ 𝑥𝑥𝑖𝑖 ) попадания случайной величины в 𝑖𝑖-й
интервал (𝑥𝑥𝑖𝑖−1 ; 𝑥𝑥𝑖𝑖 ) вычисляют по формуле
𝑝𝑝𝑖𝑖 = 𝑃𝑃(𝑥𝑥𝑖𝑖−1 < 𝑋𝑋 < 𝑥𝑥𝑖𝑖 ) = 𝐹𝐹 (𝑥𝑥𝑖𝑖 ) − 𝐹𝐹 (𝑥𝑥𝑖𝑖−1 ).
Содержание
56
Функция распределения случайной величины, имеющей показательное распределение, имеет вид:
0,
𝑥𝑥 < 0;
𝐹𝐹 (𝑥𝑥 ) = �
−𝜆𝜆𝑥𝑥
1 − 𝑒𝑒 , 𝑥𝑥 ≥ 0.
Отсюда следует, что
𝑝𝑝𝑖𝑖 = 𝐹𝐹 (𝑥𝑥𝑖𝑖 ) − 𝐹𝐹 (𝑥𝑥𝑖𝑖−1 ) = �1 − 𝑒𝑒 −𝜆𝜆𝑥𝑥𝑖𝑖 � − �1 − 𝑒𝑒 −𝜆𝜆𝑥𝑥𝑖𝑖−1 � = 𝑒𝑒 −𝜆𝜆𝑥𝑥𝑖𝑖−1 − 𝑒𝑒 −𝜆𝜆𝑥𝑥𝑖𝑖 .
2
составим следующую расчетную таблицу:
Для вычисления 𝜒𝜒набл
Таблица 3.7 – Расчетная таблица
№
1
2
3
4
�
(𝑥𝑥𝑖𝑖−1 ; 𝑥𝑥𝑖𝑖 )
𝑛𝑛𝑖𝑖
55
105
205
+∞
19
12
10
9
50
𝑥𝑥𝑖𝑖−1
0
55
105
205
𝑥𝑥𝑖𝑖
𝑒𝑒 −𝜆𝜆𝑥𝑥𝑖𝑖−1 =
= 𝑒𝑒 −0,009𝑥𝑥𝑖𝑖−1
1
0,61
0,39
0,16
𝑒𝑒 −𝜆𝜆𝑥𝑥𝑖𝑖 =
𝑒𝑒 −0,009𝑥𝑥𝑖𝑖
0,61
0,39
0,16
0
𝑝𝑝𝑖𝑖 =
−𝜆𝜆𝑥𝑥𝑖𝑖−1
= 𝑒𝑒
− 𝑒𝑒 −𝜆𝜆𝑥𝑥𝑖𝑖
0,39
0,22
0,23
0,16
1
𝑛𝑛𝑖𝑖′ = 𝑛𝑛 ∙ 𝑝𝑝𝑖𝑖
= 50𝑝𝑝𝑖𝑖
19,5
11
11,5
8
50
(𝑛𝑛𝑖𝑖 − 𝑛𝑛𝑖𝑖′ )2
𝑛𝑛𝑖𝑖′
0,0128
0,0909
0,1957
0,125
2
𝜒𝜒набл
=
= 0,4244
Сделаем проверку. Сумма вероятностей 𝑝𝑝𝑖𝑖 равна единице (сумма чисел
седьмого столбца), а сумма теоретических частот равна объему выборки
(сумма чисел восьмого столбца равна 𝑛𝑛).
Сумма чисел последнего столбца равна наблюдаемому значению критерия.
Вычислим число степеней свободы по формуле
𝑘𝑘 = 𝑙𝑙 − 𝑟𝑟 − 1,
где 𝑟𝑟 – число параметров предполагаемого закона распределения, 𝑙𝑙 − число
интервалов расчетной таблицы.
Показательное распределение имеет один параметр 𝜆𝜆. Поэтому 𝑟𝑟 = 1. Количество интервалов 𝑙𝑙 = 4. Следовательно, число степеней свободы
𝑘𝑘 = 4 − 1 − 1 = 2.
По заданному уровню значимости 𝛼𝛼 = 0,05 и числу степеней свободы
𝑘𝑘 = 2, используя таблицу критических точек распределения 𝜒𝜒 2 (приложение
2
5), найдем критическую точку 𝜒𝜒кр
(𝛼𝛼; 𝑘𝑘):
2 (
2 (
0,05; 2) = 5,99146.
𝛼𝛼; 𝑘𝑘 ) = 𝜒𝜒кр
𝜒𝜒кр
2
2
Так как 𝜒𝜒набл
< 𝜒𝜒кр
(0,4244 < 5,99146), то гипотеза согласуется с результатами выборки.
Итак, с надежностью (вероятностью) 1 − 𝛼𝛼 = 0,95 можно утверждать,
что количественный признак 𝑋𝑋 генеральной совокупности имеет показательное распределение.
57
Содержание
3.4. Отсев грубых погрешностей
Часто даже тщательно поставленные эксперименты могут давать неоднородные данные, поскольку в процессе эксперимента могут измениться условия проведения опытов. Если экспериментатор
по каким-либо причинам не уловил этих изменений, наблюдения, соответствующие разным уровням факторов, будут принадлежать к
разным генеральным совокупностям. Данные, соответствующие изменившимся условиям, называют грубыми погрешностями (ошибками) или резко выделяющимися (аномальными) значениями. Грубые погрешности появляются также при неправильной записи показаний приборов.
В литературе приводятся сведения о том, что экспериментальные данные могут содержать ~ 10% аномальных значений. Однако
эти 10% могут дать сильное смещение при оценке параметров распределения, особенно для дисперсии, так как ошибки заметно отклоняются от основной группы значений, а на дисперсию особенно
сильно влияют крайние члены вариационного ряда.
В случае отсева грубых погрешностей (ошибок) нулевая гипотеза формулируется следующим образом:
Н0: «Среди результатов наблюдений (выборочных, опытных
данных) нет резко выделяющихся (аномальных) значений».
Альтернативной гипотезой может быть:
(1)
− либо Н1 : «Среди результатов наблюдений есть только
одна грубая ошибка»,
(2)
− либо Н1 : «Среди результатов наблюдений есть две или более грубых ошибки».
В литературе можно встретить большое количество различных
критериев для отсева грубых погрешностей наблюдений. Обычно
экспериментаторы имеют дело с выборками небольшого объема,
причем именно в этом случае аномальные данные имеют большой
вес. Наиболее распространенными и теоретически обоснованными в
этом случае являются критерий Н.В. Смирнова (используется при
(2)
(1)
(1)
Н1 ) и критерий Диксона (применим как при Н1 , так и при Н1 ).
Содержание
58
3.4.1. Критерий Н.В. Смирнова
Если известно, что есть только одно аномальное значение (аль(1)
тернативная гипотеза Н1 ), то оно будет крайним членом вариационного ряда. Поэтому проверять выборку на наличие одной грубой
ошибки естественно критерием:
𝑥𝑥̅ − 𝑥𝑥1
𝑢𝑢1 =
,
(3.22)
𝑠𝑠
если сомнение вызывает первый член вариационного ряда
𝑥𝑥1 = min 𝑥𝑥𝑖𝑖 ,
𝑖𝑖
или
𝑥𝑥𝑛𝑛 − 𝑥𝑥̅
,
𝑠𝑠
если сомнителен максимальный член вариационного ряда
𝑥𝑥𝑛𝑛 = max 𝑥𝑥𝑖𝑖 .
𝑢𝑢𝑛𝑛 =
𝑖𝑖
(3.23)
Этот критерий впервые был предложен Н.В. Смирновым. Он исследовал распределение случайных величин (3.22) и (3.23) и составил таблицы процентных точек 𝑢𝑢𝛼𝛼,𝑛𝑛 (квантили порядка 𝑝𝑝 = 1 − 𝛼𝛼)
для 𝛼𝛼 = 0,1; 0,05;0,01, при 3 ≤ 𝑛𝑛 ≤ 20.
При выбранном уровне значимости 𝛼𝛼 критическая область для
критерия Н.В. Смирнова строится следующим образом:
(3.24)
𝑢𝑢1 > 𝑢𝑢𝛼𝛼,𝑛𝑛 или 𝑢𝑢𝑛𝑛 > 𝑢𝑢𝛼𝛼,𝑛𝑛 ,
где 𝑢𝑢𝛼𝛼,𝑛𝑛 − это табличные значения (приложение 10).
В случае если выполняется последнее условие (значения 𝑢𝑢1 или
𝑢𝑢𝑛𝑛 попадают в критическую область), то нулевая гипотеза отвергается, т.е. отклонения 𝑥𝑥1 или 𝑥𝑥𝑛𝑛 не случайны и не характерны для рассматриваемой совокупности данных, а определяются изменившимися условиями или грубыми ошибками при проведении опытов. В
этом случае значения 𝑥𝑥1 или 𝑥𝑥𝑛𝑛 исключают из рассмотрения, а
найденные ранее оценки подвергаются пересчету с учетом отброшенного результата.
59
Содержание
3.4.2. Критерий Диксона
В критерии Диксона применяется следующая случайная величина:
− если подозрительная варианта имеет наибольшее значение,
𝑥𝑥𝑛𝑛 − 𝑥𝑥𝑛𝑛−𝑖𝑖
;
(3.25)
𝑟𝑟𝑖𝑖,𝑗𝑗 =
𝑥𝑥𝑛𝑛 − 𝑥𝑥𝑗𝑗+1
− если подозрительная варианта имеет наименьшее значение,
𝑥𝑥1+𝑖𝑖 − 𝑥𝑥1
,
(3.26)
𝑟𝑟𝑖𝑖,𝑗𝑗 =
𝑥𝑥𝑛𝑛−𝑗𝑗 − 𝑥𝑥1
где 𝑥𝑥𝑛𝑛 , 𝑥𝑥𝑛𝑛−𝑖𝑖 , 𝑥𝑥𝑗𝑗+1 — члены вариационного ряда.
Диксоном были получены распределения для 𝑟𝑟10 , 𝑟𝑟11 , 𝑟𝑟20 , 𝑟𝑟21 и 𝑟𝑟22 и построены таблицы для 𝛼𝛼 = 0,1; 0,05; 0,01 и 0,005 при 3 ≤ 𝑛𝑛 ≤ 30.
В зависимости от объема выборки критерий (или коэффициент) Диксона
выбирают согласно таблице 3.8. При наличии одновременно наименьшего и
наибольшего (двусторонних выбросов) считают, что односторонний выброс
один.
Таблица 3.8 – Выбор коэффициента Диксона
𝑛𝑛
(число членов вариационного ряда)
3..7
8..10
11..13
14..30
Число односторонних выбросов (подозрительных
вариант) в вариационном ряду
Один
Два и больше
r10
r20
r11
r20
r21
r21
r22
r22
Вычисляют коэффициент Диксона согласно таблице 3.9.
Таблица 3.9 – Вычисление коэффициента Диксона
Коэффициент Диксона для выброса (подозрительной варианты)
Наименьшего
Наибольшего
r10 =(x2-x1)/(xn-x1)
r10 =(xn-xn-1)/(xn-x1)
r11 =(x2-x1)/(xn-1-x1)
r11 =(xn-xn-1)/(xn-x2)
r21 =(x3-x1)/(xn-1-x1)
r21 =(xn-xn-2)/(xn-x2)
r22 =(x3-x1)/(xn-2-x1)
r22 =(xn-xn-2)/(xn-x3)
r20 =(x3-x1)/(xn-x1)
r20 =(xn-xn-2)/(xn-x1)
Критическая область в критерии Диксона выглядит аналогично критерию Н.В. Смирнова и включает значения:
(3.26)
𝑟𝑟𝑖𝑖,𝑗𝑗 > (𝑟𝑟𝑖𝑖,𝑗𝑗 )𝛼𝛼,𝑛𝑛 ,
где (𝑟𝑟𝑖𝑖,𝑗𝑗 )𝛼𝛼,𝑛𝑛 − табличные значения (приложение 11).
Содержание
60
Рассмотрим следующий пример.
Пример 3.9. Пирометром измеряется температура поверхности нагретого
тела (например, прокатываемой заготовки, причем будем предполагать, что
температура ее видимой поверхности во всех точках одинакова). Было проведено шесть измерений температуры T °С, и получены следующие значения:
925, 930, 950, 975, 990, 1080 (𝑛𝑛 = 6, причем, как видно, все значения приведены
в возрастающей последовательности, т.е. в виде вариационного ряда
𝑡𝑡1 = 925 ≤ 𝑡𝑡2 = 930 ≤ 𝑡𝑡3 =950≤... ≤ 𝑡𝑡6 = 1080).
Можно ли значение 𝑡𝑡6 =1080 считать грубой погрешностью, полученной,
допустим, в результате неправильной регистрации показаний пирометра?
Для ответа на поставленный в этом примере вопрос предварительно вычислим оценки параметров распределения исследуемой случайной величины
T (предполагая, что она не противоречит нормальному закону распределения):
выборочное среднее 𝑡𝑡̅ и исправленное выборочное среднее квадратичное отклонение 𝑠𝑠:
𝑛𝑛
1
1
𝑡𝑡̅ = � 𝑡𝑡𝑖𝑖 = (925 + 930 + 950 + 975 + 990 + 1080) = 975;
𝑛𝑛
6
𝑖𝑖=1
Выборочную дисперсию вычислим по формуле:
2
𝐷𝐷 = 𝑡𝑡 2 − �𝑡𝑡� .
Выборочная средняя уже известна, осталось вычислить 𝑡𝑡 2 .
𝑛𝑛
1
1
𝑡𝑡 2 = � 𝑡𝑡𝑖𝑖2 = (9252 + 9302 + 9502 + 9752 + 9902 + 10802 ) =
6
𝑛𝑛
𝑖𝑖=1
1
= (855625 + 864900 + 902500 + 950625 + 980100 + 1166400) =
6
1
= 5720150 ≈ 953358.
6
Следовательно, 𝐷𝐷 = 953358 − 9752 = 953358 − 950625 = 2733. Тогда, исправленная дисперсия:
6
𝑛𝑛
𝐷𝐷 = ∙ 2733 = 3279,6,
𝑠𝑠 2 =
5
𝑛𝑛 − 1
а исправленное среднее квадратическое отклонение
𝑠𝑠 = �𝑠𝑠 2 = 57,27.
Теперь воспользуемся предложенным выше алгоритмом проверки статистических гипотез.
61
Содержание
1. Формулируем нулевую гипотезу 𝐻𝐻0 : «Среди значений 925; 930; 950;
975; 990; 1080 нет грубых погрешностей».
2. Исходя из условий примера 3.9, выбираем следующую альтернативную гипотезу 𝐻𝐻1 : «Значение 1080 является (одной) грубой погрешностью».
3. Сформулированная нулевая гипотеза 𝐻𝐻0 может быть проверена по
любому из приведенных в этом разделе критериев, т.е. как по критерию Н.В. Смирнова, так и по критерию Диксона (хотя в литературе могут быть найдены и другие критерии). Остановимся на критерии Н.В. Смирнова.
4. Значение критерия Н.В. Смирнова в примере 3.9 вычислим по формуле (3.23):
(1)
𝑡𝑡6 − 𝑡𝑡̅ 1080 − 975
=
≈ 1,83.
57,27
𝑠𝑠
5. Уровень значимости 𝛼𝛼 примем равным 0,05.
6. По таблице приложения 10 при 𝛼𝛼 = 0,05 и 𝑛𝑛 = 6 находим
𝑢𝑢0,05; 6 = 1,82, и с использованием (3.24) строим критическую область:
𝑢𝑢6 > 𝑢𝑢0,05; 6
т.е.
𝑢𝑢6 > 1,82.
7. Принимаем решение: поскольку наблюдаемое значение
критерия (1,83 > 1,82) попало в критическую область − нулевая гипотеза отвергается, и в качестве рабочей принимается альтернативная гипотеза, т.е. значение 1080 с вероятностью 0,95 (уровень значимости, не превышает 0,05) по
критерию Н.В. Смирнова можно считать грубой погрешностью.
𝑢𝑢6 =
62
Содержание
4. АНАЛИЗ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА
4.1. Характеристика взаимосвязей признаков
В практических исследованиях редко приходится иметь дело с точными
и определенными функциональными связями, когда каждому значению одной
величины соответствует строго определенное значение другой величины.
Чаще встречаются такие соотношения между переменными, когда каждому
значению количественного признака 𝑋𝑋 соответствует не одно, а множество
возможных значений признака 𝑌𝑌.
При изучении таких связей возникают два основных вопроса – о тесноте
связи и о форме связи. Для измерения тесноты и формы связи используют методы теории корреляции и регрессии.
Признаки по их роли в изучаемой взаимосвязи делятся на два класса: факторные и результативные.
Факторными признаками (факторами) называются признаки, обусловливающие изменения других, связанных с ними признаков. Факторные признаки называются также независимыми или объясняющими и обозначаются
обычно
x = (x1, x2,…, xn).
Результативными называются признаки, изменяющиеся под действием
факторных признаков.
Результативные признаки называются также зависимыми или объясняемыми или выходными переменными и обозначаются обычно
y = (y1, y2,…, yn).
По направлению изменения связи подразделяются на прямые и обратные.
Связи называются прямыми, если изменение результативного и факторного признаков происходит в одном направлении, то есть, с ростом факторного признака растет и результативный признак.
Связи называются обратными, если изменение результативного и факторного признаков происходит в противоположных направлениях, то есть с
увеличением факторного признака результативный признак уменьшается.
При изучении большинства процессов и явлений в основном проявляются
статистические зависимости. Их так же называют вероятностными или стохастическими.
63
Содержание
Это зависимости, которые проявляются не в каждом отдельном случае, а
в общем, среднем при большом числе наблюдений. Но, тем не менее, рассматривая всю совокупность наблюдений можно отметить наличие определенной
зависимости между значениями признаков.
Стохастическая зависимость является более слабой, поскольку она не
имеет строго выраженного функционального характера. В отличие от функциональной, стохастическая связь возникает тогда, когда одна из величин зависит не только от другой, но и от ряда случайных факторов.
Частным случаем стохастической связи является корреляционная связь.
Корреляционной называется связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.
Приведем пример величин, связанных корреляционно.
Пример 4.1. Пусть Х − количество удобрений, а Y− урожай зерна. С одинаковых по площади участков земли при равных количествах внесенных удобрений снимают различный урожай. Таким образом, Y не является функцией
от X. Это объясняется влиянием различных случайных факторов: осадки, температура воздуха, близость к лесополосе, рельеф местности и др. Вместе с тем,
как показывает опыт, средний урожай зависит от количества удобрений, то
есть Y связан с X корреляционной зависимостью.
По аналитическому выражению выделяют связи линейные и нелинейные.
Линейной называется связь, в которой изменение результативного признака прямо пропорционально изменению факторных признаков. В противном
случае связь называется нелинейной.
Аналитически линейная корреляционная связь между явлениями может
быть представлена уравнением прямой линии на плоскости, либо уравнением
гиперплоскости в n-мерном пространстве (при наличии n факторных переменных).
4.2. Понятие регрессии
Уравнение корреляционной связи между фактором х и результативом y,
выраженное в виде математической зависимости, называется уравнением регрессии.
В зависимости от количества факторов, включенных в уравнение регрессии, принято различать простую (парную) и множественную регрессию.
64
Содержание
Парной регрессией называется уравнение регрессии, выражающее зависимость среднего значения зависимой переменной y от одной независимой переменной х, то есть это модель вида
(4.1)
ŷ = f(x),
где ŷ – зависимая переменная (результативный признак); х – независимая,
объясняющая переменная (признак – фактор).
Множественной регрессией называют уравнение регрессии, выражающее зависимость среднего значения зависимой переменной y от нескольких
независимых переменных х1, х2, …, хn то есть модель вида
ŷ = f(х1, х2, …, хn).
(4.2)
Любое исследование начинается со спецификации модели, то есть формулировки вида модели исходя из соответствующей связи между переменными.
В первую очередь, из всего круга факторов, влияющих на результативный
признак, необходимо выделить наиболее существенно влияющие факторы.
Замечание. Парная регрессия применяется, если имеется доминирующий
фактор, обуславливающий большую долю изменения изучаемой объясняемой
переменной, который и используется в качестве объясняющей переменной.
Множественная регрессия применяется в ситуациях, когда из множества факторов, влияющих на результативный признак, нельзя выделить один доминирующий фактор и необходимо учитывать одновременное влияние нескольких
факторов.
Рассмотрим задачу: по имеющимся данным n наблюдений за совместным
изменением двух переменных показателей x и y {(xi,yi), i=1,2,...,n} необходимо
определить аналитическую зависимость ŷ = f(x), наилучшим образом описывающую данные наблюдений.
Результаты наблюдений удобно представлять в виде таблицы:
Содержание
65
Таблица 4.1 − Данные наблюдений
1
xi
x1
yi
y1
2
x2
y2
3
x3
y3
…
n
…
xn
…
yn
Каждая строка таблицы представляет собой результат одного наблюдения
(xi, yi).
Поясним понятие зависимости ŷ = f(x), наилучшим образом описывающей
данные наблюдений.
Значения xi, yi из каждой строки можно рассматривать как координаты
точки (xi, yi) на координатной плоскости Оxy.
Совокупность всех точек (xi, yi) на координатной плоскости xОy называют
полем корреляции (рисунок 4.1):
y
x
Рисунок 4.1 − Поле корреляции
Зависимости ŷ = f(x) соответствует некоторая кривая на плоскости. Чем
ближе данная кривая подходит ко всем точкам поля корреляций, тем лучше
зависимость ŷ = f(x) описывает исходные данные.
На рисунке 4.2 изображена лучшая линейная регрессия.
Для формализации этого понятия рассмотрим разность εi между наблюдаемыми значениями yi и расчетными (теоретическими, модельными) значениями ŷi = f(xi):
εi = yi – ŷi .
Содержание
66
Наилучшей будем считать такую зависимость, для которой сумма квадратов отклонений принимает минимальное значение, то есть
n
∑ ( yi − ŷi ) → min .
2
i =1
(4.3)
y
x
Рисунок 4.2 − Лучшая линейная регрессия
4.3. Средняя ошибка аппроксимации
Фактические значения результативного признака y отличаются от теоретических, рассчитанных по уравнению регрессии, то есть ŷ . Чем меньше эти
отличия, тем ближе теоретические значения к эмпирическим данным, тем
лучше качество модели.
Величина отклонений фактических и расчетных значений результативного признака по каждому наблюдению
yi – ŷi
представляет собой ошибку аппроксимации.
В отдельных случаях ошибка аппроксимации может оказаться равной
нулю, либо принимать как положительные, так и отрицательные значения.
Например, для одного наблюдения y – ŷ = 5, а для другого y – ŷ = –10. Однако,
это не означает, что во втором случае модель дает вдвое худший результат.
Для сравнения используют величины отклонений, выраженные в процентах к фактическим значениям.
Поскольку (yi – ŷi) может быть величиной как положительной, так и отрицательной, ошибки аппроксимации для каждого наблюдения принято определять в процентах по модулю.
Отклонения | yi – ŷi | можно рассматривать как абсолютную ошибку ап𝑦𝑦 𝑦𝑦�
проксимации, а � 𝑖𝑖− 𝑖𝑖 � − как относительную ошибку аппроксимации.
𝑦𝑦𝑖𝑖
67
Содержание
Для того, чтобы иметь общее суждение о качестве модели, из относительных отклонений по каждому наблюдению находят среднюю ошибку аппроксимации, выраженную в процентах:
𝑛𝑛
𝑦𝑦𝑖𝑖− 𝑦𝑦�𝑖𝑖
1
�� ∙ 100%.
𝐴𝐴̅ = ∙ �� �
𝑛𝑛
𝑦𝑦𝑖𝑖
(4.4)
𝑖𝑖=1
Средняя ошибка аппроксимации в пределах 5-7% свидетельствует о хорошем подборе модели к исходным данным.
4.4. Линейная парная регрессия
Линейная парная регрессия описывается уравнением
ŷ = a0 + a1·x
(4.5)
Построение линейной регрессии сводится к оценке ее параметров a0 и a1.
Классический подход к определению параметров линейной регрессии основан на методе наименьших квадратов (МНК). Суть его заключается в том,
чтобы сумма квадратов отклонений фактических значений результативного
признака у от расчетных (теоретических) ŷ была минимальной:
n
S = ∑ ( yi − ŷi )2 → min ,
i =1
(4.6)
где yi – фактическое (наблюдаемое) значение, ŷi – теоретическое или прогнозируемое значение: ŷi = a0 + a1·𝑥𝑥𝑖𝑖 .
С учетом вида линейной парной регрессии (4.5) величина S является
функцией неизвестных параметров а0 и а1:
n
S ( ао , а1 ) = ∑ ( yi − а0 − а1 хi )2 → min
i =1
(4.7)
Задача свелась к нахождению минимума функции двух переменных
𝑆𝑆(𝑎𝑎𝑜𝑜 , 𝑎𝑎1 ).
Так как в данной задаче а0 и а1 являются переменными, то необходимо
найти частные производные по этим переменным и приравнять их к нулю:
 ∂S
 ∂a = 0
 0
.
(4.8)

S
∂

 ∂a = 0
 1
Найдем частные производные (в данном случае 𝑦𝑦𝑖𝑖 и 𝑥𝑥𝑖𝑖 являются константами):
𝑛𝑛
𝜕𝜕𝑆𝑆
= � 2(𝑦𝑦𝑖𝑖 − 𝑎𝑎0 − 𝑎𝑎1 𝑥𝑥𝑖𝑖 ) ∙ (−1);
𝜕𝜕𝑎𝑎0
𝑖𝑖=1
68
Содержание
𝑛𝑛
𝜕𝜕𝑆𝑆
= � 2(𝑦𝑦𝑖𝑖 − 𝑎𝑎0 − 𝑎𝑎1 𝑥𝑥𝑖𝑖 ) ∙ (−𝑥𝑥𝑖𝑖 ).
𝜕𝜕𝑎𝑎1
𝑖𝑖=1
Вынесем общий множитель 2 за знак суммы и перегруппируем слагаемые, в
результате система (4.8) примет следующий вид:
2( − ∑n y + ∑n а + ∑n а х ) = 0
/ :2
i
0
1 i

i =1
i =1
i =1
.

n
n
n
2( − ∑ y х + ∑ а х + ∑ а х 2 ) = 0
/ :2
i i
0 i
1 i

i =1
i =1
i =1
Разделив каждое уравнение системы (4.9) на 2, получим
− ∑n y + ∑n а + ∑n а х = 0
 i =1 i i =1 0 i =1 1 i

.

n
n
n
− ∑ y х + ∑ а х + ∑ а х 2 = 0

 i =1 i i i =1 0 i i =1 1 i
Рассмотрим второе слагаемое первого уравнения системы (4.10)
(4.9)
(4.10)
n
∑ а0 = a0 + a0 + ... + a0 = a0 n .
i =1

n раз
Тогда, окончательно получим систему линейных уравнений для определения
параметров а0 и а1:
а n + a ∑n x = ∑n y
0
1
i
i
i =1
i =1

.
(4.11)

n
n
n
а ∑ x + a ∑ x 2 = ∑ x y
 0 i=1 i 1 i=1 i i=1 i i
Решив систему уравнений (4.11) по формулам Крамера, найдем искомые
значения параметров а0 и а1.
Рассмотрим интерпретацию параметров уравнения линейной регрессии.
Коэффициент а1 при факторной переменной x показывает насколько изменится в среднем величина y при изменении фактора x на единицу.
Пример 4.2. Допустим, что зависимость между затратами (тыс. руб.) и
объемом выпуска продукции описывается соотношением
y = 35000 + 0,58·x.
В этом случае увеличение объема выпуска на 1 единицу потребует дополнительных затрат на 580 рублей.
Содержание
69
Что касается свободного члена a0 в уравнении (4.5), то в случае, когда
переменная x представляет собой время, он показывает состояние явления в
начальный момент времени.
В других случаях, параметр a0 может не иметь экономической интерпретации, а определяет некоторое начальное состояние (в общем случае ординату
точки пересечения прямой линии (4.5) с осью 𝑂𝑂𝑦𝑦).
Пример 4.3. Имеются данные об изменении расхода топлива Q (л/км) автомобиля при изменении скорости его движения V (км/ч) (таблица 4.2).
Получить уравнение линейной регрессии, отражающее зависимость расхода топлива от скорости автомобиля Q(V). Оценить качество модели с помощью средней ошибки аппроксимации.
Таблица 4.2 − Исходные данные задачи
№
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
V(км/ч)
33
36
54
56
79
57
68
73
57
48
61
59
65
47
58
77
62
61
74
56
Q(л/ч)
0,15
0,18
0,26
0,29
0,45
0,29
0,42
0,41
0,28
0,26
0,34
0,32
0,37
0,23
0,31
0,43
0,38
0,36
0,44
0,25
Решение. Уравнение линейной регрессии зависимости Q(V) имеет вид
ŷ = а0 +а1·x.
Нахождение неизвестных а0 и а1 сводится к решению системы линейных
уравнений (4.11)
Содержание
70
а n + a ∑n x = ∑n y
0
1
i
i
i =1
i =1

.

n
n
n
а ∑ x + a ∑ x 2 = ∑ x y
 0 i=1 i 1 i=1 i i=1 i i
Для решения указанной системы используем формулы Крамера:
a0 =
∆a
∆a0
, a1 = 1 ,
∆
∆
(4.12)
где ∆ - определитель матрицы системы:
n
∑ xi
n
i =1
∆=
n
n
∑ xi
i =1
,
(4.13)
2
∑ xi
i =1
∆a0 и ∆a1 - определители, получаемые из ∆ заменой 1-го и 2-го столбца соответственно на столбец свободных членов (правых частей уравнений системы):
n
n
∑ yi
∆a0 =
∑ xi
i =1
i =1
n
∑ xi yi
i =1
n
n
∑ yi
n
∆a1 =
,
2
n
i =1
∑ xi
∑ xi
i =1
i =1
.
n
∑ xi yi
i =1
Вычислим определители (4.13) и (4.14):
n
∆=
n
∑ xi
i =1
n
∑ yi
∆a0 =
i =1
n
∑ xi yi
i =1
n
∆a1 =
n
∑ xi
i =1
n
∑ xi
i =1
=
n
2
i
∑x
i =1
20
1181
1181
72539
6,42
1181
= 56019;
n
∑ xi
i =1
n
=
2
i
∑x
i =1
= − 4774,59;
398,37 72539
n
∑ yi
i =1
n
∑ xi yi
i =1
=
20
6,42
= 385,38.
1181 398,37
(4.14)
Содержание
71
Таблица 4.3 – Расчетная таблица для определения коэффициентов линейной
регрессии и средней ошибки аппроксимации
№
X=V
Y =Q
XY
X2
ŷ
yi − ŷi
yi
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
33
36
54
56
79
57
68
73
57
48
61
59
65
47
58
77
62
61
74
56
1181
0,15
0,18
0,26
0,29
0,45
0,29
0,42
0,41
0,28
0,26
0,34
0,32
0,37
0,23
0,31
0,43
0,38
0,36
0,44
0,25
6,42
4,950
6,480
14,040
16,240
35,550
16,530
28,560
29,930
15,960
12,480
20,740
18,880
24,050
10,810
17,980
33,110
23,560
21,960
32,560
14,000
398,370
1089
1296
2916
3136
6241
3249
4624
5329
3249
2304
3721
3481
4225
2209
3364
5929
3844
3721
5476
3136
72539
0,142
0,162
0,286
0,300
0,458
0,307
0,383
0,417
0,307
0,245
0,334
0,321
0,362
0,238
0,314
0,444
0,341
0,334
0,424
0,300
6,420
0,055
0,098
0,101
0,035
0,018
0,058
0,089
0,017
0,096
0,058
0,016
0,002
0,022
0,035
0,012
0,034
0,102
0,071
0,037
0,200
1,155
�
Вычислим искомые коэффициенты уравнения линейной регрессии по
формулам (4.12):
∆a - 4774,590
a0 = 0 =
= − 0,085;
∆
56019
a1 =
∆a1 385,380
=
= 0,007.
∆
56019
Полученные значения а0 и а1, подставим в уравнение линейной регрессии
ŷ = a0 + a1·x, тогда искомое уравнение регрессии будет иметь вид:
ŷ = − 0,085 + 0,007∙х.
(4.15)
Для оценки качества модели найдем среднюю ошибку аппроксимации по
формуле:
𝑛𝑛
1
𝑦𝑦𝑖𝑖− 𝑦𝑦�𝑖𝑖
𝐴𝐴̅ = ∙ �� �
�� ∙ 100%.
𝑛𝑛
𝑦𝑦𝑖𝑖
𝑖𝑖=1
Содержание
72
Для этого рассчитаем теоретические значения функции ŷ , подставив в
уравнение (4.15) значения хi и вычислим
yi − ŷi
(таблица 4.3).
yi
Тогда средняя ошибка аппроксимации равна
1
⋅1,115 ⋅100 % = 5,78 %,
20
что говорит о хорошем подборе модели к исходным данным.
А=
4.5. Параболическая парная регрессия
Если при равномерном возрастании x значения y возрастают или убывают ускоренно, то чаще всего в этом случае зависимость между коррелируемыми величинами может быть выражена в виде параболы второго порядка
(4.16)
ŷ = а0 + а1·х + а2·х2.
Применим метод наименьших квадратов
n
S = ∑ ( yi − ŷi )2 → min ,
i =1
где yi – фактическое значение, ŷi – теоретическое или прогнозируемое значение: ŷi = φ (x, a0, a1, a2).
С учетом вида параболической регрессии (4.16) величина S является
функцией неизвестных параметров a0, a1, a2:
n
S ( ао , а1 , a2 ) = ∑ ( yi − а0 − а1 хi − a2 xi2 )2 → min
i =1
(4.17)
Для решения задачи на нахождение минимума функции необходимо решить систему
Найдем частные производные:
 ∂S
 ∂a = 0
 0

 ∂S
=0 .

a
∂
 1

 ∂S = 0

 ∂a2
(4.18)
Содержание
73
n
 ∂S
=
2
( yi − a0 − a1 xi − a2 xi2 ) ⋅ ( −1 )
∑
 ∂a
i =1
 0

n
 ∂S
= 2 ∑ ( yi − a0 − a1 xi − a2 xi2 ) ⋅ ( − xi ) .

i =1
 ∂a1

 ∂S = 2 ∑n ( y − a − a x − a x 2 ) ⋅ ( − x 2 )
i
i
0
1 i
2 i

i =1
 ∂a2
Преобразовав уравнения системы (4.18), получим
2( − ∑n y + ∑n а + ∑n а х + ∑n а х 2 ) = 0
/ :2
 i =1 i i =1 0 i =1 1 i i =1 2 i

n
n
n
n

2
3
/ :2 .
2( − ∑ yi хi + ∑ а0 хi + ∑ а1 хi + ∑ а2 х i ) = 0
i =1
i =1
i =1
i =1


n
n
n
n
2
2
3
4
/ :2
2( −i∑=1 yi х i + i∑=1 а0 хi + i∑=1 а1 хi + i∑=1 а2 хi ) = 0
(4.19)
(4.20)
Отсюда, получим следующую систему линейных уравнений для оценки
параметров a0, a1, a2:
а n + a ∑n x + a ∑n x 2 = ∑n y
1
2
i
i
i
 0
i =1
i =1
i =1

n
n
n
 n
2
3
(4.21)
а0 ∑ xi + a1 ∑ xi + a2 ∑ xi = ∑ xi yi .
i =1
i =1
i =1
i =1

 n 2
n
n
n
3
4
а
x
a
x
a
x
xi2 yi
+
+
=
∑
∑
∑
∑
 0 i=1 i
1
2
i
i
i =1
i =1
i =1
Решить эту систему уравнений относительно параметров а0, а1, а2 можно
по формулам Крамера:
∆a
∆a
∆a
a0 = 0 , a1 = 1 , a2 = 2 ,
(4.22)
∆
∆
∆
где ∆ − определитель матрицы системы уравнений (4.21)
n
∑ xi
n
i =1
n
∆ = ∑ xi
i =1
n
2
n
2
∑ xi
i =1
n
3
∑ xi ∑ xi
i =1
i =1
n
2
∑ xi
i =1
n
3
∑ xi ,
i =1
n
4
∑ xi
i =1
(4.23)
Содержание
74
а ∆a0 , ∆a1 , ∆a2 − определители, получаемые из ∆ заменой 1-го, 2-го и 3-го
столбца соответственно на столбец свободных членов (правых частей уравнений системы (4.21)), то есть
n
n
∑ yi
i =1
n
n
i =1
3
∑ xi yi ∑ xi
i =1
i =1
n
i =1
4
n
n
2
i =1
n
i =1
n
2
∑ xi
n
i =1
n
n
∆а2 = ∑ xi
2
∑ xi
i =1
i =1
n
2
∑ xi
3
∑ xi
i =1
i =1
(4.25)
4
∑ xi
i =1
n
3
∑ xi ,
∑ xi yi
i =1
2
∑ xi
i =1
∑ xi
n
n
(4.24)
∑ xi
∑ xi yi
i =1
n
i =1
n
n
∆а1 = ∑ xi
3
∑ xi ,
i =1
∑ yi
n
n
2
n
2
i =1
∑ xi
i =1
2
∑ xi
i =1
∆а0 = ∑ xi yi
n
n
∑ xi
i =1
n
∑ yi
i =1
n
∑ xi yi .
i =1
n
(4.26)
2
∑ xi yi
i =1
4.6. Гиперболическая парная регрессия
Обратная зависимость между двумя величинами (когда с увеличением x
уменьшается y) может выражаться уравнением гиперболы
a
(4.27)
ŷ = a0 + 1 .
x
Применим метод наименьших квадратов
n
S = ∑ ( yi − ŷi )2 → min .
i =1
С учетом вида гиперболической регрессии (4.27) величина S является
функцией неизвестных параметров a0, a1
2

a 
S ( ао , а1 ) = ∑  yi − а0 − 1  → min
(4.28)
i =1
x
i 

Для решения задачи на нахождение минимума функции двух переменных
a0, a1 решим систему:
n
Содержание
75
 ∂S
 ∂a = 0
 0
.

∂
S

 ∂a = 0
 1
(4.29)
Найдем частные производные:
n
a1
 ∂S
(
y
a
) ⋅ ( −1 )
=
−
−
2
∑
0
i
 ∂a
i =1
x
i
 0
.
(4.30)

n
S
∂
a
1

1
 ∂a = 2i∑=1( yi − a0 − x ) ⋅ ( − x )
i
i
 1
В этом случае система (4.29) примет вид:
n а
n
n

1
(
y
а
)=0
/ :2
2
−
+
+
∑
∑
∑
i
0

i =1 х
i =1
i =1
i

.
(4.31)

n
n
n
y
а
а

(
2
/ :2
−
∑ i + ∑ 0 + ∑ 12 ) = 0

i =1 х
i =1 х
i =1 х
i
i
i

Преобразовав уравнения (4.31), получим следующую систему уравнений
для оценки параметров а0 и а1
n
n 1

а
n
a
yi
+
=
∑
∑
1
 0
i =1
i =1 x
i

.
(4.32)

n
n
n
y
1
1

а
∑ + a1 ∑ 2 = ∑ i
0
 i=1 x
i =1 x
i =1 x
i
i
i

Для решение системы (4.32) относительно неизвестных а0, а1 так же воспользуемся методом Крамера
∆a
∆a
a0 = 0 , a1 = 1 ,
∆
∆
где ∆ − определитель матрицы системы уравнений (4.32),
n 1
n
∑
i =1 x
i
∆=
,
n 1
n 1
∑
∑ 2
i =1 x
i =1 x
i
i
(4.33)
а ∆а0 и ∆а1 − определители, получаемые из ∆ заменой 1-го и 2-го столбца
соответственно на столбец свободных членов (правых частей уравнений системы (4.32)), то есть
Содержание
76
n
∑ yi
∆а0 =
i =1
1
i =1 x
i
n
∑
1
∑ 2
i =1 x
i
n
n
∑ yi
n
∆а1 =
(4.34)
,
y
∑ i
i =1 x
i
n
i =1
1
∑
i =1 x
i
n
y
∑ i
i =1 x
i
n
(4.35)
.
4.7. Полулогарифмическая парная регрессия
Полулогарифмическая зависимость описывается уравнением
ŷ = a0 + a1 ⋅ ln x .
(4.36)
Оценки параметров 𝑎𝑎0 и 𝑎𝑎1 могут быть найдены, как и ранее, методом
наименьших квадратов
n
S = ∑ ( yi − ŷi )2 → min .
i =1
С учетом вида полулогарифмической регрессии (4.36) величина S является функцией неизвестных параметров a0, a1
S ( ао , а1 ) = ∑ ( yi − а0 − a1 ln xi ) → min
n
2
i =1
(4.37)
Для решения задачи на нахождение минимума функции двух переменных
a0, a1 решим систему уравнений:
 ∂S
 ∂a = 0
 0
.

 ∂S
 ∂a = 0
 1
Найдем частные производные
n
 ∂S
2
( yi − a0 − a1 ln xi ) ⋅ ( −1 )
=
∑
 ∂a
i =1
 0
.

n
S
∂

 ∂a = 2i∑=1( yi − a0 − a1 ln xi ) ⋅ ( − ln xi )
 1
Преобразовав уравнения системы (4.38), получим
(4.38)
(4.39)
Содержание
77
2( − ∑n y + ∑n а + ∑n a ln x ) = 0
/ :2
i
i
0
1

i =1
i =1
i =1

.
(4.40)

n
n
n
2( − ∑ y ln x + ∑ a ln x + ∑ a (ln x )2 ) = 0
/ :2
i
i
i
i
0
1

i =1
i =1
i =1

Отсюда, получим следующую систему уравнений для оценки параметров а0 и
а1:
а n + a ∑n ln x = ∑n y
i
i
1
 0
i =1
i =1
.
(4.41)

n
n
n
2
а ∑ ln x + a ∑ (ln x ) = ∑ y ln x
i
i
i
 0 i =1 i 1 i =1
i =1
Решим систему (4.41) относительно неизвестных а0 и а1 по формулам Крамера:
∆a
∆a
a0 = 0 , a1 = 1 ,
∆
∆
где ∆ − определитель матрицы системы уравнений (4.41)
n
∑ ln xi
n
i =1
∆=
,
n
n
i =1
i =1
(4.42)
2
∑ ln xi ∑ (ln xi )
а ∆а0 и ∆а1 - определители, получаемые из ∆ заменой 1-го и 2-го столбца
соответственно на столбец свободных членов (правых частей уравнений системы (4.41)), то есть
n
n
∑ yi
∆а0 =
∑ ln xi
i =1
i =1
∑ yi ln xi
∑ (ln xi )
i =1
n
∆а1 =
,
n
n
(4.43)
2
i =1
n
∑ yi
i =1
.
n
n
i =1
i =1
(4.44)
∑ ln xi ∑ yi ln xi
4.8. Степенная парная регрессия
Степенная зависимость описывается уравнением
𝑦𝑦� = 𝑎𝑎0 ∙ 𝑥𝑥 𝑎𝑎1 .
(4.45)
Уравнение (4.45) является нелинейным относительно оцениваемых параметров 𝑎𝑎0 и 𝑎𝑎1 .
Содержание
78
Поэтому для оценки параметров степенной регрессии применяется метод наименьших квадратов к линеаризованному уравнению. Прологарифмируем уравнение (4.45)
ln 𝑦𝑦� = ln(𝑎𝑎0 ∙ 𝑥𝑥 𝑎𝑎1 ).
(4.46)
Используя свойства логарифма, преобразуем правую часть уравнения
(4.46)
(4.47)
ln(𝑎𝑎0 ∙ 𝑥𝑥 𝑎𝑎1 ) = ln 𝑎𝑎0 + ln 𝑥𝑥 𝑎𝑎1 = ln 𝑎𝑎0 + 𝑎𝑎1 ln 𝑥𝑥.
Тогда, с учетом (4.46), получим линеаризованное уравнение
(4.48)
ln ŷ = ln a0 + a1 ln x .
Применим метод наименьших квадратов к линеаризованному уравнению
(4.48)
n
S = ∑ (ln yi − ln ŷi )2 → min .
i =1
Величина S является функцией неизвестных параметров a0 и a1
S ( ао , а1 ) = ∑ (ln yi − ln а0 − a1 ln xi ) → min .
n
2
i =1
(4.49)
Для решения задачи нахождение минимума функции двух переменных a0
, a1 решим систему:
 ∂S
 ∂a = 0
 0
.

 ∂S
 ∂a = 0
 1
(4.50)
Найдем частные производные.
n
1
 ∂S
=
−
−
⋅
−
(ln
y
ln
a
a
ln
x
)
(
)
2
∑
0
1
i
i
 ∂a
i =1
a
0
0

.

n
 ∂S
 ∂a = 2i∑=1(ln yi − ln a0 − a1 ln xi ) ⋅ ( − ln xi )
 1
(4.51)
Преобразовав уравнения системы (4.50), получим
n
n
n
2
2
−
+
+
=
(
ln
y
ln
а
a
ln
x
)
/
:
0
∑
∑
∑
i
i
0
1
a
i =1
i =1
a0
 0 i =1
.
(4.52)

n
n
n

2
/ :2
2( −i∑=1ln yi ln x i + i∑=1ln a0 ln xi + i∑=1 a1(ln xi ) ) = 0
Отсюда, получим следующую систему уравнений для оценки параметров а0 и
а1:
Содержание
79
n ln а + a ∑n ln x = ∑n ln y
0
1
i
i
i =1
i =1

.

n
n
n
ln а ∑ ln x + a ∑ (ln x )2 = ∑ ln y ln x
1
i
i
i
 0 i =1 i
i =1
i =1
(4.53)
Решим систему (4.53) относительно неизвестных ln(а0) и а1 по формулам
Крамера:
∆a
∆ ln a0
ln a0 =
, a1 = 1 ,
∆
∆
где ∆ − определитель матрицы системы уравнений (4.53), то есть
n
∑ ln xi
n
i =1
∆=
(4.54)
,
n
n
i =1
i =1
2
∑ ln xi ∑ (ln xi )
а ∆ ln а0 и ∆а1 − определители, получаемые из ∆ заменой 1-го и 2-го столбца
соответственно на столбец свободных членов (правых частей уравнений системы (4.53)), то есть
n
n
∑ ln yi
∆ ln а0 =
∑ ln xi
i =1
i =1
n
∑ ln yi ln xi
i =1
n
∆а1 =
,
n
∑ (ln xi )
(4.55)
2
i =1
n
∑ ln yi
i =1
.
n
n
i =1
i =1
(4.56)
∑ ln xi ∑ ln yi ln xi
Параметр а1 вычисляется непосредственно по формуле, а параметр а0 −
после потенцирования величины ln 𝑎𝑎0 .
4.9. Показательная парная регрессия
Показательная зависимость между двумя переменными описывается
уравнением
(4.57)
𝑦𝑦� = 𝑎𝑎0 ∙ 𝑎𝑎1𝑥𝑥 .
Уравнение (4.57) является нелинейным относительно оцениваемых параметров 𝑎𝑎0 и 𝑎𝑎1 . Поэтому для оценки его параметров, как и в степенной регрессии применяется метод наименьших квадратов к линеаризованному уравнению.
Прологарифмируем уравнение (4.57).
ln 𝑦𝑦� = ln(𝑎𝑎0 ∙ 𝑎𝑎1𝑥𝑥 ).
Содержание
80
Используя свойства логарифма, преобразуем выражение в правой части
уравнения. в результате получим:
(4.58)
ln 𝑦𝑦� = ln 𝑎𝑎0 + 𝑥𝑥 ln 𝑎𝑎1 .
Применим метод наименьших квадратов к линеаризованному уравнению
(4.58)
n
S = ∑ (ln yi − ln ŷi )2 → min .
i =1
Величина S является функцией неизвестных параметров a0 и a1
2
S ( ао , а1 ) = ∑ (ln yi − ln а0 − xi ln a1 ) → min .
n
i =1
Для решения задачи на нахождение минимума функции двух переменных
a0 , a1 решим систему:
 ∂S
 ∂a = 0
 0
.
(4.59)

 ∂S
 ∂a = 0
 1
Найдем частные производные:
n
1
 ∂S
(ln yi − ln a0 − xi ln a1 ) ⋅ ( − )
2
=
∑
 ∂a
i =1
a0
 0
.
(4.60)

n
x
 ∂S
=
2
∑ (ln yi − ln a0 − xi ln a1 ) ⋅ ( − i )
 ∂a
i =1
a1
 1
Преобразовав правые части системы (4.60) с учетом (4.59), получим
n
n
n
2
2
−
+
+
=
0
(
ln
y
ln
а
x
ln
a
)
/
:
∑
∑
∑
0
1
i
i
a
i =1
i =1
i =1
a0
 0
.
(4.61)

n
n
n
2
2

2
/:
 a ( −i∑=1 xi ln yi + i∑=1 xi ln a0 + i∑=1 xi ln a1 ) = 0
a1
 1
Отсюда, получим следующую систему уравнений для оценки параметров а0 и
а1:
n ln а + ln a ∑n x = ∑n ln y
i
i
0
1

i =1
i =1

.
(4.62)

n
n
n
2
ln а ∑ x + ln a ∑ x = ∑ x ln y
i
i
i
1

i =1
i =1
 0 i =1 i
Система (4.62) может быть решена относительно ln(a0) и ln(a1) по формулам Крамера:
∆ ln a0
∆ ln a1
ln a0 =
, ln a1 =
,
∆
∆
Содержание
81
где ∆ − определитель матрицы системы уравнений (4.62), то есть
n
∑ xi
n
i =1
∆=
n
n
i =1
i =1
,
(4.63)
2
∑ xi ∑ xi
а ∆ ln а0 и ∆ ln а1 − определители, получаемые из ∆ заменой 1-го и 2-го
столбца соответственно на столбец свободных членов (правых частей уравнений системы (4.62)), то есть
n
∆ ln а0 =
n
∑ ln yi
∑ xi
i =1
i =1
n
∑ xi ln yi
i =1
n
∆ ln а1 =
n
,
(4.64)
.
(4.65)
2
∑ xi
i =1
n
∑ ln yi
i =1
n
n
i =1
i =1
∑ xi ∑ xi ln yi
Параметры а0 и а1 определяется путем потенцирования значений ln(a0) и
ln(a1) соответственно.
Приведем пример построения уравнения показательной регрессии.
Пример 4.4. Имеются данные об изменении расхода топлива Q (л/км) автомобиля при изменении скорости его движения V (км/ч) (таблица 4.2, примера 4.3).
Получить уравнение показательной регрессии, отражающее зависимость
расхода топлива от скорости автомобиля Q(V).
Оценить качество модели с помощью средней ошибки аппроксимации.
Решение. Уравнение показательной регрессии зависимости Q(V) имеет
вид
ŷ = a0 ⋅ a1x .
Нахождение неизвестных а0 и а1 сводится к решению системы линейных
уравнений (4.62)
n ln а + ln a ∑n x = ∑n ln y
i
0
1
i

i =1
i =1

.

n
n
n
ln а ∑ x + ln a ∑ x 2 = ∑ x ln y
i
i
i
1

i =1
i =1
 0 i =1 i
Для решения данной системы составим и вычислим определители
(4.63)−(4.65).
Содержание
82
n
∑ xi
n
i =1
∆=
n
n
∑ xi
∑ ln yi
1181
72539
= 56019;
i =1
∑ xi
i =1
i =1
n
n
∑ xi ln yi
=
2
∑ xi
i =1
− 23,506
1181
− 1321,682 72539
= −144210 ,988 ;
i =1
n
∑ ln yi
n
∆ ln а1 =
1181
n
n
∆ ln а0 =
2
∑ xi
i =1
20
=
i =1
n
n
i =1
i =1
=
∑ xi ∑ xi ln yi
20
− 23,506
1181 − 1321,682
= 1327 ,201.
Отсюда, по формулам Крамера, получим:
∆ ln a0 − 144210 ,988
ln a0 =
=
= −2 ,574 ,
∆
56019
ln a1 =
∆ ln a1 1327 ,201
=
= 0 ,024 .
∆
56019
Для нахождения неизвестных a0 и a1 потенцируем полученные величины,
то есть
a0 = eln a0 = e − 2 ,574 = 0 ,076 ,
a1 = eln a1 = e0 ,024 = 1,024 .
Полученные значения а0 и а1, подставим в уравнение показательной ре-
грессии ŷ = a0 ⋅ a1 .
Таким образом, уравнение показательной регрессии будет иметь вид
x
(4.66)
ŷ = 0 ,076 ⋅1,024 x .
Замечание. Данные для определения коэффициентов показательной регрессии рассчитаны в таблице 4.4.
Содержание
83
Таблица 4.4 − Данные для определения коэффициентов показательной регрессии и средней ошибки аппроксимации
№
X=V
Y =Q
X2
lnX
X·lnX
ŷ
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Сумма
33
36
54
56
79
57
68
73
57
48
61
59
65
47
58
77
62
61
74
56
1181
0,15
0,18
0,26
0,29
0,45
0,29
0,42
0,41
0,28
0,26
0,34
0,32
0,37
0,23
0,31
0,43
0,38
0,36
0,44
0,25
6,42
1089
1296
2916
3136
6241
3249
4624
5329
3249
2304
3721
3481
4225
2209
3364
5929
3844
3721
5476
3136
72539
-1,897
-1,715
-1,347
-1,238
-0,799
-1,238
-0,868
-0,892
-1,273
-1,347
-1,079
-1,139
-0,994
-1,470
-1,171
-0,844
-0,968
-1,022
-0,821
-1,386
-23,506
-62,605
-61,733
-72,742
-69,321
-63,082
-70,559
-58,990
-65,087
-72,559
-64,660
-65,807
-67,227
-64,626
-69,075
-67,929
-64,986
-59,990
-62,321
-60,753
-77,632
-1321,682
0,167
0,179
0,274
0,287
0,495
0,294
0,382
0,430
0,294
0,238
0,323
0,308
0,355
0,232
0,301
0,472
0,331
0,323
0,440
0,287
6,413
yi − ŷi
yi
0,110
0,007
0,054
0,010
0,101
0,014
0,091
0,048
0,050
0,086
0,049
0,036
0,039
0,009
0,029
0,098
0,129
0,102
0,000
0,149
1,211
Для оценки качества модели найдем среднюю ошибку аппроксимации:
−
1 n ( y − ŷ )
A = ⋅ ∑ i i ⋅100 %.
n i =1 y i
Для этого рассчитаем теоретические значения функции ŷ , подставив в
yi − ŷi
(таблица 4.4).
yi
Тогда средняя ошибка аппроксимации равна
1
А=
⋅ 1,211 ⋅ 100 % = 6,05 %,
20
что говорит о хорошем подборе модели к исходным данным.
Однако, если сравнить уравнение линейной регрессии, полученное в примере 4.2, и уравнение показательной регрессии, то можно сделать вывод, что
уравнение линейной регрессии лучше описывает исходные данные, так как
средняя ошибка аппроксимации для него была меньше и составила 5,78 %.
уравнение (4.66) значения хi и вычислим
Содержание
84
4.10. Оценка тесноты связи между факторами
Современная наука исходит из взаимосвязи всех явлений природы и общества. Невозможно управлять явлениями, предсказывать их развитие без
изучения характера, силы и других особенностей связей.
По силе связи между переменными различают слабые и сильные связи.
Задачи корреляционного анализа сводятся к изучению тесноты связи
между варьирующими признаками, определению неизвестных причинных
связей и оценке факторов, оказывающих наибольшее влияние на результативный признак.
Для измерения тесноты связи между факторами применяется несколько
показателей.
4.10.1. Линейный коэффициент корреляции
Уравнение регрессии всегда дополняется показателем тесноты связи. При
использовании линейной регрессии в качестве такого показателя выступает
линейный коэффициент корреляции. Иногда его называют линейный коэффициент парной корреляции.
Линейный коэффициент корреляции может быть вычислен по формуле
xy − x ⋅ y
rxy =
,
(4.67)
σ х ⋅σ у
где х − среднее значение факторного признака х
х =
n
∑ xi
i =1
n
;
(4.68)
y − среднее значение результативного признака у
y=
n
∑ yi
i =1
n
;
(4.69)
xy - среднее значение произведений хi yi
хy =
n
∑ хi yi
i =1
;
(4.70)
n
− среднее квадратическое отклонение факторного признака х от общей
σx
средней х
σx =
n
∑
i =1
(xi − x )2
n
=
x2 − x 2 ;
(4.71)
Содержание
85
σ у − среднее квадратическое отклонение результативного признака у от общей средней у
σу =
n
∑
i =1
(уi − у )2
=
y2 − y2 .
(4.72)
n
Линейный коэффициент корреляции rxy принимает значения в диапазоне
–1 ≤ rxy ≤ 1.
Чем ближе величина |rxy| к единице, тем теснее линейная связь и тем
лучше линейная зависимость согласуется с данными наблюдений.
При rxy > 0 связь является прямой, при rxy < 0 – обратной. Если |rxy| = 1,
то связь становится функциональной.
Для оценки тесноты связи применяют шкалу Чеддока (таблица 4.5)
Таблица 4.5 - Шкала Чеддока
Показатели
0,1 – 0,3
0,3 – 0,5
0,5 – 0,7
0,7 – 0,9
0,9 - 99
Характеристика
слабая
умеренная
заметная
высокая
весьма высокая
Однако, следует иметь в виду, что величина линейного коэффициента
корреляции оценивает тесноту связи рассматриваемых признаков в ее линейной форме. Поэтому близость к нулю величины линейного коэффициента корреляции еще не означает отсутствие связи между признаками. При иной спецификации модели (параболическая зависимость и т.п.) связь между признаками может оказаться достаточно тесной.
4.10.2. Коэффициент детерминации
Для оценки качества подбора линейной модели вычисляется квадрат линейного коэффициента корреляции rxy2 , называемый коэффициентом детерминации.
Коэффициент детерминации характеризует долю дисперсии результативного признака y, объясняемую регрессией, в общей дисперсии результативного признака.
Содержание
86
Иными словами, коэффициент детерминации показывает, какая часть общей вариации результативного признака y объясняется влиянием изучаемого
фактора x.
2
Соответственно величина 1 − rxy
характеризует долю дисперсии y, вызванную влиянием остальных не учтенных в модели факторов.
Например, если rxy2 =0,96, то уравнением регрессии (изучаемым фактором
х) объясняется 96% дисперсии результативного признака y, а на долю прочих
факторов (не включенных в уравнение регрессии) приходится 4% ее дисперсии, т.е. коэффициент детерминации показывает долю (%) тех изменений, которые в данном явлении зависят от изучаемого фактора. Коэффициент детерминации является более непосредственным и прямым способом выражения зависимости одной величины от другой, и в этом отношении он предпочтительнее коэффициента корреляции. В случаях где известно, что зависимая переменная 𝑦𝑦 находится в причинной связи с независимой переменной 𝑥𝑥, значение
𝑟𝑟 2 показывает ту долю элементов в вариации 𝑦𝑦, которая определена влиянием
𝑥𝑥.
4.10.3. Оценка значимости линейного коэффициента
корреляции
Показатели тесноты связи, вычисленные по данным сравнительно небольшой статистической совокупности, могут искажаться под действием случайных причин. Это вызывает необходимость проверки их существенности.
Для оценки значимости линейного коэффициента корреляции rxy применяется t-критерий Стьюдента, согласно которому выдвигается нулевая гипотеза H0 о статистической незначимости коэффициента линейной корреляции.
Эта гипотеза отвергается при выполнении условия
tr > tкрит,
где tr – фактическое значение t-критерия Стьюдента, определяется как
tr = rxy ·
n−2
,
1 − rxy2
(4.73)
tкрит – критическое (табличное) значение, определяется из таблицы значений
t-критерия Стьюдента (Приложение 7) с учётом заданного уровня значимости
𝛼𝛼 и числа степеней свободы k = n – 2.
87
Содержание
Напомним, что уровнем значимости (обозначается 𝛼𝛼) в статистических
гипотезах называется вероятность отвергнуть верную гипотезу (это, так называемая, ошибка первого рода). Уровень значимости α обычно принимает значения 0,05 и 0,01, что соответствует вероятности совершения ошибки первого
рода 5 % и 1 %.
Таким образом, вычисленное по формуле (4.73) значение tr, сравнивается
с tкрит. Если
tr > tкрит,
то величина линейного коэффициента корреляции признаётся существенной
(статистически значимой).
Соответственно, если
tr < tкрит,
то подтверждается нулевая гипотеза H0 о статистической незначимости
коэффициента линейной корреляции.
Замечание. Проверка гипотезы о значимости линейного коэффициента
корреляции равносильна проверке гипотезы о значимости уравнения линейной регрессии.
Пример 4.4. Используя данные примера 4.3, вычислить линейный коэффициент корреляции rxy, коэффициент детерминации rxy2 , пояснить полученные результаты.
Оценить значимость линейного коэффициента корреляции rxy с помощью
t-критерий Стьюдента.
Решение. Чтобы вычислить линейный коэффициент корреляции rxy, дополним таблицу 4.3 колонкой Y 2 и строкой средних значений, получим таблицу 4.6.
Средние значения, с учетом формул (4.68)−(4.70), определяются как
сумма, деленная на n = 20.
Вычислим среднее квадратическое отклонение факторного признака х от
общей средней х
σ x = x 2 − (x ) = 3626,95 − ( 59,05 )2 = 11,834
2
и среднее квадратическое отклонение результативного признака у от общей
средней у
σy =
( )2 =
y2 − y
0 ,110 − ( 0 ,321 )2 = 0 ,084 .
Тогда, коэффициент корреляции равен
Содержание
88
rxy =
xy − x ⋅ y 19 ,919 − 59 ,05 ⋅ 0 ,321
=
= 0,967.
11,834 ⋅ 0 ,084
σ x ⋅σ y
Таблица 4.6 - Данные для определения линейного коэффициента корреляции
0,142
0,162
0,286
0,300
0,458
0,307
0,383
0,417
0,307
0,245
0,334
0,321
0,362
0,238
0,314
0,444
0,341
0,334
0,424
0,300
6,420
yi − ŷi
yi
0,055
0,098
0,101
0,035
0,018
0,058
0,089
0,017
0,096
0,058
0,016
0,002
0,022
0,035
0,012
0,034
0,102
0,071
0,037
0,200
1,155
0,023
0,032
0,068
0,084
0,203
0,084
0,176
0,168
0,078
0,068
0,116
0,102
0,137
0,053
0,096
0,185
0,144
0,130
0,194
0,063
2,203
0,321
0,058
0,110
№
X=V
Y =Q
XY
X2
ŷ
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Сумма
Σ
Среднее
Σ
n
33
36
54
56
79
57
68
73
57
48
61
59
65
47
58
77
62
61
74
56
1181
0,15
0,18
0,26
0,29
0,45
0,29
0,42
0,41
0,28
0,26
0,34
0,32
0,37
0,23
0,31
0,43
0,38
0,36
0,44
0,25
6,42
4,950
6,480
14,040
16,240
35,550
16,530
28,560
29,930
15,960
12,480
20,740
18,880
24,050
10,810
17,980
33,110
23,560
21,960
32,560
14,000
398,370
1089
1296
2916
3136
6241
3249
4624
5329
3249
2304
3721
3481
4225
2209
3364
5929
3844
3721
5476
3136
72539
59,05
0,321
19,919
3626,95
Y2
По шкале Чеддока (Приложение 8) связь между переменными весьма высокая.
Так как rxy > 0, то связь между фактором х и результативом y прямая. То
есть, с увеличением скорости автомобиля V увеличивается расход топлива Q.
Коэффициент детерминации равен
rxy2 = 0 ,967 2 = 0 ,935 ,
то есть 93,5% вариации результативного признака y (расхода топлива) объясняется включенным в уравнение линейной регрессии (4.15) фактором х (изменением скорости автомобиля), а 6,5% приходится на долю факторов, не включенных в уравнение регрессии.
Содержание
89
Оценим значимость линейного коэффициента корреляции rxy с помощью
t-критерий Стьюдента. Для этого по формуле (4.73) найдем фактическое значение t-критерия Стьюдента
t r = rxy ⋅
n−2
20 − 2
= 0,967 ⋅
= 16,103 .
2
1 − 0,935
1 − rxy
Определим критическое значение tкрит по таблице значений t-критерия
Стъюдента (Приложение 7) с учётом уровня значимости 𝛼𝛼=0,05 и числа степеней свободы k = n –2 = 20 – 2 = 18:
tкрит = 2,1009.
Так как 16,103 > 2,1009 (tr > tкрит), то величина линейного коэффициента
корреляции признаётся существенной. Следовательно, и уравнение линейной
регрессии (4.15) статистически значимо.
4.10.4. Корреляция для нелинейной регрессии. Индекс
детерминации
Для статистической оценки тесноты связи в общем случае применяются
следующие показатели вариации.
1) Общая дисперсия результативного признака σ у2
n
∑ ( yi − y )
2
σ у2 = i =1
,
n
отображающая совокупное влияние всех факторов (рисунок 4.3).
(4.74)
y
*
*
*
*
x
Рисунок 4.3 – Иллюстрация отклонений ( yi − y )
Здесь y − среднее значение результатива y.
Отклонение ( yi − y ) обусловлено тем, что сочетание значений факторов,
влияющих на вариацию признака у, для каждой единицы анализируемой совокупности различно.
Содержание
90
n
∑ yi
y = i =1 .
n
2) Факторная дисперсия результативного признака σ у̂2
n
∑ ( ŷi − y )
2
σ у̂2 = i =1
,
(4.75)
n
отображающая вариацию у только от воздействия изучаемого фактора х (рисунок 4.4)
y
x
Рисунок 4.4 – Иллюстрация отклонений ( ŷi − y )
Отклонения ( ŷi − y ) характеризуют разброс значений у̂i относительно
средней величины y .
3) Остаточная дисперсия σ ε2
n
∑ ( yi − у̂i )
2
σ ε2 = i =1
,
(4.76)
n
отображающая вариацию результативного признака у от всех прочих, кроме х,
факторов (рисунок 4.5)
y
*
*
*
x
Рисунок 4.5 – Иллюстрация отклонений ( yi − ŷi )
Содержание
91
Отклонения ( yi − ŷi ) характеризуют колеблемость эмпирических (фактических) значений результативного признака уi от их выравненных значений у̂i
Общая дисперсия складывается из суммы факторной (объясненной уравнением регрессии) дисперсии и остаточной (обусловленной неучтенными факторами) дисперсий
2
σ у2 = σ у̂2 + σ ε .
(4.77)
Формулу (4.77) называют «правилом сложения дисперсий».
Соотношение между факторной и общей дисперсиями характеризует
меру тесноты связи между признаками х и у.
σ у̂2
σ у2
= R2.
(4.78)
Показатель R2 называется индексом детерминации. Он выражает долю
факторной дисперсии в общей дисперсии, то есть характеризует, какая часть
общей вариации результативного признака у объясняется изучаемым фактором х.
Из «правила сложения дисперсий» можно выразить
2
σ у̂2 = σ у2 – σ ε .
Тогда,
2
R =
σ у2 − σ ε2
σ у2
или
2
σ
ε
R2 = 1 − 2 .
σу
(4.79)
Таким образом, индекс детерминации может быть рассчитан так же по
формуле (4.79).
Так же из формулы (4.78) с учетом формул можно получить еще одну
формулу для расчета индекса детерминации
n
R2 =
σ у̂2
σ у2
2
∑ ( ŷi − y )
.
= i =n1
2
∑ ( yi − y )
i =1
(4.80)
Содержание
92
Замечание. При функциональной связи значения ŷi полностью совпа2
дают с соответствующими индивидуальными значениями уi. Тогда σ ε = 0.
В этом случае σ у̂2 = σ у2 , а при наличии корреляционной связи σ у̂2 < σ у2 .
4.10.5. Индекс корреляции
Уравнение нелинейной регрессии, так же, как и в линейной зависимости,
дополняется показателем тесноты связи, а именно индексом корреляции Rxy.
На основании формулы (4.78) определяется индекс корреляции Rxy
σ у̂2
Rxy =
σ у2
.
(4.81)
Так же индекс корреляции с учетом формул (4.79) и (4.80) может быть
вычислен по формулам
1−
Rxy =
σ ε2
σ у2
(4.82)
или
Rxy =
n
2
i =1
n
2
∑ ( ŷi − y )
∑ ( yi − y )
.
(4.83)
i =1
Замечание. По абсолютной величине линейный коэффициент корреляции rxy равен индексу корреляции Rxy только при линейной форме связи.
Индекс корреляции Rxy принимает значения в диапазоне
0 ≤ Rxy ≤ 1.
Чем ближе величина Rxy к единице, тем теснее связь между переменными
и тем лучше уравнение регрессии согласуется с данными наблюдений. Если
Rxy = 1, то связь становится функциональной.
Для характеристики тесноты связи, как и в случае линейной зависимости, применяют шкалу Чеддока (Приложение 8).
93
Содержание
4.10.6. Проверка качества уравнения регрессии. F-критерий
Фишера
Индекс детерминации R2 используется для проверки статистической значимости в целом уравнения нелинейной регрессии по F-критерию Фишера.
Согласно F-критерию Фишера, выдвигается «нулевая» гипотеза H0 о статистической незначимости уравнения регрессии. Эта гипотеза отвергается при
выполнении условия
FR > Fкрит,
где Fкрит определяется по таблицам F-критерия Фишера (Приложение 9) при
числах степеней свободы
k1 = m, k2 = n − m− 1
и заданному уровню значимости 𝛼𝛼. Здесь m− число параметров при переменных x.
Фактическое значение критерия FR определяется по формуле
R2 n − m −1
⋅
FR =
.
(4.84)
m
1− R2
Величина FR сравнивается с критическим значением Fкрит.
Если FR > Fкрит, то «нулевая» гипотеза о статистической незначимости
уравнения регрессии отвергается, и уравнения регрессии признается статистически значимым с надежностью 1− α.
В противном случае, если FR < Fкрит, принимается гипотеза о статистической незначимости уравнения регрессии.
Пример 4.5. Имеются данные об изменении расхода топлива Q (л/км) автомобиля при изменении скорости его движения V (км/ч) (пример 4.3, таблица
4.2).
Получено уравнение гиперболической регрессии, отражающее зависимость расхода топлива от скорости автомобиля Q(V)
17 ,466
.
ŷ = 0,632 −
x
Найти индекс детерминации R2, индекс корреляции Rxy. Оценить статистическую значимость уравнения гиперболической регрессии по F-критерию
Фишера.
Решение. Индекс детерминации R2 вычислим по формуле (4.80)
Содержание
94
n
2
i =1
n
2
∑ ( ŷi − y )
R2 =
∑ ( yi − y )
.
i =1
Для этого рассчитаем в таблице 4.7 соответствующие значения.
Вычислим индекс детерминации
n
2
∑ ( ŷi − y )
R2 =
i =1
n
2
∑ ( yi − y )
=
0 ,118
= 0 ,831 .
0 ,142
i =1
То есть 83,1% общей вариации результативного признака у (расхода топлива) объясняется изучаемым фактором х (изменением скорости движения автомобиля), а 16,9% - неучтенными в уравнении гиперболической регрессии
факторами.
Индекс корреляции вычислим по формуле (4.83)
Rxy =
n
2
i =1
n
2
∑ ( ŷi − y )
∑ ( yi − y )
= 0 ,831 = 0,912.
i =1
По шкале Чеддока (Приложение 8) связь между признаками x и y весьма
высокая.
Для оценки статистической значимости уравнения гиперболической регрессии применим F-критерий Фишера.
Фактическое значение критерия FR определим по формуле (4.84)
R2 n − m −1
⋅
FR =
,
m
1− R2
где m = 1− число параметров при переменной x.
0 ,831 20 − 1 − 1
= 88,50.
⋅
1 − 0 ,831
1
Значение Fкрит определим по таблице F-критерия Фишера (приложение 9)
с учётом уровня значимости 𝛼𝛼= 0,05 и чисел степеней свободы
k1 = m = 1, k2 = n− m− 1= 20−1−1=18.
Fкрит = 4,41.
FR =
Содержание
95
Таблица 4.7 – Данные для вычисления индекса детерминации
№
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Сумма
Среднее
V=x
Q=y
ŷ
33
36
54
56
79
57
68
73
57
48
61
59
65
47
58
77
62
61
74
56
1181
0,15
0,18
0,26
0,29
0,45
0,29
0,42
0,41
0,28
0,26
0,34
0,32
0,37
0,23
0,31
0,43
0,38
0,36
0,44
0,25
6,42
0,321
0,102
0,146
0,308
0,320
0,410
0,325
0,375
0,392
0,325
0,268
0,345
0,335
0,363
0,260
0,330
0,405
0,350
0,345
0,395
0,320
6,42
( ŷi − y )2
0,048
0,031
0,000
0,000
0,008
0,000
0,003
0,005
0,000
0,003
0,001
0,000
0,002
0,004
0,000
0,007
0,001
0,001
0,006
0,000
0,118
( yi − y )2
0,029
0,020
0,004
0,001
0,017
0,001
0,010
0,008
0,002
0,004
0,000
0,000
0,002
0,008
0,000
0,012
0,003
0,002
0,014
0,005
0,142
Так как 88,50 > 4,41 (FR > Fкрит), то уравнения гиперболической регрессии
признается статистически значимым с надежностью (вероятностью) 0,95.
Содержание
96
5. МЕТОДЫ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА
Пассивный эксперимент предусматривает накопление информации «в режиме нормальной эксплуатации», но это требует много времени и затрат. Поэтому, для ускорения процесса, предлагается активно вмешиваться в ход эксперимента, целенаправленно накапливая информацию. Программа «вмешательства» как раз и задается планом. Сам метод планирования может изменяться в зависимости от вида задачи, но принцип вмешательства остается.
Теория планирования эксперимента началась с работ знаменитого английского ученого Р. Фишера в 30-х годах XX столетия, использовавшего ее
для решения агробиологических задач. В дальнейшем это направление было
развито в пятидесятых годах в США Дж. Боксом и его сотрудниками. Отечественные ученые также внесли большой вклад в развитие теории эксперимента, предложив ряд новых методов, а инженеры-исследователи все шире
применяют эти методы на практике.
Под математической теорией планирования эксперимента будем понимать науку о способах составления экономичных экспериментальных планов,
которые позволяют извлекать наибольшее количество информации об объекте
исследования, о способах проведения эксперимента, о способах обработки
экспериментальных данных и их использования для оптимизации производственных процессов, а также инженерных расчетов.
5.1. Основные понятия и определения
Принятая терминология − это либо перевод терминов с английского, либо
просто их перенос в оригинале, и это необходимо иметь в виду при чтении
литературы по теории планирования экспериментов.
Истинный вид функции отклика 𝑦𝑦 = 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 , … , 𝑥𝑥𝑛𝑛 ) до эксперимента
чаще всего неизвестен, в связи с чем для математического описания поверхности отклика используют уравнение
𝑛𝑛
𝑛𝑛
𝑛𝑛
𝑖𝑖=1
𝑖𝑖,𝑗𝑗=1
𝑖𝑖≠𝑗𝑗
𝑖𝑖=1
𝑦𝑦 = 𝛽𝛽0 + � 𝛽𝛽𝑖𝑖 𝑥𝑥𝑖𝑖 + � 𝛽𝛽𝑖𝑖𝑗𝑗 𝑥𝑥𝑖𝑖 𝑥𝑥𝑗𝑗 + � 𝛽𝛽𝑖𝑖𝑖𝑖 𝑥𝑥𝑖𝑖2 + ⋯
(5.1)
где 𝑥𝑥𝑖𝑖 , 𝑥𝑥𝑗𝑗 − переменные факторы, 𝑖𝑖 = 1 … 𝑛𝑛, 𝑗𝑗 = 1 … 𝑛𝑛, 𝑖𝑖 ≠ 𝑗𝑗;
𝜕𝜕 2 𝑓𝑓
𝜕𝜕 2 𝑓𝑓
𝜕𝜕𝑓𝑓
𝛽𝛽𝑖𝑖𝑗𝑗 = �
� ,
𝛽𝛽𝑖𝑖𝑖𝑖 = �
� − коэффициенты.
𝛽𝛽𝑖𝑖 = � � ,
𝜕𝜕𝑥𝑥𝑖𝑖 𝜕𝜕𝑥𝑥𝑗𝑗
𝜕𝜕𝑥𝑥𝑖𝑖 0
2𝜕𝜕𝑥𝑥𝑖𝑖 2
0
0
Это уравнение является разложением в ряд Тейлора неизвестной функции
отклика в окрестности точки с координатами 𝑥𝑥𝑖𝑖 = 𝑥𝑥𝑖𝑖0 ; 𝑖𝑖 = 1 … 𝑛𝑛.
Содержание
97
На практике по результатам эксперимента производится обработка данных методом наименьших квадратов. Этот метод позволяет найти оценку 𝑏𝑏
коэффициентов 𝛽𝛽, и данный полином заменяется уравнением вида
𝑛𝑛
𝑛𝑛
𝑛𝑛
𝑖𝑖=1
𝑖𝑖,𝑗𝑗=1
𝑖𝑖≠𝑗𝑗
𝑖𝑖=1
𝑦𝑦� = 𝑏𝑏0 + � 𝑏𝑏𝑖𝑖 𝑥𝑥𝑖𝑖 + � 𝑏𝑏𝑖𝑖𝑗𝑗 𝑥𝑥𝑖𝑖 𝑥𝑥𝑗𝑗 + � 𝑏𝑏𝑖𝑖𝑖𝑖 𝑥𝑥𝑖𝑖2 + ⋯,
(5.2)
которое является регрессионной моделью (моделью регрессионного анализа).
В этом выражении 𝑦𝑦� означает модельное, т.е. рассчитываемое по уравнению
модели, значение выхода. Коэффициенты регрессии определяются экспериментально и служат для статистической оценки теоретических коэффициентов, т.е.
𝑏𝑏0 ≈ 𝛽𝛽0 ,
𝑏𝑏𝑖𝑖 ≈ 𝛽𝛽𝑖𝑖 ,
𝑏𝑏𝑖𝑖𝑗𝑗 ≈ 𝛽𝛽𝑖𝑖𝑗𝑗 ,
𝑏𝑏𝑖𝑖𝑖𝑖 ≈ 𝛽𝛽𝑖𝑖𝑖𝑖 .
В регрессионной модели члены второй степени 𝑥𝑥𝑖𝑖 𝑥𝑥𝑗𝑗 , 𝑥𝑥𝑖𝑖2 характеризуют
кривизну поверхности отклика. Чем больше кривизна этой поверхности, тем
больше в модели регрессии членов высшей степени. На практике чаще всего
стремятся ограничиться линейной моделью.
Последовательность активного эксперимента заключается в следующем:
1) разрабатывается схема проведения исследований, т.е. выполняется
планирование эксперимента. При планировании экспериментов
обычно требуется с наименьшими затратами и с необходимой точностью либо построить регрессионную модель процесса, либо определить его оптимальные условия;
2) осуществляется реализация опыта по заранее составленному исследователем плану, т.е. осуществляется сам активный эксперимент;
3) выполняется обработка результатов измерений, их анализ и принятие
решений.
Таким образом, планирование эксперимента − это процедура выбора
условий проведения опытов, их количества, необходимых и достаточных для
решения задач с поставленной точностью.
Использование теории планирования эксперимента обеспечивает:
− минимизацию, т.е. предельное сокращение необходимого числа опытов;
− одновременное варьирование всех факторов;
− выбор четкой стратегии, что позволяет принимать обоснованные решения после каждой серии опытов;
Содержание
98
− минимизацию ошибок эксперимента за счет использования специальных проверок.
Для иллюстрации некоторых из этих положений воспользуемся ставшим
уже классическим примером из книги В.В. Налимова, Т.И. Голиковой [7].
Рассмотрим пример хорошего и плохого эксперимента − взвешивание
трех объектов A, B, C на аналитических весах. Первый − традиционный подход предусматривает последовательное взвешивание каждого из образцов. Исследователь вначале делает холостое взвешивание для определения нулевой
точки весов, а затем по очереди взвешивает каждый из образцов. Это пример
традиционного использования однофакторного эксперимента, т.е. здесь исследователь изучает реакцию на поведение каждого из факторов в отдельности.
Традиционная схема взвешивания трех объектов представлена в таблице
5.1 (когда образец кладется на весы, в таблице ставится +1, когда он на весах
отсутствует, то −1).
Таблица 5.1 – Традиционное проведение эксперимента
Номер
А
В
С
Результат
опыта
взвешивания
1
2
3
4
−1
+1
−1
−1
−1
−1
+1
−1
−1
−1
−1
+1
𝑦𝑦0
𝑦𝑦1
𝑦𝑦2
𝑦𝑦3
Масса каждого объекта оценивается только по результатам двух опытов:
того опыта, в котором на весы был положен изучаемый объект, и холостого
опыта. Например, масса объекта A: 𝑚𝑚𝐴𝐴 = 𝑦𝑦1 − 𝑦𝑦0 . Как обычно, ошибка взвешивания предполагается независимой от взвешиваемой величины, аддитивной и имеющей одно и то же распределение. Тогда дисперсия измерения веса
образца следующая:
𝜎𝜎𝐴𝐴2 = 𝜎𝜎𝑦𝑦21 + 𝜎𝜎𝑦𝑦22 = 2𝜎𝜎 2 ,
(5.3)
где 𝜎𝜎 2 − дисперсия любого взвешивания.
Такими же будут и дисперсии весов образцов B и C.
Приведем теперь тот же эксперимент по несколько иной схеме, задаваемой матрицей планирования, приведенной в таблице 5.2.
тов
Таблица 5.2 − Планирование эксперимента при взвешивании трех объек-
Содержание
99
Номер
опыта
1
2
3
4
А
В
С
+1
−1
−1
+1
−1
+1
−1
+1
−1
−1
+1
+1
Результат
взвешивания
𝑦𝑦1
𝑦𝑦2
𝑦𝑦3
𝑦𝑦4
В первых трех опытах последовательно взвешивают объекты A, B, C, в
последнем опыте тоже взвешивают объекты A, B, C, но все три объекта вместе,
а «холостое» взвешивание не производится.
Легко заметить, что масса каждого объекта будет задаваться формулами:
1
𝑚𝑚𝐴𝐴 = (𝑦𝑦1 − 𝑦𝑦2 − 𝑦𝑦3 + 𝑦𝑦4 );
2
1
(5.4)
𝑚𝑚𝐵𝐵 = (𝑦𝑦2 − 𝑦𝑦1 − 𝑦𝑦3 + 𝑦𝑦4 );
2
1
𝑚𝑚𝐶𝐶 = (𝑦𝑦3 − 𝑦𝑦1 − 𝑦𝑦2 + 𝑦𝑦4 ).
2
Масса объекта A, вычисленная по приведенной выше формуле, оказывается не искаженной массами весов объектов B и C, так как масса каждого из
них входит в формулу для массы А дважды с разными знаками.
Найдем теперь дисперсию, связанную с ошибкой взвешивания, по новой
схеме постановки экспериментов:
1
𝜎𝜎𝐴𝐴2 = �𝜎𝜎𝑦𝑦21 + 𝜎𝜎𝑦𝑦22 + 𝜎𝜎𝑦𝑦23 + 𝜎𝜎𝑦𝑦24 � = 𝜎𝜎 2 .
(5.5)
4
Аналогичным образом находим:
𝜎𝜎𝐵𝐵2 = 𝜎𝜎 2 ,
𝜎𝜎𝐶𝐶2 = 𝜎𝜎 2 .
Мы видим, что при новой схеме дисперсия взвешивания получается вдвое
меньше, чем при традиционной схеме, хотя в обоих случаях на взвешивание
трех объектов затрачивалось по четыре опыта.
Зададимся вопросом: «В результате чего происходит увеличение точности экспериментов в два раза?».
В первом случае эксперимент был поставлен так, что каждую массу мы
получали лишь при двух взвешиваний. При новой схеме взвешивания каждая
масса вычислялась уже по результатам всех четырех взвешиваний.
Вторую схему можно назвать многофакторной, поскольку здесь оперируют всеми факторами так, что каждая масса вычислялась по результатам
сразу всех опытов, проведенных в данной серии экспериментов, − вот главная причина уменьшения дисперсии вдвое.
Содержание
100
Таким образом, использование теории планирования эксперимента может явиться одним из путей существенного повышения эффективности многофакторных экспериментальных исследований.
В планировании экспериментов применяются в основном планы первого
и второго порядков. Планы более высоких порядков используются в инженерной практике редко. В связи с этим далее приводится краткое изложение
методики составления планов эксперимента для моделей первого и второго
порядков.
Под планами первого порядка понимают такие планы, которые позволяют
провести эксперимент для отыскания уравнения регрессии, содержащего
только первые степени факторов и их произведения:
𝑛𝑛
𝑛𝑛
𝑛𝑛
𝑖𝑖=1
𝑖𝑖,𝑗𝑗=1
𝑖𝑖≠𝑗𝑗
𝑖𝑖,𝑗𝑗,𝑘𝑘=1
𝑖𝑖≠𝑗𝑗≠𝑘𝑘
𝑦𝑦� = 𝑏𝑏0 + � 𝑏𝑏𝑖𝑖 𝑥𝑥𝑖𝑖 + � 𝑏𝑏𝑖𝑖𝑗𝑗 𝑥𝑥𝑖𝑖 𝑥𝑥𝑗𝑗 + � 𝑏𝑏𝑖𝑖𝑗𝑗𝑘𝑘 𝑥𝑥𝑖𝑖 𝑥𝑥𝑗𝑗 𝑥𝑥𝑘𝑘 + ⋯
(5.6)
Планы второго порядка позволяют провести эксперимент для отыскания
уравнения регрессии, содержащего и вторые степени факторов:
𝑛𝑛
𝑛𝑛
𝑛𝑛
𝑖𝑖=1
𝑖𝑖,𝑗𝑗=1
𝑖𝑖≠𝑗𝑗
𝑖𝑖=1
𝑦𝑦� = 𝑏𝑏0 + � 𝑏𝑏𝑖𝑖 𝑥𝑥𝑖𝑖 + � 𝑏𝑏𝑖𝑖𝑗𝑗 𝑥𝑥𝑖𝑖 𝑥𝑥𝑗𝑗 + � 𝑏𝑏𝑖𝑖𝑖𝑖 𝑥𝑥𝑖𝑖2 + ⋯,
(5.7)
Нахождение уравнения регрессии методом планирования экспериментов
состоит из следующих этапов:
1) выбор основных факторов и их уровней;
2) планирование и проведение собственно эксперимента;
3) определение коэффициентов уравнения регрессии;
4) статистический анализ результатов эксперимента.
5.2. Планирование первого порядка
На первой стадии исследования обычно принимают полином первой степени. Так, для трехфакторной задачи теоретическое уравнение регрессии
имеет вид:
3
3
𝑖𝑖=1
𝑖𝑖,𝑗𝑗=1
𝑖𝑖≠𝑗𝑗
𝑦𝑦� = 𝛽𝛽0 + � 𝛽𝛽𝑖𝑖 𝑥𝑥𝑖𝑖 + � 𝛽𝛽𝑖𝑖𝑗𝑗 𝑥𝑥𝑖𝑖 𝑥𝑥𝑗𝑗 + 𝛽𝛽123 𝑥𝑥1 𝑥𝑥2 𝑥𝑥3 .
(5.8)
Уравнение регрессии, получаемое на основании результатов эксперимента, в отличие от приведенного теоретического уравнения, имеет вид:
Содержание
101
3
3
𝑖𝑖=1
𝑖𝑖,𝑗𝑗=1
𝑖𝑖≠𝑗𝑗
𝑦𝑦� = 𝑏𝑏0 + � 𝑏𝑏𝑖𝑖 𝑥𝑥𝑖𝑖 + � 𝑏𝑏𝑖𝑖𝑗𝑗 𝑥𝑥𝑖𝑖 𝑥𝑥𝑗𝑗 + 𝑏𝑏123 𝑥𝑥1 𝑥𝑥2 𝑥𝑥3 .
(5.9)
где коэффициенты регрессии 𝑏𝑏0 , 𝑏𝑏1 , ..., 𝑏𝑏3 , ..., 𝑏𝑏123 являются оценками для теоретических коэффициентов регрессии, т.е.
𝑏𝑏0 ≈ 𝛽𝛽0 ,
𝑏𝑏𝑖𝑖 ≈ 𝛽𝛽𝑖𝑖 ,
𝑏𝑏𝑖𝑖𝑗𝑗 ≈ 𝛽𝛽𝑖𝑖𝑗𝑗 ,
𝑏𝑏123 ≈ 𝛽𝛽123 .
Члены, содержащие произведения 𝑥𝑥1 𝑥𝑥2 , 𝑥𝑥1 𝑥𝑥3 и т.д., называют членами,
отражающими парное взаимодействие факторов, 𝑥𝑥1 𝑥𝑥2 𝑥𝑥3 — член тройного взаимодействия.
5.2.1. Выбор основных факторов и их уровней
В качестве факторов можно выбирать только контролируемые и управляемые переменные, т.е. такие, которые исследователь может поддерживать постоянными в течение каждого опыта на заданном уровне. В число факторов
должны быть включены параметры процесса, оказывающие наиболее сильное
влияние на функцию отклика.
Необходимо заметить, что, несмотря на всю заманчивость и очевидные
преимущества активного спланированного эксперимента перед пассивным, в
его применении имеется целый ряд трудностей, связанных с определенными
ограничениями на его реализацию. Важнейшим условием применимости этого
подхода является управляемость процессов по каждому из выбранных факторов, т.е. возможность независимого изменения каждого из этих факторов и
поддержания его на заданном уровне в период проведения опытов.
Для каждого фактора необходимо указать тот интервал изменения параметров, в пределах которого ставится исследование. Для этого на основе априорной информации устанавливаются ориентировочные значения факторов
𝑥𝑥10 , 𝑥𝑥20 , … , 𝑥𝑥𝑛𝑛0 . Этой комбинации значений факторов соответствует точка в многомерном факторном пространстве, которая принимается за исходную
точку. Координаты этой точки принимаются за основной (нулевой) уровень.
Интервалом варьирования факторов называется некоторое число (каждое для соответствующего фактора), прибавление которого к основному
уровню дает верхний, а вычитание − нижний пределы.
Для упрощения записи условий эксперимента и обработки экспериментальных данных масштабы по осям выбираются так, чтобы верхний уровень
составлял +1, нижний –1, а основной − 0.
Содержание
102
Для факторов с непрерывной областью определения это достигается с помощью преобразования (кодирования) факторов:
𝑥𝑥𝑖𝑖 − 𝑥𝑥𝑖𝑖0
.
(5.10)
𝑋𝑋𝑖𝑖 =
∆𝑥𝑥𝑖𝑖
В теории планирования экспериментов показано, что минимально необходимое число уровней факторов на единицу больше порядка уравнения.
5.2.2. Планирование эксперимента
Рассмотрим сначала частный случай, когда функция отклика зависит от
трех независимых факторов. Уравнение регрессии в этом случае имеет вид
(5.9), а план эксперимента представлен в таблице 5.3.
Таблица 5.3 − Таблица полного факторного эксперимента для трех факторов
План
Результат
Номер
𝑦𝑦𝑖𝑖
X0 Х1 Х2 Х3 Х1Х2 Х1Х3 Х2Х3 Х1Х2Х3
1
2
3
4
5
6
7
8
+1
+1
+1
+1
+1
+1
+1
+1
−1 −1
+1 −1
−1 +1
+1 +1
−1 −1
+1 −1
−1 +1
+1 +1
−1
−1
−1
−1
+1
+1
+1
+1
+1
−1
−1
+1
+1
−1
−1
+1
+1
−1
+1
−1
−1
+1
−1
+1
+1
+1
−1
−1
−1
−1
+1
+1
−1
+1
+1
−1
+1
−1
−1
+1
y1
y2
y3
y4
y5
y6
y7
y8
Здесь добавлен нулевой столбец фиктивной переменной 𝑋𝑋0 , нужный для
оценки свободного члена 𝑏𝑏0 . После реализации плана получают 8 уравнений с
8 неизвестными, их решение и даст оценку всех 8 коэффициентов регрессии
𝑏𝑏0 ,𝑏𝑏1 ,...,𝑏𝑏3 , ..., 𝑏𝑏123 .
План, в котором число опытов равно числу определяемых коэффициентов, называется насыщенным.
Заметим, что мы использовали все точки с «крайними» координатами, т.е.
±1, или, говоря другими словами, все возможные комбинации выбранных
уровней. В самом деле, всех возможных комбинаций 2𝑛𝑛 = 23 = 8 (𝑛𝑛 = 3 −
число факторов), и мы все их использовали.
Если эксперименты проводятся только на двух уровнях (при двух значениях факторов) и при этом в процессе эксперимента осуществляются все возможные неповторяющиеся комбинации из 𝑛𝑛 факторов, то постановка опытов
Содержание
103
по такому плану носит название полного факторного эксперимента (ПФЭ)
или 2𝑛𝑛 .
Иными словами, полный факторный эксперимент (ПФЭ) − это эксперимент, реализующий все возможные неповторяющиеся комбинации уровней
независимых факторов.
Кодированный план геометрически может быть интерпретирован в виде
куба, восемь вершин которого представляют собой восемь экспериментальных точек (рисунок 5.1).
𝑥𝑥3
𝑥𝑥1
𝑥𝑥2
Рисунок 5.1 – Геометрическая интерпретация ПФЭ
При числе факторов 𝑛𝑛 = 2 построение матрицы ПФЭ не вызывает затруднений, при увеличении же числа факторов возникает необходимость в некоторых специальных приемах построения матрицы.
Первый прием основан на чередовании знаков. В первом столбце (для 𝑋𝑋1 )
знаки чередуются поочередно. Во втором (для 𝑋𝑋2 ) − через 2, в третьем (для
𝑋𝑋3 )− через 4 и т.д. по степеням 2𝑘𝑘−1 , где 𝑘𝑘 – номер столбца.
Этот подход и использован при составлении плана, представленного в
таблице 5.3.
Второй прием основан на последовательном достраивании матрицы. Для
этого при добавлении нового фактора необходимо повторить комбинации
уровней исходного плана − сначала при значениях нового фактора на верхнем
уровне, а затем − на нижнем.
Матрица ПФЭ должна обладать следующими свойствами:
1) свойство симметричности: алгебраическая сумма элементов векторстолбца каждого фактора равна нулю (за исключением столбца, соответствующего свободному члену):
104
Содержание
𝑛𝑛
� 𝑋𝑋𝑖𝑖𝑗𝑗 = 0,
(5.11)
𝑖𝑖=1
где 𝑖𝑖 − номер опыта; 𝑗𝑗 − номер фактора;
2) свойство нормирования: сумма квадратов элементов каждого столбца
равна числу опытов:
𝑛𝑛
� 𝑋𝑋𝑖𝑖𝑗𝑗2 = 𝑛𝑛;
(5.12)
𝑖𝑖=1
3) свойство ортогональности: скалярное произведение всех векторстолбцов равно нулю:
𝑛𝑛
� 𝑋𝑋𝑖𝑖𝑗𝑗 𝑋𝑋𝑖𝑖𝑘𝑘 = 0, 𝑗𝑗 ≠ 𝑘𝑘.
(5.13)
𝑖𝑖=1
Планы, для которых выполняется свойство 3, называют ортогональными. Благодаря этому свойству уменьшаются трудности, связанные с расчетом коэффициентов уравнения регрессии.
Поскольку результаты наблюдений отклика носят случайный характер,
приходится в каждой точке плана проводить не один, а 𝑚𝑚 параллельных опытов (обычно 𝑚𝑚=2,3,4), осреднение результатов которых дает возможность
уменьшить погрешности оценки истинного значения отклика в √𝑚𝑚 раз.
В каждой серии экспериментов их последовательность рандомизируется,
т.е. с помощью таблиц случайных чисел определяется случайная последовательность реализации экспериментов. Рандомизация дает возможность свести
эффект некоторого случайного фактора к случайной погрешности. Это позволяет в определенной степени исключить предвзятость и субъективизм исследователя.
5.2.3. Вычисление коэффициентов уравнения регрессии
Воспользуемся свойствами ПФЭ для определения коэффициентов уравнения регрессии
𝑦𝑦� = 𝑏𝑏0 + 𝑏𝑏1 𝑥𝑥1 + 𝑏𝑏2 𝑥𝑥2
методом наименьших квадратов.
𝑛𝑛
𝑆𝑆(𝑏𝑏0 , 𝑏𝑏1 , 𝑏𝑏2 ) = �(𝑦𝑦𝑖𝑖 − 𝑦𝑦�𝑖𝑖 )2 → 𝑚𝑚𝑖𝑖𝑛𝑛.
𝜕𝜕𝑆𝑆
𝜕𝜕𝑏𝑏1
𝑖𝑖=1
Определим коэффициент 𝑏𝑏1 . Для этого, найдем частную производную
и приравняем ее к нулю.
Содержание
105
𝑛𝑛
𝑛𝑛
𝜕𝜕
𝜕𝜕
𝜕𝜕𝑆𝑆
=
��(𝑦𝑦𝑖𝑖 − 𝑦𝑦�𝑖𝑖 )2 � =
��(𝑦𝑦𝑖𝑖 − 𝑏𝑏0 − 𝑏𝑏1 𝑋𝑋𝑖𝑖1 − 𝑏𝑏2 𝑋𝑋𝑖𝑖2 )2 � =
𝜕𝜕𝑏𝑏1
𝜕𝜕𝑏𝑏1 𝜕𝜕𝑏𝑏1
𝑖𝑖=1
Отсюда, получим:
𝑖𝑖=1
𝑛𝑛
= 2 �(𝑦𝑦𝑖𝑖 − 𝑏𝑏0 − 𝑏𝑏1 𝑋𝑋𝑖𝑖1 − 𝑏𝑏2 𝑋𝑋𝑖𝑖2 ) 𝑋𝑋𝑖𝑖1 .
𝑛𝑛
𝑖𝑖=1
2 �(𝑦𝑦𝑖𝑖 − 𝑏𝑏0 − 𝑏𝑏1 𝑋𝑋𝑖𝑖1 − 𝑏𝑏2 𝑋𝑋𝑖𝑖2 ) 𝑋𝑋𝑖𝑖1 = 0
𝑖𝑖=1
или, разделив на 2 и раскрыв скобки,
𝑛𝑛
𝑛𝑛
𝑛𝑛
𝑛𝑛
𝑖𝑖=1
𝑖𝑖=1
𝑖𝑖=1
2
� 𝑦𝑦𝑖𝑖 𝑋𝑋𝑖𝑖1 − 𝑏𝑏0 � 𝑋𝑋𝑖𝑖1 − 𝑏𝑏1 � 𝑋𝑋𝑖𝑖1
− 𝑏𝑏2 � 𝑋𝑋𝑖𝑖1 𝑋𝑋𝑖𝑖2 = 0.
𝑖𝑖=1
(5.14)
Воспользуемся свойствами ПФЭ:
− симметричности: ∑𝑛𝑛𝑖𝑖=1 𝑋𝑋𝑖𝑖1 = 0, отсюда 𝑏𝑏0 ∑𝑛𝑛𝑖𝑖=1 𝑋𝑋𝑖𝑖1 = 0;
2
2
= 𝑛𝑛, поэтому 𝑏𝑏1 ∑𝑛𝑛𝑖𝑖=1 𝑋𝑋𝑖𝑖1
= 𝑛𝑛𝑏𝑏1 ;
− нормирования: ∑𝑛𝑛𝑖𝑖=1 𝑋𝑋𝑖𝑖1
𝑛𝑛
− ортогональности: ∑𝑖𝑖=1 𝑋𝑋𝑖𝑖𝑗𝑗 𝑋𝑋𝑖𝑖𝑘𝑘 = 0, 𝑗𝑗 ≠ 𝑘𝑘, отсюда 𝑏𝑏2 ∑𝑛𝑛𝑖𝑖=1 𝑋𝑋𝑖𝑖1 𝑋𝑋𝑖𝑖2 = 0.
Тогда уравнение (5.14) примет вид:
𝑛𝑛
Следовательно,
� 𝑦𝑦𝑖𝑖 𝑋𝑋𝑖𝑖1 − 𝑛𝑛𝑏𝑏1 = 0.
𝑖𝑖=1
∑𝑛𝑛𝑖𝑖=1 𝑦𝑦𝑖𝑖 𝑋𝑋𝑖𝑖1
.
𝑏𝑏1 =
𝑛𝑛
𝜕𝜕𝑆𝑆
и
Аналогично, найдя частные производные
𝜕𝜕𝑏𝑏2
𝜕𝜕𝑆𝑆
𝜕𝜕𝑏𝑏0
, получим формулы
для расчета коэффициентов уравнения регрессии:
∑𝑛𝑛𝑖𝑖=1 𝑦𝑦𝑖𝑖 𝑋𝑋𝑖𝑖2
∑𝑛𝑛𝑖𝑖=1 𝑦𝑦𝑖𝑖 𝑋𝑋𝑖𝑖0
∑𝑛𝑛𝑖𝑖=1 𝑦𝑦𝑖𝑖 𝑋𝑋𝑖𝑖1
𝑏𝑏1 =
; 𝑏𝑏2 =
; 𝑏𝑏0 =
.
(5.15)
𝑛𝑛
𝑛𝑛
𝑛𝑛
Следовательно, коэффициенты уравнения регрессии определяются скалярным произведением столбца 𝑦𝑦 на соответствующий столбец 𝑋𝑋.
Можно показать, что аналогичным образом определяются коэффициенты, если в уравнении регрессии (5.6) учитываются двойные, тройные взаимодействия:
∑𝑛𝑛𝑖𝑖=1 𝑦𝑦𝑖𝑖 (𝑋𝑋1 𝑋𝑋2 𝑋𝑋3 )𝑖𝑖
∑𝑛𝑛𝑖𝑖=1 𝑦𝑦𝑖𝑖 (𝑋𝑋1 𝑋𝑋2 )𝑖𝑖
, 𝑏𝑏123 =
и т. д.
(5.16)
𝑏𝑏12 =
𝑛𝑛
𝑛𝑛
Следует обратить особое внимание на то, что все коэффициенты независимы, так как в формулы для их расчета (5.15), (5.16) входят свои одноимен-
Содержание
106
ные переменные. Поэтому каждый коэффициент характеризует роль соответствующей переменной в процессе или силу влияния факторов. Чем больше
численная величина коэффициента, тем большее влияние оказывает этот фактор. Если коэффициент имеет знак плюс, то с увеличением значения фактора
отклик увеличивается, а если минус − уменьшается.
В результате определения уравнения регрессии может получиться так,
что один (или несколько) коэффициентов не большие и окажутся незначимыми. Факторы, имеющие коэффициенты, незначимо отличающиеся от нуля,
могут быть выведены из состава уравнения, так как их влияние на параметры
отклика будет отнесено к ошибке эксперимента. Учитывая ортогональность
плана, оставшиеся коэффициенты уравнения регрессии можно не пересчитывать. При отсутствии ортогональности плана эксперимента коэффициенты
необходимо пересчитывать заново.
5.2.4. Статистический анализ результатов эксперимента
Планирование эксперимента исходит из статистического характера зависимостей, поэтому полученные уравнения подвергаются тщательному статистическому анализу с целью извлечь из результатов эксперимента максимум
информации и убедиться в достоверности полученной зависимости и ее точности. Процедура проверки значимости коэффициентов уравнения регрессии
и его адекватности принципиально не отличается от описания, изложенного
ранее, поэтому остановимся только на отдельных моментах.
Построчные (выборочные) дисперсии вычисляются по формуле:
где 𝑦𝑦�𝑖𝑖 =
∑𝑚𝑚
𝑖𝑖=1 𝑦𝑦𝑖𝑖𝑖𝑖
𝑚𝑚
𝑠𝑠𝑖𝑖2 =
∑𝑚𝑚
�𝑖𝑖 �
𝑗𝑗=1�𝑦𝑦𝑖𝑖𝑗𝑗 − 𝑦𝑦
𝑚𝑚 − 1
2
,
(5.17)
− средний отклик по 𝑚𝑚 опытам в точке с номером 𝑖𝑖.
2
Дисперсия воспроизводимости отклика 𝑠𝑠восп
есть средне арифметическое дисперсий всех 𝑛𝑛 различных вариантов опытов:
2
�𝑖𝑖 �
∑𝑛𝑛𝑖𝑖=1 𝑠𝑠𝑖𝑖2 ∑𝑛𝑛𝑖𝑖=1 ∑𝑚𝑚
𝑗𝑗=1�𝑦𝑦𝑖𝑖𝑗𝑗 − 𝑦𝑦
2
=
.
(5.18)
𝑠𝑠восп =
𝑛𝑛(𝑚𝑚 − 1)
𝑛𝑛
Прежде чем производить объединение дисперсий, следует убедиться в их
однородности. Проверка производится с помощью критерия Фишера или Кохрена. Для оценки значимости коэффициентов, прежде всего, находят дисперсию коэффициентов регрессии. Учитывая свойства 1–3 плана, представленного в таблице 5.3, при одинаковом дублировании опытов по точкам с числом
повторных опытов 𝑚𝑚 получим:
107
Содержание
2
𝑠𝑠восп
,
(5.19)
=
𝑚𝑚𝑛𝑛
а при отсутствии дублирования будем иметь:
2
𝑠𝑠восп
2
𝑠𝑠𝑏𝑏 =
,
(5.19а)
𝑛𝑛
Следовательно, все коэффициенты уравнения регрессии ПФЭ имеют одинаковую точность (дисперсию). В этом заключается принципиальное отличие
коэффициентов уравнения регрессии, полученных по плану табл. 5.3, от коэффициентов уравнений, полученных пассивным экспериментом.
Планы, по результатам которых коэффициенты уравнения регрессии
определяются с одинаковой дисперсией, называются ротатабельными. В
связи с этим план, представленный в таблице 5.3, является не только ортогональным, но и ротатабельным. В дальнейшем проверка значимости каждого
коэффициента производится с использованием t-критерия Стьюдента. Статистически незначимые коэффициенты исключаются из уравнения, а остальные
коэффициенты при этом не пересчитываются. После этого уравнение регрессии составляется в виде уравнения связи выходного параметра y и переменных
𝑋𝑋𝑗𝑗 , включающего только значимые коэффициенты.
После вычисления коэффициентов уравнения следует, проверить его пригодность или адекватность. Для этого достаточно оценить отклонение выходной величины 𝑦𝑦�, предсказанной уравнением регрессии, от результатов эксперимента 𝑦𝑦 в различных точках.
Рассеяние результатов эксперимента относительно уравнения регрессии,
аппроксимирующего искомую зависимость, можно охарактеризовать с помощью дисперсии адекватности, оценка которой, справедливая при одинаковом
числе дублирующих опытов, находится по формуле:
∑𝑛𝑛𝑖𝑖=1(𝑦𝑦�𝑖𝑖 − 𝑦𝑦�𝑖𝑖 )2
2
.
(5.20)
𝑠𝑠ад =
𝑛𝑛 − 𝑙𝑙
Здесь 𝑛𝑛 − число опытов (вариантов); 𝑙𝑙 = 𝑘𝑘 + 1, где 𝑘𝑘 − число членов в уравнении регрессии.
Проверка адекватности состоит в выяснении соотношения между диспер2
2
сией адекватности 𝑠𝑠ад
и дисперсией воспроизводимости 𝑠𝑠восп
и проводится с
помощью F-критерия Фишера, который в данном случае рассчитывается как
2
𝑠𝑠ад
𝐹𝐹 = 2 .
(5.21)
𝑠𝑠восп
𝑠𝑠𝑏𝑏2
108
Содержание
Если вычисленное значение критерия меньше теоретического 𝐹𝐹𝛼𝛼;𝑚𝑚1;𝑚𝑚2 для
соответствующих степеней свободы 𝑚𝑚1 = 𝑛𝑛 − 𝑙𝑙, 𝑚𝑚2 = 𝑛𝑛(𝑚𝑚 − 1), при заданном уровне значимости 𝛼𝛼, то описание свойств объекта уравнением регрессии
признается адекватным объекту. Адекватность модели может быть достигнута
уменьшением интервала варьирования факторов, а если это не дает результата,
то переходом к плану второго порядка.
5.2.5. Дробный факторный эксперимент
Во многих практических задачах взаимодействия второго и высших порядков отсутствуют или пренебрежимо малы. Кроме того, на первых этапах
исследования часто необходимо получить в первом приближении лишь линейную аппроксимацию изучаемого уравнения связи при минимальном числе экспериментов. Так, для трех факторов вместо уравнения (5.9) достаточно рассмотреть уравнение вида:
𝑦𝑦� = 𝑏𝑏0 + 𝑏𝑏1 𝑥𝑥1 + 𝑏𝑏2 𝑥𝑥2 + 𝑏𝑏3 𝑥𝑥3
(5.22)
и определить только четыре коэффициента. Поэтому использование ПФЭ для
определения коэффициентов только при линейных членах неэффективно изза реализации большого числа опытов, особенно при большом числе факторов
𝑛𝑛.
Если при решении задачи можно ограничиться линейным приближением,
то в ПФЭ оказывается много «лишних» опытов. Так, для трех факторов достаточно 4 опыта, а в ПФЭ их 8. Следовательно, есть четыре «лишних». Результаты этих «лишних» опытов могут быть использованы двояко: во-первых, с их
помощью можно получить более точные оценки коэффициентов регрессии;
во-вторых, их можно использовать для проверки адекватности модели. Однако
при 7 факторах ПФЭ содержит 27 = 128 опытов, а для линейного уравнения
требуется всего 8.
Таким образом, остается 120 лишних и, конечно, нет необходимости их
все реализовать, а достаточно лишь несколько из них использовать для проверки адекватности и уточнения оценок.
Другими словами, ПФЭ обладает большой избыточностью опытов. В
связи с этим возникает вопрос: «Нельзя ли сократить число опытов, необходимых для определения коэффициентов регрессии?».
Так, для определения коэффициентов уравнения (5.22) достаточно ограничится четырьмя опытами. если в ПФЭ 23 использовать 𝑥𝑥1 𝑥𝑥2 в качестве плана
для 𝑥𝑥3 , тогда матрица планирования эксперимента примет вид, представленный в таблице 5.4.
Содержание
109
Таблица 5.4. Дробный факторный эксперимент
Номер
опыта
План
𝑋𝑋2
1
𝑋𝑋0
+1
𝑋𝑋1
2
+1
+1
−1
3
+1
−1
+1
−1
4
+1
+1
+1
+1
−1
−1
𝑋𝑋3 = 𝑋𝑋1 𝑋𝑋2
+1
−1
Результат
𝑦𝑦𝑖𝑖
𝑦𝑦1
𝑦𝑦2
𝑦𝑦3
𝑦𝑦4
Заметим, что мы использовали не все точки с «крайними» координатами,
т.е. ±1, или, говоря другими словами, не все возможные комбинации выбранных уровней. На самом деле всех возможных комбинаций 23 = 8, мы же использовали из них только 4. Такой сокращенный план носит название дробного факторного эксперимента (ДФЭ).
Следует подчеркнуть, что формальное приравнивание произведения факторов 𝑋𝑋1 𝑋𝑋2 фактору 𝑋𝑋3 , не входящему в это произведение, является основополагающей идеей метода ДФЭ. В данном случае используется только половина
ПФЭ 23 , поэтому план, представленный в таблице 5.4, называется полурепликой от ПФЭ 23 .
После реализации плана получают 4 уравнения с 4 неизвестными, их решение и даст оценку всех четырех коэффициентов регрессии 𝑏𝑏𝑗𝑗 . Например,
матрица из 8 опытов для четырехфакторного планирования будет полурепликой от ПФЭ 24 , а для пятифакторного планирования четвертьрепликой от 25 .
Для того чтобы дробная реплика представляла собой ортогональный
план, в качестве реплики следует брать ближайший полный факторный эксперимент. При этом число опытов должно быть не менее числа искомых коэффициентов.
Если коэффициенты регрессии при парных произведениях не равны
нулю, то найденные коэффициенты 𝑏𝑏𝑗𝑗 будут смешанными оценками их теоретических коэффициентов 𝛽𝛽𝑗𝑗 . На практике обычно не удается априорно постулировать равенство нулю эффектов взаимодействия, однако часто имеются основания полагать, что некоторые из них малы по сравнению с линейными эффектами. Операцию смешивания оценок принято условно записывать в виде
выражений:
(5.23)
𝑏𝑏1 → 𝛽𝛽1 + 𝛽𝛽23 ; 𝑏𝑏2 → 𝛽𝛽2 + 𝛽𝛽13 ; 𝑏𝑏3 → 𝛽𝛽3 + 𝛽𝛽12 ,
где 𝛽𝛽 − математическое ожидание для соответствующего коэффициента.
110
Содержание
Эти генерирующие коэффициенты не могут быть раздельно оценены по
плану, включающему всего четыре опыта, так как в этом случае неразличимы
столбцы для линейных членов и парных произведений. Если, например, в дополнение к столбцам, приведенным в таблице 5.4, вычислить еще столбцы для
произведения 𝑋𝑋1 𝑋𝑋3 , то увидим, что элементы этого столбца в точности равны
элементам столбца 𝑋𝑋2 . Таким образом, сокращение числа опытов приводит к
получению смешанных оценок для коэффициентов.
Для того чтобы определить, какие коэффициенты смешаны, удобно пользоваться следующим приемом: подставив 𝑋𝑋3 на место 𝑋𝑋1 𝑋𝑋2 , получим соотношение 𝑋𝑋3 = 𝑋𝑋1 𝑋𝑋2 , называемое генерирующим соотношением.
Умножив обе части генерирующего соотношения на 𝑋𝑋3 , получим:
𝑋𝑋32 = 𝑋𝑋1 𝑋𝑋2 𝑋𝑋3 = 1, т. е. 𝑋𝑋1 𝑋𝑋2 𝑋𝑋3 = 1.
(5.24)
Это произведение носит название определяющего контраста. Умножив
поочередно определяющий контраст на 𝑋𝑋1 , 𝑋𝑋2 , 𝑋𝑋3 , получим:
𝑋𝑋1 = 𝑋𝑋12 𝑋𝑋2 𝑋𝑋3 = 𝑋𝑋2 𝑋𝑋3 ; 𝑋𝑋2 = 𝑋𝑋1 𝑋𝑋3 ; 𝑋𝑋3 = 𝑋𝑋1 𝑋𝑋2 .
(5.25)
Полученным соотношениям соответствует система смешанных оценок,
т.е. 𝛽𝛽1 смешана с 𝛽𝛽23 , 𝛽𝛽2 − с 𝛽𝛽13 , а 𝛽𝛽3 − с 𝛽𝛽12 .
Таким образом, при использовании ДФЭ необходимо иметь четкое представление о так называемой разрешающей способности дробных реплик, т.е.
определить заранее, какие коэффициенты являются несмешанными оценками
для соответствующих коэффициентов. Тогда в зависимости от постановки задачи подбирается дробная реплика, с помощью которой можно извлечь максимальную информацию из эксперимента.
Таблица 5.5. Планирование ДФЭ
План
Номер
опыта
X0
X1
X2
X3
1
+1
−1
−1
−1
2
+1
+1
−1
−1
3
+1
−1
+1
−1
4
+1
+1
+1
−1
5
+1
−1
−1
+1
6
+1
+1
−1
+1
7
+1
−1
+1
+1
8
+1
+1
+1
+1
Генерирующие соотношения
X4=X1X2X3
X4=X1X2
−1
+1
+1
−1
+1
−1
−1
+1
+1
+1
−1
−1
−1
−1
+1
+1
111
Содержание
Например, в задаче с четырьмя факторами (𝑘𝑘 = 4) в качестве генерирующего соотношения можно взять 𝑋𝑋4 = 𝑋𝑋1 𝑋𝑋2 𝑋𝑋3 или любой из эффектов двойного взаимодействия, например 𝑋𝑋4 = 𝑋𝑋1 𝑋𝑋2 . Таблица планирования такого эксперимента представлена в таблице 5.5.
В первом случае определяющий контраст 𝑋𝑋42 = 𝑋𝑋1 𝑋𝑋2 𝑋𝑋3 𝑋𝑋4 = 1. Отсюда
получим оценку совместных оценок:
𝑋𝑋1 = 𝑋𝑋2 𝑋𝑋3 𝑋𝑋4 ,
𝑏𝑏1 ≈ 𝛽𝛽1 + 𝛽𝛽234 ;
𝑏𝑏2 ≈ 𝛽𝛽2 + 𝛽𝛽134 ;
𝑋𝑋2 = 𝑋𝑋1 𝑋𝑋3 𝑋𝑋4 ,
𝑏𝑏3 ≈ 𝛽𝛽3 + 𝛽𝛽124 ;
𝑋𝑋3 = 𝑋𝑋1 𝑋𝑋2 𝑋𝑋4 ,
𝑏𝑏3 ≈ 𝛽𝛽3 + 𝛽𝛽123 ;
𝑋𝑋4 = 𝑋𝑋1 𝑋𝑋2 𝑋𝑋3 ,
𝑏𝑏14 ≈ 𝛽𝛽14 + 𝛽𝛽23 ;
𝑋𝑋1 𝑋𝑋4 = 𝑋𝑋2 𝑋𝑋3 ,
𝑏𝑏13 ≈ 𝛽𝛽13 + 𝛽𝛽24 .
𝑋𝑋1 𝑋𝑋3 = 𝑋𝑋2 𝑋𝑋4 ,
В реальных задачах тройные взаимодействия бывают равными нулю значительно чаще, чем двойные. Значит, если по физическому смыслу задачи нас
более всего интересуют оценки для линейных эффектов, следует использовать
генерирующее соотношение 𝑋𝑋4 = 𝑋𝑋1 𝑋𝑋2 𝑋𝑋3 .
Во втором случае определяющий контраст выражается соотношением:
2
𝑋𝑋4 = 𝑋𝑋1 𝑋𝑋2 𝑋𝑋4 = 1; 𝑋𝑋1 𝑋𝑋2 𝑋𝑋4 = 1.
При этом получим следующую систему оценок:
𝑏𝑏1 ≈ 𝛽𝛽1 + 𝛽𝛽24 ;
𝑋𝑋1 = 𝑋𝑋2 𝑋𝑋4 ,
𝑏𝑏2 ≈ 𝛽𝛽2 + 𝛽𝛽14 ;
𝑋𝑋2 = 𝑋𝑋1 𝑋𝑋4 ,
𝑏𝑏3 ≈ 𝛽𝛽3 + 𝛽𝛽1234 ;
𝑋𝑋3 = 𝑋𝑋1 𝑋𝑋2 𝑋𝑋3 𝑋𝑋4 ,
𝑏𝑏4 ≈ 𝛽𝛽4 + 𝛽𝛽12 ;
𝑋𝑋4 = 𝑋𝑋1 𝑋𝑋2 ,
𝑏𝑏13 ≈ 𝛽𝛽13 + 𝛽𝛽234 ;
𝑋𝑋1 𝑋𝑋3 = 𝑋𝑋2 𝑋𝑋3 𝑋𝑋4 ,
𝑏𝑏23 ≈ 𝛽𝛽23 + 𝛽𝛽134 ;
𝑋𝑋2 𝑋𝑋3 = 𝑋𝑋1 𝑋𝑋3 𝑋𝑋4 ,
𝑋𝑋3 𝑋𝑋4 = 𝑋𝑋1 𝑋𝑋2 𝑋𝑋3 ,
𝑏𝑏34 ≈ 𝛽𝛽34 + 𝛽𝛽123 .
Следовательно, дробную реплику с генерирующим соотношением 𝑋𝑋4 =
= 𝑋𝑋1 𝑋𝑋2 имеет смысл использовать, если нас более всего интересуют коэффициенты 𝛽𝛽12 , 𝛽𝛽23 , 𝛽𝛽34 .
Дробную реплику, в которой 𝑃𝑃 линейных эффектов приравнены к эффектам взаимодействия, обозначают 2𝑘𝑘−𝑃𝑃 .
Таким образом, планы первого порядка, оптимальные двухуровневые
планы ПФЭ 2𝑘𝑘 и ДФЭ 2𝑘𝑘−𝑃𝑃 имеют следующие преимущества:
1) планы ортогональны, поэтому все вычисления просты;
2) все коэффициенты определяются независимо один от другого;
3) каждый коэффициент определяется по результатам всех 𝑛𝑛 опытов;
112
Содержание
4) все коэффициенты регрессии определяются с одинаковой дисперсией, т.е. эти планы обладают и свойством ротатабельности.
5.2.6. Математическая модель гидравлического режима
методической печи
В качестве примера рассмотрим разработку математической модели гидравлического режима четырехзонной методической печи с использованием
теории планирования эксперимента. Пример взят из учебного пособия [7]. При
планировании опытов используем методику проведения дробного факторного
эксперимента (ДФЭ) первого порядка с двухуровневым варьированием факторов.
Перед разработкой плана эксперимента на основе априорной информации
были выявлены факторы, влияющие на величину давления в томильной зоне
печи.
К числу таких факторов относятся расходы топлива на каждую зону
нагрева и угол поворота дымового клапана.
Расходы воздуха на каждую зону в качестве факторов не фигурировали,
поскольку схема управления горением топлива автоматически меняет расход
воздуха при изменении расхода газа.
Обозначим факторы: 𝑋𝑋1 − расход газа в томильной зоне, м3/ч; 𝑋𝑋2 − расход
газа во второй сварочной зоне, м3/ч; 𝑋𝑋3 − расход газа в первой сварочной зоне,
м3/ч; 𝑋𝑋4 − расход газа в нижней сварочной зоне, м3/ч; 𝑋𝑋5 − положение дымового клапана, % хода исполнительного механизма (рисунок 5.2).
Рисунок 5.2. Положение факторов 𝑋𝑋1 , 𝑋𝑋2 , 𝑋𝑋3 , 𝑋𝑋4 , 𝑋𝑋5 и отклика 𝑌𝑌 при
проведении эксперимента
Содержание
113
Реализация ПФЭ в этом случае при варьировании всех факторов на двух
уровнях потребовала бы постановки 25 = 32 опыта.
Будем предполагать, что эффекты взаимодействия факторов в исследуемом объекте маловероятны и пренебрежимо малы. Воспользуемся 1/4 репликой ПФЭ, т.е. ДФЭ типа 25-2, где формально 2 фактора заменены соответствующими произведениями остальных факторов (𝑋𝑋4 = 𝑋𝑋1 𝑋𝑋2 , 𝑋𝑋5 = 𝑋𝑋1 𝑋𝑋2 𝑋𝑋3 ). Это
позволит сократить число опытов до 23 = 8. Уровни варьирования факторов
представлены в таблице 5.6.
Таблица 5.6. Уровни варьирования факторов
Факторы
Уровни факторов
𝑋𝑋1 ,
𝑋𝑋2 ,
𝑋𝑋3 ,
𝑋𝑋4 ,
3
3
3
м /ч
м /ч м /ч
м3/ч
Основной (нулевой)
Нижний
Верхний
Интервал варьирования
5250
4000
6500
1250
3900
3100
4700
800
2650
1750
3550
900
𝑋𝑋5 ,
% хода ИМ
110
70
150
40
74
50
98
24
В таблице 5.7 приведены матрица планирования ДФЭ 25-2 и результаты
эксперимента − значения выходной переменной (давления в томильной зоне
методической печи).
Таблица 5.7. Матрица планирования ДФЭ 25-2 с двумя параллельными
опытами
Факторы (кодированные значения)
X0
X1
X2
X3
X4
X5
1
1
1
1
1
1
1
1
1
-1
1
-1
1
-1
1
-1
1
1
-1
-1
1
1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
-1
1
1
-1
Переменная состояния
(отклик), кПа
Опыт Опыт
СредМо1
2
нее
дель
𝑌𝑌1
-2,5
2,2
5,1
-1,1
2,1
-2,0
0,0
4,2
𝑌𝑌2
-2,6
2,3
4,7
0,5
2,3
-2,4
0,8
5,1
𝑌𝑌�𝑖𝑖
-2,55
2,25
4,90
-0,30
2,20
-2,20
0,40
4,65
𝑌𝑌�𝑖𝑖
-2,41
2,26
4,74
0,08
2,26
-2,41
0,08
4,74
Построчная дисперсия
𝑠𝑠𝑖𝑖2
0,005
0,005
0,080
1,280
0,020
0,080
0,320
0,405
Содержание
114
Для обработки результатов эксперимента используем методику, изложенную ранее.
1. Вычислим построчные средние.
−2,5 + (−2,6)
= −2,55;
𝑌𝑌�1 =
2
2,2 + 2,3
𝑌𝑌�2 =
= 2,25, и так далее.
2
Результаты расчетов представлены в таблице 5.7.
2. Определим построчные (выборочные) дисперсии.
По формуле
𝑠𝑠𝑖𝑖2
∑𝑚𝑚
�𝑖𝑖 �
𝑗𝑗=1�𝑦𝑦𝑖𝑖𝑗𝑗 − 𝑦𝑦
2
,
𝑚𝑚 − 1
где 𝑚𝑚 − число повторных опытов (𝑚𝑚 =2), получим:
=
2
2
�−2,5 − (−2,55)� + �−2,6 − (−2,55)�
=
= 0,005.
2−1
Аналогично, 𝑠𝑠22 = 0,005; 𝑠𝑠32 = 0,08; 𝑠𝑠42 = 1,28; 𝑠𝑠52 = 0,02; 𝑠𝑠62 = 0,08; 𝑠𝑠72 =
=0,32; 𝑠𝑠82 = 0,405.
Сумма построчных (выборочных) дисперсий:
𝑠𝑠∑2 = 0,005+0,005+0,08+1,28+0,02+0,08+0,32+0,405=2,195.
3. Определим однородность дисперсий по критерию Кохрена:
1,28
𝑠𝑠𝑖𝑖2𝑚𝑚𝑎𝑎𝑥𝑥
≈ 0,5831.
𝐺𝐺эксп = 2 =
2,195
𝑠𝑠∑
𝑠𝑠12
Далее, по таблице приложения 12, находим 𝐺𝐺𝛼𝛼,𝑚𝑚1,𝑚𝑚2 . Для 𝛼𝛼=0,05,
𝑚𝑚1 = 𝑚𝑚 − 1 = 2 − 1 = 1 и 𝑚𝑚2 = 8 значение 𝐺𝐺теор = 𝐺𝐺0,05;1;8 = 0,6798.
Поскольку 𝐺𝐺эксп < 𝐺𝐺теор , то дисперсии однородны.
4. Вычислим коэффициенты уравнения регрессии:
∑𝑛𝑛𝑖𝑖=1 𝑦𝑦�𝑖𝑖 𝑋𝑋𝑖𝑖0 −2,55 + 2,25 + 4,9 − 0,3 + 2,2 − 2,2 + 0,4 + 4,65
=
𝑏𝑏0 =
8
𝑛𝑛
= 1,169;
𝑛𝑛
∑𝑖𝑖=1 𝑦𝑦�𝑖𝑖 𝑋𝑋𝑖𝑖1 −2,55 − 2,25 + 4,9 + 0,3 + 2,2 + 2,2 + 0,4 − 4,65
𝑏𝑏1 =
=
8
𝑛𝑛
= 0,069;
𝑛𝑛
∑𝑖𝑖=1 𝑦𝑦�𝑖𝑖 𝑋𝑋𝑖𝑖2 −2,55 + 2,25 − 4,9 + 0,3 + 2,2 − 2,2 − 0,4 − 4,65
=
𝑏𝑏2 =
8
𝑛𝑛
= −1,244;
115
Содержание
∑𝑛𝑛𝑖𝑖=1 𝑦𝑦�𝑖𝑖 𝑋𝑋𝑖𝑖3 −2,55 + 2,25 + 4,9 − 0,3 − 2,2 + 2,2 − 0,4 − 4,65
=
𝑏𝑏3 =
8
𝑛𝑛
= −0,094;
𝑛𝑛
∑𝑖𝑖=1 𝑦𝑦�𝑖𝑖 𝑋𝑋𝑖𝑖4 −2,55 − 2,25 − 4,9 − 0,3 + 2,2 + 2,2 − 0,4 + 4,65
𝑏𝑏4 =
=
8
𝑛𝑛
= −0,169;
𝑛𝑛
∑𝑖𝑖=1 𝑦𝑦�𝑖𝑖 𝑋𝑋𝑖𝑖5 −2,55 − 2,25 − 4,9 − 0,3 − 2,2 − 2,2 + 0,4 − 4,65
=
𝑏𝑏5 =
8
𝑛𝑛
= −2,331.
5. Проверим значимость коэффициентов регрессии. Предварительно
определим дисперсию воспроизводимости (дисперсию отклика):
2
𝑛𝑛
2
𝑠𝑠
∑
𝑠𝑠
2,195
∑
𝑖𝑖
𝑖𝑖=1
2
𝑠𝑠восп
=
=
=
= 0,2744.
8
𝑛𝑛
𝑛𝑛
Дисперсия коэффициентов уравнения регрессии:
2
0,2744
𝑠𝑠восп
2
𝑠𝑠𝑏𝑏 =
=
= 0,01715,
2∙8
𝑚𝑚𝑛𝑛
тогда
𝑠𝑠𝑏𝑏 = �𝑠𝑠𝑏𝑏2 = 0,131.
Вычислим значение доверительного интервала для коэффициентов
регрессии:
∆𝑏𝑏𝑖𝑖 = 𝑡𝑡𝛼𝛼,𝑚𝑚1 ∙ 𝑠𝑠𝑏𝑏 .
Здесь 𝑚𝑚1 = 𝑛𝑛(𝑚𝑚 − 1) = 8(2 − 1) = 8, тогда теоретическое значение
критерия Стьюдента 𝑡𝑡0,05;8 = 2,31 (см. приложение 7). Следовательно,
∆𝑏𝑏𝑖𝑖 = 2,31 ∙ 0,131 = 0,303.
Сравнив величину доверительного интервала с абсолютными значениями коэффициентов модели, получим:
|𝑏𝑏1 | = 0,069 < 0,303; |𝑏𝑏3 | = 0,094 < 0,303; и |𝑏𝑏4 | = 0,169 < 0,303.
Эти коэффициенты оказались незначимы, а остальные значимы. Таким образом, отбросив незначимые коэффициенты, уравнение регрессии запишем в виде:
𝑌𝑌� = 1,169 − 1,244𝑋𝑋2 − 2,331𝑋𝑋5 .
Результаты расчета выходных параметров по уравнению полученной
модели 𝑌𝑌�𝑖𝑖 занесены в таблицу 5.7.
6. Проверим адекватность полученной модели.
Предварительно вычислим дисперсию адекватности:
116
2
𝑠𝑠ад
Содержание
∑𝑛𝑛𝑖𝑖=1 𝑚𝑚(𝑦𝑦�𝑖𝑖 − 𝑦𝑦�𝑖𝑖 )2
.
=
𝑛𝑛 − 𝑙𝑙
Здесь 𝑙𝑙 = 𝑘𝑘 + 1, где 𝑘𝑘 − число факторов в уравнении регрессии.
В нашем случае 𝑚𝑚 = 2, 𝑛𝑛 = 8, 𝑙𝑙 = 3. В результате получим:
2
2
((−2,55 + 2,41)2 + (2,25 − 2,26)2 + (4,9 − 4,74)2
𝑠𝑠ад
=
8−3
+ (−0,3 − 0,08)2 + (2,2 − 2,26)2 + (−2,2 + 2,41)2
+ (0,4 − 0,08)2 + (4,65 − 4,74)2 ) = 0,139.
С учетом вычисленного ранее значения 𝑠𝑠∑2 = 2,195, определяем дисперсию воспроизводимости:
𝑠𝑠∑2
2,195
2
=
= 0,274.
𝑠𝑠восп =
8
𝑛𝑛
Экспериментальное значение критерия Фишера следующее:
2
𝑠𝑠ад
0,139
𝐹𝐹эксп = 2 =
= 0,507.
𝑠𝑠восп 0,274
Теоретическое значение критерия Фишера 𝐹𝐹𝛼𝛼;𝑘𝑘1;𝑘𝑘2 при 𝛼𝛼=0,05, 𝑘𝑘1 =
𝑛𝑛 − 𝑙𝑙 = 8 − 3 = 5 и 𝑘𝑘2 = 𝑛𝑛(𝑚𝑚 − 1) = 8(2 − 1) = 8 определяем по
таблице приложения 9:
𝐹𝐹теор = 𝐹𝐹0,05;5;8 = 3,69.
Поскольку𝐹𝐹эксп < 𝐹𝐹теор , то полученная модель адекватна.
6.
МЕТОДЫ ОПТИТМИЗАЦИИ
Во многих случаях инженерной практики перед исследователем возникает задача не только выявления характера связи между двумя или несколькими рядами наблюдений, но и нахождения таких численных значений факторов, при которых отклик (выходной параметр) достигает своего экстремального значения (максимума или минимума). Эксперимент, решающий эту задачу, называется экстремальным.
В этом случае задача сводится к оптимизационной и формулируется следующим образом: требуется определить координаты (𝑥𝑥1∗ ; 𝑥𝑥2∗ ; … ; 𝑥𝑥𝑛𝑛∗ ) точки экстремума функции отклика 𝑦𝑦 = 𝑓𝑓(𝑥𝑥1 ; 𝑥𝑥2 ; … ; 𝑥𝑥𝑛𝑛 ), в которой функция достигает
своего максимального или минимального значения при некоторых ограничениях, накладываемых на факторное пространство.
117
Содержание
Такого рода оптимизационные задачи рассматриваются в теории методов
оптимизации или математического программирования. Математическое программирование состоит из линейного и нелинейного программирования.
6.1.
Элементы линейного программирования
Основы математического аппарата для решения задач линейного программирования были разработаны в 1939 г. советским математиком Л.В. Канторовичем . В 1938 г. его попросили решить практическую задачу о выборе
наилучшей производственной программы загрузки группы станков фанерного
треста. Решив эту задачу, Л. В. Канторович предложил оптимальный метод
распила фанерного листа (при максимальном использовании материала и, соответственно, минимальных отходах производства). В последствии сам Канторович отмечал: «Выяснилось, что эта задача на максимум при ограничениях, описываемых системой линейных неравенств, весьма своеобразна и не
поддается решению известными средствами классического анализа. Тогда же
стало ясно, что эта задача не случайная, а является типичным представителем
нового, не исследованного еще класса задач, к которым приводят различные
вопросы нахождения наилучшего производственного плана, столь характерного для экономического анализа. Изучение этого круга задач и методов их
решения привело к созданию новой научной дисциплины, получившей позже
название линейного программирования».
Спустя 10 лет американский математик Дж. Данциг разработал эффективный метод решения данного класса задач, получивший название симплексметод. Термин «линейное программирование» был введен в употребление
Данцигом в 1951 г. Слово «программирование» означает, что задается какаято программа действий для достижения определенной цели.
6.1.1. Общая задача линейного программирования
Рассмотрим следующую задачу линейного программирования.
Пример 6.1. С поля на овощную перевозятся овощи автомашинами грузоподъемностью по 5 и 10 тонн. За 1 час база может принять не более 10 машин, при этом не более 8 машин по 5 тонн и не более 6 машин по 10 тонн.
Сколько машин по 5 и 10 тонн нужно отправлять с поля на базу за 1 час, что
бы перевозить наибольшее количество овощей, не создавая очереди на базе?
Пусть за 1 час отправляется 𝑥𝑥1 машин по 5 тонн и 𝑥𝑥2 машин по 10 тонн.
По условиям задачи составим систему неравенств:
118
Содержание
𝑥𝑥1
≤ 8,
≤ 6,
𝑥𝑥2
𝑥𝑥1 + 𝑥𝑥2 ≤ 10,
(6.1)
⎨ 𝑥𝑥1
≥ 0,
⎪
⎩ 𝑥𝑥2
≥ 0.
Первые три неравенства появляются в связи с тем, что можно отправлять
и меньшее число машин, но не большее, а последние два означают, что количества автомобилей не могут быть отрицательными.
Всего за 1 час перевозится 5𝑥𝑥1 + 10𝑥𝑥2 тонн овощей. Решение задачи заключается в определении наибольшего (максимального) значения линейной
функции двух переменных
𝑓𝑓 (𝑥𝑥1 , 𝑥𝑥2 ) = 5𝑥𝑥1 + 10𝑥𝑥2 ,
(6.2)
при условии, что переменные 𝑥𝑥1 и 𝑥𝑥2 должны удовлетворять системе неравенств (6.1).
Решение этой задачи будет приведено ниже.
Общая задача линейного программирования формулируется следующем
образом. Требуется найти максимум или минимум линейной функции 𝑛𝑛 переменных 𝑥𝑥1 , 𝑥𝑥2 , … , 𝑥𝑥𝑛𝑛 :
𝑓𝑓 = 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 , … , 𝑥𝑥𝑛𝑛 ) = 𝑐𝑐1 𝑥𝑥1 + 𝑐𝑐2 𝑥𝑥2 + ⋯ + 𝑐𝑐𝑛𝑛 𝑥𝑥𝑛𝑛 ,
(6.3)
(𝑐𝑐𝑗𝑗 − заданные действительные числа) при линейных ограничениях, накладываемых на переменные вида:
𝑎𝑎11 𝑥𝑥1 + 𝑎𝑎12 𝑥𝑥2 + ⋯ + 𝑎𝑎1𝑛𝑛 𝑥𝑥𝑛𝑛 = 𝑏𝑏1 ;
𝑎𝑎 𝑥𝑥 + 𝑎𝑎22 𝑥𝑥2 + ⋯ + 𝑎𝑎2𝑛𝑛 𝑥𝑥𝑛𝑛 = 𝑏𝑏2 ;
(6.4)
� 21 1
−−−−−−−−−−−− − −
𝑎𝑎𝑘𝑘1 𝑥𝑥1 + 𝑎𝑎𝑘𝑘2 𝑥𝑥2 + ⋯ + 𝑎𝑎𝑘𝑘𝑛𝑛 𝑥𝑥𝑛𝑛 = 𝑏𝑏𝑘𝑘 ;
𝑎𝑎𝑘𝑘+1,1 𝑥𝑥1 + 𝑎𝑎𝑘𝑘+2,2 𝑥𝑥2 + ⋯ + 𝑎𝑎𝑘𝑘+𝑛𝑛,𝑛𝑛 𝑥𝑥𝑛𝑛 ≤ 𝑏𝑏𝑘𝑘+1 ;
�− − − − − − − − − − − − − − − − − − −
(6.5)
≤ 𝑏𝑏𝑚𝑚 ;
𝑎𝑎𝑚𝑚1 𝑥𝑥1 + 𝑎𝑎𝑚𝑚2 𝑥𝑥2 + ⋯ + 𝑎𝑎𝑚𝑚𝑛𝑛 𝑥𝑥𝑛𝑛
𝑗𝑗 ∈ 𝐽𝐽 ⊆ 𝑁𝑁 = {1,2,3, … , 𝑛𝑛}.
(6.6)
𝑥𝑥𝑗𝑗 ≥ 0,
Здесь 𝑎𝑎𝑖𝑖𝑗𝑗 – коэффициент при переменном 𝑥𝑥𝑗𝑗 в 𝑖𝑖-том ограничении, 𝑏𝑏𝑖𝑖 − свободный член 𝑖𝑖−го ограничения.
Неравенства (6.6) означают, что условие неотрицательности могут накладываться не на все переменные, а на некоторые с индексами 𝑗𝑗 из множества
индексов 𝐽𝐽, являющегося подмножеством множества {1,2,3, … , 𝑛𝑛}.
Общую задачу линейного программирования можно записать в более
компактной записи:
⎧
⎪
Содержание
119
𝑛𝑛
𝑓𝑓 = � 𝑐𝑐𝑗𝑗 𝑥𝑥𝑗𝑗 → max (𝑚𝑚𝑖𝑖𝑛𝑛);
𝑛𝑛
𝑗𝑗=1
� 𝑎𝑎𝑖𝑖𝑗𝑗 𝑥𝑥𝑗𝑗 = 𝑏𝑏𝑖𝑖 ,
𝑗𝑗=1
𝑛𝑛
� 𝑎𝑎𝑖𝑖𝑗𝑗 𝑥𝑥𝑗𝑗 ≤ 𝑏𝑏𝑖𝑖 ,
𝑗𝑗=1
𝑖𝑖 = �����
1, 𝑘𝑘 ;
𝑖𝑖 = �����������
𝑘𝑘 + 1, 𝑚𝑚;
𝑗𝑗 ∈ 𝐽𝐽 ⊆ 𝑁𝑁 = {1,2,3, … , 𝑛𝑛}.
𝑥𝑥𝑗𝑗 ≥ 0,
Функцию 𝑓𝑓, для которой находят наибольшее или наименьшее значение,
называют целевой функцией. Систему равенств (6.4) и неравенств (6.5)-(6.6)
называют системой ограничений.
Любое решение системы ограничений, т.е. набор чисел (𝑥𝑥1 , 𝑥𝑥2 , … , 𝑥𝑥𝑛𝑛 ),
удовлетворяющих условиям (6.4)-(6.6), называется допустимым решением
задачи линейного программирования.
Например, 𝑥𝑥1 = 2 и 𝑥𝑥2 = 3 является допустимым решением задачи (6.1)(6.2), поскольку данный набор значений переменных удовлетворяет всем ограничениям системы (6.1).
Множество всех допустимых решений задачи линейного программирования называется допустимым множеством или множеством допустимых
решений.
Допустимое решение, в котором целевая функция достигает максимального или минимального значения, называется оптимальным решением задачи линейного программирования.
Например, 𝑥𝑥1 = 2 и 𝑥𝑥2 = 3 является допустимым, но не оптимальным решением задачи (6.1)-(6.2), так как значение целевой функции в другом допустимом решении 𝑥𝑥1 = 3 и 𝑥𝑥2 = 4 больше.
Линейное программирование изучает методы нахождения оптимальных
решений указанных задач.
6.1.2. Стандартная форма задачи линейного программирования
Говорят, что задача линейного программирования имеет стандартную
форму, если ее система ограничений состоит из линейных неравенств и условие неотрицательности накладываются на все переменные, т.е. это задача
вида:
𝑓𝑓 = 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 , … , 𝑥𝑥𝑛𝑛 ) = 𝑐𝑐1 𝑥𝑥1 + 𝑐𝑐2 𝑥𝑥2 + ⋯ + 𝑐𝑐𝑛𝑛 𝑥𝑥𝑛𝑛 → max (min) ,
(6.7)
120
Матрица
𝑎𝑎11 𝑥𝑥1 + 𝑎𝑎12 𝑥𝑥2 + ⋯ + 𝑎𝑎1𝑛𝑛 𝑥𝑥𝑛𝑛 ≤
𝑎𝑎 𝑥𝑥 + 𝑎𝑎22 𝑥𝑥2 + ⋯ + 𝑎𝑎2𝑛𝑛 𝑥𝑥𝑛𝑛 ≤
� 21 1
−−−−−−−−−−−−
−
𝑎𝑎𝑚𝑚1 𝑥𝑥1 + 𝑎𝑎𝑚𝑚2 𝑥𝑥2 + ⋯ + 𝑎𝑎𝑚𝑚𝑛𝑛 𝑥𝑥𝑛𝑛 ≤
𝑗𝑗 = 1,2, … , 𝑛𝑛.
𝑥𝑥𝑗𝑗 ≥ 0,
Содержание
𝑏𝑏1 ;
𝑏𝑏2 ;
−
𝑏𝑏𝑚𝑚 ;
(6.8)
(6.9)
𝑎𝑎11 𝑎𝑎12 … 𝑎𝑎1𝑛𝑛
𝑎𝑎21 𝑎𝑎22 … 𝑎𝑎2𝑛𝑛
𝐴𝐴 = � ⋮
⋮
⋱
⋮ �,
𝑎𝑎𝑚𝑚1 𝑎𝑎𝑚𝑚2 … 𝑎𝑎𝑚𝑚𝑛𝑛
составленная из коэффициентов системы ограничений (6.8) называется матрицей условий задачи (6.7)-(6.9).
Введем рассмотрение вектор-строку 𝑐𝑐 = (𝑐𝑐1 , 𝑐𝑐2 , … , 𝑐𝑐𝑛𝑛 ) коэффициентов
целевой функции 𝑓𝑓, вектор-столбец 𝑥𝑥 переменных и вектор-столбец 𝑏𝑏 свободных членов системы (6.8):
𝑥𝑥1
𝑏𝑏1
𝑥𝑥2
𝑏𝑏
𝑥𝑥 = � ⋮ � , 𝑏𝑏 = � 2 �.
⋮
𝑥𝑥𝑛𝑛
𝑏𝑏𝑚𝑚
В этом случае задачу (6.7)-(6.9) можно записать матричном виде:
𝑓𝑓 = 𝑐𝑐𝑥𝑥 → max (min);
(6.10)
𝐴𝐴𝑥𝑥 ≤ 𝑏𝑏;
(6.11)
𝑥𝑥 ≥ 0.
(6.12)
Здесь 𝑐𝑐𝑥𝑥 – скалярное произведение векторов, 𝐴𝐴𝑥𝑥 – произведение матрицы
на вертор-столбец.
6.1.3. Графический метод решения задач линейного
программирования
Если задача линейного программирования содержит две переменные, а
число линейных ограничений, накладываемых на переменные, невелико, то
некоторые из таких задач эффективно решаются графическим методом.
Решим графическим методом задачу примера 6.1.
(6.13)
𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 ) = 5𝑥𝑥1 + 10𝑥𝑥2 → 𝑚𝑚𝑎𝑎𝑥𝑥,
𝑥𝑥1
≤ 8,
⎧ 𝑥𝑥
≤ 6,
2
⎪
𝑥𝑥1 + 𝑥𝑥2 ≤ 10,
(6.14)
⎨ 𝑥𝑥1
≥ 0,
⎪
⎩ 𝑥𝑥2
≥ 0.
Содержание
121
Допустимым множеством задачи (6.13)-(6.14) является множество точек
(𝑥𝑥1 ; 𝑥𝑥2 ) на плоскости 𝑥𝑥1 𝑂𝑂𝑥𝑥2 , координаты которых удовлетворяют неравенствам системы ограничений (6.14). Такое множество точек на плоскости 𝑥𝑥1 𝑂𝑂𝑥𝑥2
называется допустимой областью и обозначается 𝐷𝐷. Для изображения допустимой области следует построить прямые, которые будут ее ограничивать.
Эти прямые называют граничными. Уравнения граничных прямых получаются из системы ограничений (6.14) заменой знаков неравенств на знаки равенства:
𝑙𝑙1 :
𝑥𝑥1 = 8;
𝑙𝑙2 :
𝑥𝑥2 = 6;
𝑙𝑙3 : 𝑥𝑥1 + 𝑥𝑥2 = 10.
Последние два неравенства системы ограничений (6.14) означают, что допустимая область находится в первой четверти плоскости 𝑥𝑥1 𝑂𝑂𝑥𝑥2 .
Построим граничную прямую 𝑙𝑙1 (рисунок 6.1).
𝑥𝑥2
𝑙𝑙1
10
6
𝑙𝑙
𝐴𝐴
∇𝑓𝑓
𝑙𝑙2
𝐷𝐷
𝑂𝑂
𝑙𝑙
8
Рисунок 6.1. Графическое решение задачи
10
𝑙𝑙3
𝑥𝑥1
Прямая 𝑙𝑙1 разбивает плоскость на две полуплоскости. Координаты точек
одной полуплоскости удовлетворяют первому неравенству системы (6.14), а
122
Содержание
координаты точек другой полуплоскости этому неравенству не удовлетворяют. Нам нужно выбрать полуплоскость, координаты точек которой удовлетворяют первому неравенству. Для это нужно взять любую точку плоскости,
не лежащую на самой граничной прямой, подставить ее координаты в первое
неравенство и проверить выполнение неравенства. Если неравенство верно, то
выбираем полуплоскость в которой лежит эта точка, если неравенство не
верно, то выбираем полуплоскость, лежащую по другую сторону от граничной
прямой.
Берем точку 𝑂𝑂(0; 0), подставляем ее координаты в первое неравенство и
убеждаемся, что оно верно (0 ≤ 8). Следовательно, выбираем полуплоскость в
которой лежит точка 𝑂𝑂(0; 0). Нужная полуплоскость отмечена стрелкой,
направленной перпендикулярно прямой.
Построим граничную прямую 𝑙𝑙2 (рисунок 6.1). Эта прямая так же разбивает плоскость на две полуплоскости. Берем точку 𝑂𝑂(0; 0), подставляем ее координаты во второе неравенство и убеждаемся, что оно верно (0 ≤ 6). Следовательно, выбираем полуплоскость в которой лежит точка 𝑂𝑂(0; 0). Нужная полуплоскость отмечена стрелкой, направленной перпендикулярно прямой.
Построим граничную прямую 𝑙𝑙3 (рисунок 6.1). Эта прямая так же разбивает плоскость на две полуплоскости. Берем точку 𝑂𝑂(0; 0), подставляем ее координаты в третье неравенство и убеждаемся, что оно верно (0+0 ≤ 10). Следовательно, выбираем полуплоскость в которой лежит точка 𝑂𝑂(0; 0). Нужная
полуплоскость отмечена стрелкой, направленной перпендикулярно прямой.
Как уже было отмечено, последние два неравенства системы ограничений
(6.14) означают, что допустимая область находится в первой четверти плоскости 𝑥𝑥1 𝑂𝑂𝑥𝑥2 .
Системе неравенств (6.14) удовлетворяет множество точек (𝑥𝑥1 ; 𝑥𝑥2 ), лежащих на пересечении всех полуплоскостей, соответствующих заданным ограничениям. Поэтому допустимая область 𝐷𝐷 является выпуклым многоугольником. На рисунке 6.1 граница допустимой области выделена красным цветом.
Если система ограничений (6.14) противоречива, то допустимая область
пуста.
Теперь задачу (6.13)-(6.14) можно сформулировать следующим образом:
среди всех точек выпуклой области 𝐷𝐷 найти такую, координаты которой максимизируют линейную функцию (6.13).
Справедлива следующая теорема:
123
Содержание
Теорема 6.1. Если оптимальное решение задачи линейного программирования существует, то оно является или одной из вершин допустимой области,
или любой точкой отрезка границы допустимой области.
Нам осталось выбрать вершину допустимой области, являющуюся оптимальным решением.
Для нахождения оптимального решения нужно построить:
1) вектор градиента целевой функции (рисунок 6.1):
𝑔𝑔𝑟𝑟𝑎𝑎𝑑𝑑 𝑓𝑓 = ∇𝑓𝑓 = �
𝜕𝜕𝑓𝑓
;
𝜕𝜕𝑓𝑓
𝜕𝜕𝑥𝑥1 𝜕𝜕𝑥𝑥2
� = (𝑐𝑐1 ; 𝑐𝑐2 )=(5;10);
(символ ∇ читается «на́бла»)
2) опóрную прямую 𝑙𝑙. Начальное положение опорной прямой (на рисунке
6.1 – прямая, изображенная пунктирной линией) выбирается произвольно, но она должна удовлетворять двум условиям:
a) быть перпендикулярной вектору ∇𝑓𝑓;
b) пересекать допустимую область.
Затем перемещаем опорную прямую параллельно самой себе в направлении вектора ∇𝑓𝑓 для задачи на максимум целевой функции (или в противоположном направлении для задачи на минимум). Та вершина допустимой области, в которой опорная прямая осуществит «выход» из допустимой области и
является оптимальным решением.
На рисунке 6.1 опорная прямая 𝑙𝑙 «выходит» из допустимой области 𝐷𝐷 в
точке 𝐴𝐴. Поэтому эта точка является искомым оптимальным решением.
Осталось найти координаты точки 𝐴𝐴. Эта точка является пересечением граничных прямых 𝑙𝑙2 и 𝑙𝑙3 . Составим систему из уравнений этих прямых:
𝑥𝑥2 = 6;
�
𝑥𝑥1 + 𝑥𝑥2 = 10.
Так как 𝑥𝑥2 = 6, то из второго уравнения системы получаем, что 𝑥𝑥1 = 4.
Отсюда, 𝐴𝐴(4; 6), 𝑓𝑓𝑚𝑚𝑎𝑎𝑥𝑥 = 𝑓𝑓(𝐴𝐴) = 𝑓𝑓(4; 6) = 5 ∙ 4 + 10 ∙ 6 = 80.
Итак, возвращаясь и исходному условию задачи примера 6.1, мы получили, что с поля на овощную базу за 1 час следует отправлять 4 машины по 5
тонн и 6 машин по 10 тонн, при этом будет перевозиться 80 тонн овощей.
В некоторых задачах оптимальное решение не является единственным.
Если опорная прямая «выходит» из допустимой области по отрезку ее
границы, то оптимальными решениями являются все точки такого отрезка.
Например, на рисунке 6.2 для задачи на минимум опорная прямая (перемещаясь в направлении противоположном направлению вектора градиента целевой
функции) «выходит» из допустимой области по отрезу 𝐴𝐴𝐵𝐵. Поэтому все точки
Содержание
124
этого отрезка являются оптимальными решениями, при этом значения целевой
функции во всех точках отрезка одинаковы. В таком случае, в качестве оптимального решения удобно выбирать либо точку 𝐴𝐴, либо точку 𝐵𝐵.
На рисунке 6.2 допустимая область является неограниченной. Если решать задачу на максимум, то опорная прямая, перемещаясь параллельно самой себе, все время будет пересекать допустимую область (она никогда не
выйдет из допустимой области). Такая задача не имеет оптимального решения.
Как правило такое случается, если учтены не все ограничения.
𝑥𝑥2
𝐷𝐷
𝐴𝐴
𝑂𝑂
𝐵𝐵
∇𝑓𝑓
𝑙𝑙
Рисунок 6.2. Неединственность решения
𝑥𝑥1
Если задача линейного программирования содержит более двух переменных, то ее решают симплекс-методом. Этот метод изложен в {}
6.2. Элементы нелинейного программирования
Нелинейное программирования изучает методы оптимизации в случае,
когда целевая функция и (или) система ограничений не являются линейными.
Графическая иллюстрация задачи оптимизации при двух факторах 𝑥𝑥1 , 𝑥𝑥2
и нелинейной функции отклика представлена на рисунке 6.3. Здесь точка
𝑀𝑀1 (𝑥𝑥1∗ ; 𝑥𝑥2∗ ) соответствует оптимальным значениям факторов 𝑥𝑥1∗ и 𝑥𝑥2∗ , обеспечивающим минимум функции отклика 𝑦𝑦𝑚𝑚𝑖𝑖𝑛𝑛 , а точка 𝑀𝑀2 (𝑥𝑥1∗∗ ; 𝑥𝑥2∗∗ ) соответствует оптимальным значениям факторов 𝑥𝑥1∗∗ и 𝑥𝑥2∗∗ , обеспечивающим максимум функции отклика 𝑦𝑦𝑚𝑚𝑎𝑎𝑥𝑥 , 𝐷𝐷 – факторное пространство.
Поисковые методы оптимизации в этом случае относятся к классу итерационных процедур, при этом весь процесс разбивается на шаги, на каждом
Содержание
125
шаге делается ряд опытов и определяется, каким образом нужно изменить факторы, влияющие на процесс, чтобы получить улучшение результата. При этом
на каждом очередном шаге получаемая информация используется для выбора
последующего шага.
𝑦𝑦
𝑦𝑦 = 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 )
0
𝑥𝑥1
𝐷𝐷
• 𝑀𝑀1
•
𝑀𝑀2
𝑥𝑥2
Рисунок 6.3 – Поверхность отклика и точки экстремума
Разработано множество методов пошаговой оптимизации, которые подробно рассматриваются в дисциплине прикладной математики «Численные
методы». Мы же рассмотрим только два из них.
6.2.1. Метод покоординатного спуска
По этому методу выбирается произвольная точка 𝑀𝑀0 (𝑥𝑥10 ; 𝑥𝑥22 ; … ; 𝑥𝑥𝑛𝑛0 ) и
определяются ее координаты. Поиск точки минимума функции отклика осуществляется поочередным варьированием каждого их факторов (нахождение
точки максимума легко сводится к поиску точки минимума умножением функции отклика на (−1)). При этом сначала изменяют один фактор 𝑥𝑥1 , при фиксированных значениях остальных (𝑥𝑥2 = 𝑐𝑐𝑐𝑐𝑛𝑛𝑠𝑠𝑡𝑡, 𝑥𝑥3 = 𝑐𝑐𝑐𝑐𝑠𝑠𝑡𝑡, …), до тех пор, пока
не прекращается уменьшение функции отклика (точка 𝑀𝑀1 на рисунке 6.4).
В дальнейшем изменяется следующий фактор (𝑥𝑥2 ) при фиксированных
остальных, и далее процедура повторяется. Данный итерационный процесс заканчивается, если дальнейшее изменение любого из факторов не приводит к
уменьшению значения функции отклика.
Данный метод весьма прост, однако при большом числе факторов требуется значительное число шагов, чтобы достичь координат точки минимума.
На рисунке 6.4 замкнутые линии – это линии уровня функции отклика
(линии, у которых в каждой их точке значение функции отклика одинаково),
𝑀𝑀∗ − точка минимума.
Содержание
126
𝑥𝑥2
𝑀𝑀∗
𝑥𝑥1
Рисунок 6.4. Иллюстрация метода покоординатного спуска
6.2.2. Метод градиентного спуска
Метод градиентного спуска, в отличие от метода покоординатного
спуска, позволяет идти кратчайшим путем к точке минимума. Из курса математического анализа известно, что функция возрастает быстрее всего в
направлении вектора ее градиента (𝑔𝑔𝑟𝑟𝑎𝑎𝑑𝑑 𝑦𝑦), а убывает быстрее всего в направлении вектора, противоположного вектору градиента (−𝑔𝑔𝑟𝑟𝑎𝑎𝑑𝑑 𝑦𝑦). Движение по
градиенту (или противоположно вектору градиента) – это движение перпендикулярно линиям уровня, на которых функция отклика принимает постоянные значения 𝑦𝑦(𝑥𝑥1 ; 𝑥𝑥2 ; … ; 𝑥𝑥𝑛𝑛 ) = 𝐶𝐶.
В связи с этим, при нахождении точки минимума, движение целесообразно совершать в направлении наиболее быстрого убывания функции отклика, т.е. в направлении вектора противоположного вектору градиента функции y.
Сущность этого метода также рассмотрим на примере двухфакторной задачи (рисунок 6.5).
В этом случае пошаговое движение осуществляется в направлении
наискорейшего убывания функции отклика, т.е. в направлении −𝑔𝑔𝑟𝑟𝑎𝑎𝑑𝑑 𝑦𝑦.
Замечание. На рисунке 6.7 приведены линии уровня функции с двумя локальными минимумами в точках 𝑂𝑂1 и 𝑂𝑂2 . Такие функции принято называть
многоэкстремальными. Сравнивая между собой значения функции в точках
𝑂𝑂1 и 𝑂𝑂2 𝑦𝑦1 = 3, 𝑦𝑦2 = 1, находим, что наименьшее значение функция достигает
в точке 𝑂𝑂2 .
Представьте себе теперь, что, не имея перед глазами рисунка 6.7 и не зная
о многоэкстремальности функции, мы начали поиск наименьшего значения с
Содержание
127
помощью метода градиентного спуска из точки 𝐴𝐴1 . Поиск приведет нас в точку
𝑂𝑂1 , которую ошибочно можно принять за искомый ответ. С другой стороны,
если мы начнем поиск с точки 𝐴𝐴1 , то окажемся на правильном пути и быстро
придем в точку 𝑂𝑂2 .
𝑥𝑥2
10 𝑀𝑀1
11
14
13
12
𝑀𝑀2
9
8
7
1
6
5
2
Рисунок 6.5. Метод градиентного спуска
4
𝑀𝑀0
3
𝑥𝑥1
Как бороться с многоэкстремальностью? Универсального ответа на этот
вопрос нет. Самый простой прием состоит в том, что проводят поиск несколько раз, начиная его с разных точек. Если при этом получаются разные
ответы, то сравнивают в них значения целевой функции и выбирают наименьшее. Расчеты останавливают после того, как несколько новых поисков не меняют полученного ранее результата. Выбор начальных точек поиска, обоснованность прекращения расчетов в значительной степени зависят от опыта и
интуиции специалистов, решающих задачу.
Более подробно указанные методы изложены в [1], [3], [4].
128
Содержание
Рисунок 6.6. Метод градиентного спуска c поверхностью
отклика большой кривизны
Рисунок 6.7. Функция с двумя локальными минимумами
129
Приложение 1. Таблица значений функции Лапласа
Φ(𝑥𝑥 ) =
√
1
𝑥𝑥
∫ 𝑒𝑒 −𝑡𝑡
2𝜋𝜋 0
2 ⁄2
𝑑𝑑𝑡𝑡
Содержание
Содержание
130
Приложение 2. Таблица значений 𝑡𝑡 = 𝑡𝑡(𝛾𝛾, 𝑛𝑛)
𝑛𝑛
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
0,95
2,78
2,57
2,45
2,37
2,31
2,26
2,23
2,20
2,18
2,16
2,15
2,13
2,12
2,11
2,10
𝛾𝛾
0,99
4,60
4,03
3,71
3,50
3,36
3,25
3,17
3,11
3,06
3,01
2,98
2,95
2,92
2,90
2,88
0,999
8,61
6,86
5,96
5,41
5,04
4,78
4,59
4,44
4,32
4,22
4,14
4,07
4,02
3,97
3,92
𝑛𝑛
20
25
30
35
40
45
50
60
70
80
90
100
120
∞
Приложение 3. Таблица значений 𝑞𝑞 = 𝑞𝑞(𝛾𝛾, 𝑛𝑛)
𝑛𝑛
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
0,95
1,37
1,09
0,92
0,80
0,71
0,65
0,59
0,55
0,52
0,48
0,46
0,44
0,42
0,40
0,39
𝛾𝛾
0,99
2,67
2,01
1,62
1,38
1,20
1,08
0,98
0,90
0,83
0,78
0,73
0,70
0,66
0,63
0,60
0,999
5,64
3,88
2,98
2,42
2,06
1,80
1,60
1,45
1,33
1,23
1,15
1,07
1,01
0,96
0,92
𝑛𝑛
20
25
30
35
40
45
50
60
70
80
90
100
150
200
250
0,95
2,093
2,064
2,045
2,032
2,023
2,016
2,009
2,001
1,996
1,901
1,987
1,984
1,980
1,960
𝛾𝛾
0,99
2,861
2,797
2,756
2,720
2,708
2,692
2,679
2,662
2,649
2,640
2,633
2,627
2,617
2,576
0,999
3,883
3,745
3,659
3,600
3,558
3,527
3,502
3,464
3,439
3,418
3,403
3,392
3,374
3,291
0,95
0,37
0,32
0,28
0,26
0,24
0,22
0,21
0,188
0,174
0,161
0,151
0,143
0,115
0,099
0,089
𝛾𝛾
0,99
0,58
0,49
0,43
0,38
0,35
0,32
0,30
0,269
0,245
0,226
0,211
0,198
0,160
0,136
0,120
0,999
0,88
0,73
0,63
0,56
0,50
0,46
0,43
0,38
0,34
0,31
0,29
0,27
0,211
0,185
0,162
131
Содержание
Приложение 4. Виды распределений случайных величин
Равномерное распределение дискретной случайной величины
Случайная величина 𝑋𝑋, принимающая целые значения от 1 до n , имеет
равномерное распределение, если
1
P( X = m) = , m = 1, 2, ... , n .
n
Найдем математическое ожидание и дисперсию равномерно распределенной случайной величины 𝑋𝑋:
𝑛𝑛
𝑀𝑀(𝑋𝑋) = � 𝑖𝑖 ∙
𝑖𝑖=1
n
D( X ) = ∑ i 2 ⋅
i =1
=
𝑛𝑛 + 1
1 1
;
= (1 + 2 + ⋯ + 𝑛𝑛) =
2
𝑛𝑛 𝑛𝑛
1
1
(n + 1) 2
− M 2 ( X ) = (1 + 2 2 + . . . + n 2 ) −
=
4
n
n
n(n + 1)(2n + 1) (n + 1) 2 n 2 − 1
−
=
.
6n
4
12
Пример. Имеется связка из 5 ключей, из которых только один подходит
к открываемому замку. Найти распределение случайной величины X – числа
ключей, которые пришлось опробовать прежде, чем открыли замок.
Очевидно, X может принимать значения от 1 до 5, вероятности которых
можно вычислить так:
1
4 1 1
p1 = P( X = 1) = ; p2 = P( X = 2) = ⋅ = .
5
5 4 5
Если X = 2 , значит, опробованы 2 ключа. Данное событие представляет
собой произведение двух событий: первый ключ не подошел, вероятность 4/5,
второй подошел – вероятность 1/4.
Далее рассуждаем аналогично:
4 3 1 1
4 3 2 1 1
p3 = P( X = 3) = ⋅ ⋅ = ; p4 = P( X = 4) = ⋅ ⋅ ⋅ = ;
5 4 3 5
5 4 3 2 5
4 3 2 1
1
p5 = P( X = 5) = ⋅ ⋅ ⋅ ⋅ 1 = .
5 4 3 2
5
Биномиальное распределение дискретной случайной величины
Случайная величина 𝑋𝑋, принимающая целые значения от 0 до n , имеет
биномиальное распределение, если
P( X = m) = Cnm p m (1 − p ) n−m .
Содержание
132
Такое распределение имеет случайная величина 𝑋𝑋, равная числу осуществлений некоторого события А в серии из n испытаний, в каждом из которых вероятность появления события А постоянна и равна p . Числовые характеристики биномиального распределения можно найти по формулам:
M ( X ) = np; D( X ) = np (1 − p ); p (n + 1) − 1 ≤ Mo( X ) ≤ p (n + 1) .
Здесь Mo( X ) − наивероятнейшее значение 𝑋𝑋.
Пример. В корзине 50 шаров, из них 10 черных. Достают 5 шаров, причем
выборка осуществляется с возвращением шара перед выбором следующего
(повторная выборка). Охарактеризовать случайную величину Х − число обнаруженных в выборке шаров черного цвета.
Величина 𝑋𝑋 может принимать значения от 0 до 5. Так как выборка является повторной, то вероятность p обнаружить всякий раз черный шар постоянна и равна 10/50 = 0,2. Вероятности каждого значения X
формуле Бернулли:
вычислим по
pi = Cni p i (1 − p ) n−i , где i = 0, 1, ... , 5 .
Получим ряд распределения:
xi
pi
0
0,32768
1
0,4096
2
3
0,2048
4
0,0512
5
0,0064
0,00032
Найдем функцию распределения F (x) :
x
(− ∞; 0]
(0;1]
F (x )
0
0,32768
(1; 2]
(2; 3]
0,73728 0,94208
(3; 4 ]
(4; 5 ]
0,99328
0,99968
M ( X ) = np = 5 ⋅ 0,2 = 1; D( X ) = np (1 − p ) = 5 ⋅ 0,2 ⋅ 0,8 = 0,8.
Наивероятнейшее значение X ( Mo( X ) ) определяется из неравенства
0,2 ⋅ 6 − 1 ≤ Mo( X ) ≤ 0,2 ⋅ 6 или 0,2 ≤ Mo( X ) ≤ 1,2 .
Целым значением, удовлетворяющим этим двум неравенствам, является
𝑋𝑋= 1. Значит, Mo( X ) = 1 , что видно и из ряда распределения.
Гипергеометрическое распределение
Дискретная случайная величина Х имеет гипергеометрическое распределение, если
m n−m
CM
CN −M
P ( X = m) =
; m = 0, 1, 2, ... , min(n, M ) .
C Nn
(
Содержание
133
Такое распределение получается в следующей задаче. Имеется генеральная совокупность из N объектов, в числе которых находится 𝑀𝑀 интересующих
исследователей объектов. Из генеральной совокупности проводится бесповторная выборка объема 𝑛𝑛. Тогда случайная величина 𝑋𝑋, равная числу интересующих нас объектов из совокупности 𝑀𝑀, обнаруженных в выборке, имеет
гипергеометрическое распределение.
Пример. Воспользуемся условием предыдущей задачи, считая, что выборка является бесповторной, и найдем закон распределения случайной величины 𝑋𝑋, равной числу черных шаров в выборке.
Случайная величина 𝑋𝑋 может также меняться от 0 до 5. Вычислим вероятности каждого значения по формуле:
pi = P( X = i ) =
Составим ряд распределения
xi
0
1
pi
0,310563 0,431337
5−i
i
C10
C40
; i = 0, 1, ... 5.
5
C50
2
0,20984
3
4
5
0,044177 0,003965 0,000119
Как видим, вероятности отдельных значений 𝑋𝑋 несколько изменились по
сравнению с их значениями, рассчитанными по формуле Бернулли.
Числовые характеристики гипергеометрического распределения:
N −n M  M 
M
n 1 − .
M ( X ) = n ⋅ ; D( X ) =
N
N −1 N 
N
45
В данном примере M ( X ) = 1; D( X ) = ⋅ 5 ⋅ 0,2 ⋅ 0,8 ≈ 0,73 .
49
Формулой для математического ожидания можно воспользоваться для
оценки размера генеральной совокупности, если непосредственно подсчитать
число объектов в ней затруднительно. Такая ситуация возникает, если нужно
знать, например, число животных в популяции, обитающей на какой-либо территории, число птиц в стае, рыб в замкнутом водоеме и т.п. В этом случае метят M объектов из всей совокупности. Через некоторое время отбирают n
объектов и записывают количество меченых. Повторяя отбор несколько раз,
находят среднее количество меченых объектов, которое можно принять равным M ( X ) . Зная n , M и 𝑀𝑀(𝑋𝑋), можно найти N .
Содержание
134
Геометрическое распределение дискретной случайной величины
Случайная величина 𝑋𝑋 имеет геометрическое распределение, если
P( X = m) = (1 − p ) m p,
m = 0, 1, 2, ...
Такое распределение имеет случайная величина, равная числу испытаний
в схеме Бернулли до первого успеха (первого осуществления нужного события).
Пример. Воспользуемся условием задачи из предыдущих двух примеров,
но теперь уже будем проводить повторную выборку только до тех пор, пока
не встретится черный шар. Составим ряд распределения случайной величины
Х – количества сделанных попыток до появления черного шара.
Величина Х может принимать бесконечное множество значений 0,1,2...
Их вероятности вычисляются по формуле
pi = (1 − p )i p = 0,8i ⋅ 0,2 .
Вычислив по ней вероятности, составим ряд распределения:
xi
0
1
2
pi
0,2
0,16
0,128
3
4
5
0,1024 0,08192 0,06553
...
n
...
0,8n ⋅ 0,2
Значения вероятностей являются членами геометрической прогрессии,
использование свойств которой приводит к следующим формулам для числовых характеристик:
M (X ) =
1− р
(1 − p )
; D( X ) =
.
p2
p
Замечание. Формулы применимы, если число попыток не ограничено.
В данном примере M ( X ) = 5, D( X ) = 20 .
В некоторых задачах геометрическое распределение используется и для
вычисления вероятностей общего числа сделанных попыток, причем число попыток может быть ограничено величиной n . В этом случае X принимает значения от 1 до n , а их вероятности равны:
xi
1
2
...
i
...
n
pi
p
(1 − p) p
...
(1 − p )i −1 p
...
(1 − p ) n−1 p + (1 − p ) n
Содержание
135
Распределение Пуассона дискретной случайной величины
Случайная величина 𝑋𝑋, принимающая бесконечное множество значений
0,1,2…, имеет распределение Пуассона, если
P ( X = m) =
λm
m!
e −λ ,
где λ – параметр распределения, имеет смысл среднего числа наступлений
события за единицу времени.
Числовые характеристики пуассоновского распределения:
M ( X ) = D( X ) = λ .
Равномерное распределение непрерывной случайной величины
Случайная величина 𝑋𝑋, принимающая значения на отрезке [a; b ] , имеет
равномерное распределение, если плотность распределения f (x) имеет вид:
0, 𝑥𝑥 ≤ 𝑎𝑎;
1
𝑓𝑓(𝑥𝑥 ) = �
, 𝑎𝑎 < 𝑥𝑥 ≤ 𝑏𝑏;
𝑏𝑏 − 𝑎𝑎
0, 𝑥𝑥 > 𝑏𝑏.
Функция распределения:
x
F ( x) =
∫
a
dt
x−a
=
.
b−a b−a
Графики функций f (x) и F (x) приведены на рисунке 4.
f ( x)
F ( x)
1
b−a
1
0
a
b
x
0
a
b
Рисунок 4 − Графики функций 𝑓𝑓(𝑥𝑥) и 𝐹𝐹(𝑥𝑥)
равномерного распределения
Числовые характеристики равномерного распределения:
x
Содержание
136
b
b
xdx
b2 − a 2 b + a
1 x2
=
⋅
=
=
M (X ) =
;
b − a b − a 2 a 2(b − a )
2
∫
a
b
2
x 2 dx  b + a 
(b − a ) 2
−
D( X ) =
.
 =
b−a  2 
12
∫
a
Пример. Известно, что НСВ X равномерно распределена, причем
M ( X ) = 1 ; D( X ) = 3 . Найти промежуток [a; b ] , на котором 𝑋𝑋 принимает свои
значения.
Воспользовавшись предыдущими формулами, составим систему:
b+a
 2 = 1,

2
 (b − a ) = 3.
 12
У этой системы два решения: a1 = −2, b1 = 4 и a2 = 4, b2 = −2 . Поскольку
должно выполняться неравенство a < b , то выбираем первую пару в качестве
концов отрезка.
Показательное распределение непрерывной случайной величины
Случайная величина 𝑋𝑋, принимающая неотрицательные значения
(𝑋𝑋 ≥ 0), имеет показательное (экспоненциальное) распределение с
параметром λ , если плотность распределения имеет вид:
0, 𝑥𝑥 < 0;
𝑓𝑓(𝑥𝑥 ) = � −𝜆𝜆𝑥𝑥
𝜆𝜆𝑒𝑒 , 𝑥𝑥 ≥ 0.
Здесь параметр 𝜆𝜆 > 0.
Такое распределение имеет случайная величина, равная времени, прошедшему с начала отсчета до наступления события, которое в среднем происходит λ раз за единицу времени.
Функция распределения
x
F ( x) =
∫
0
x
∫
f (t )dt = λ e −λt dt = 1 − e −λx .
0
Если событием является отказ в работе некоторой системы, λ имеет
смысл среднего числа отказов (сбоев, поломок) системы. Чем меньше λ , тем
надежней система, тем меньше (при фиксированном значении x ) F (x) , поэтому функция распределения 1 − e − λx носит название функции надежности.
Содержание
137
Вид графиков функций f (x) и F (x) представлен на рисунке 5.
f (x )
F (x )
λ
1
0
0
x
x
Рисунок 5 − Графики функций 𝑓𝑓(𝑥𝑥) и 𝐹𝐹(𝑥𝑥) показательного распределения
Числовые характеристики показательного распределения:
∞
∞
∫
∫
M ( X ) = x f ( x)dx = λ x e −λx dx =
0
∞
∫
D( X ) = x 2 f ( x)dx −
0
0
1
λ
2
∞
∫
= λ x 2 e −λx dx −
0
1
λ
;
1
λ
2
=
1
λ2
.
Пример. В приборе за год работы происходит смена 10 деталей. Подсчитать вероятность выхода из строя прибора из-за неисправности деталей за 1000
часов непрерывной работы.
Пусть Х — время непрерывной работы прибора (до первой неисправности). Тогда
P ( X < 1000) = F (1000) = 1 − e − λ ⋅1000 .
Подставляя значение λ =
N
10
, найдем F (1000) ≈ 0,68 .
=
T 365 ⋅ 24
Распределение «хи-квадрат»
Пусть 𝑋𝑋𝑖𝑖 (𝑖𝑖 = 1,2, … , 𝑛𝑛) − случайные величины, имеющие нормальное
распределение, причем математическое ожидание каждой из них равно нулю,
а среднее квадратическое отклонение – единице. Тогда сумма квадратов этих
величин
𝑛𝑛
𝜒𝜒 2 = � 𝑋𝑋𝑖𝑖2
𝑖𝑖=1
138
Содержание
является случайной величиной, распределенной по закону 𝜒𝜒 2 («хи-квадрат») с
𝑘𝑘 = 𝑛𝑛 степенями свободы (понятие о числе степеней свободы поясняется в
приложении 6).
Аналитическое выражение для функции плотности распределения 𝜒𝜒 2 мы
здесь не приводим из-за его сложности.
С увеличением числа степеней свободы распределение 𝜒𝜒 2 медленно приближается к нормальному распределению.
𝐹𝐹-распределение (распределение Фишера 7)
Пусть 𝑌𝑌 и 𝑍𝑍 – независимые случайные величины, распределенные по закону 𝜒𝜒 2 со степенями свободы 𝑘𝑘1 и 𝑘𝑘2 . Тогда случайная величина
𝑌𝑌⁄𝑘𝑘1
𝐹𝐹 =
𝑍𝑍⁄𝑘𝑘2
имеет распределение, называемое 𝐹𝐹-распределением или распределением Фишера со степенями свободы 𝑘𝑘1 и 𝑘𝑘2 .
Аналитическое выражение для функции плотности 𝐹𝐹-распределения мы
здесь не приводим из-за его сложности.
Распределение Стьюдента
Пусть 𝑍𝑍 – случайная величина, имеющая нормальное распределение, причем 𝑀𝑀(𝑍𝑍) = 0, 𝜎𝜎(𝑍𝑍) = 1, а 𝑌𝑌 – независимая от 𝑍𝑍 случайная величина, имеющая
распределение 𝜒𝜒 2 с 𝑘𝑘 степенями свободы. Тогда случайная величина
𝑍𝑍
𝑇𝑇 =
�𝑌𝑌/𝑘𝑘
имеет распределение, называемое t-распределением или распределением
Стьюдента 8 (псевдоним английского статистика В. Госсета 9), с 𝑘𝑘 степенями
свободы.
С увеличением числа степеней свободы распределение Стьюдента
быстро приближается к нормальному распределению.
Сэр Рональд Эйлмер Фишер (англ. Sir Ronald Aylmer Fisher, 17 февраля 1890 — 29 июля 1962) — английский статистик, биолог-эволюционист и генетик. Андерс Халд охарактеризовал его как «гения, едва не в одиночку заложившего основы современной статистики», а Ричард Докинз назвал «величайшим биологом, подобным Дарвину».
8
Данный критерий был разработан Уильямом Госсетом для оценки качества пива в компании Гиннесс.
В
связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса
считало таковой использование статистического аппарата в своей работе), статья Госсета вышла в 1908 году
в журнале «Биометрика» под псевдонимом «Student» (в переводе с английского − cтудент).
9
Уи́льям Си́ли Го́ссет (William Sealy Gosset, 13 июня 1876, Кентербери − 16 октября 1937, Беконсфильд) −
известный учёный-статистик, более известный под своим псевдонимом Стьюдент.
7
139
Приложение 5. Критические точки распределения 𝜒𝜒 2
𝑘𝑘 – число степеней свободы.
Содержание
140
Приложение 6. Понятие о числе степеней свободы
Содержание
Количество свободно варьирующих величин (независимых друг от друга
величин) называется числом степеней свободы.
Из математической статистики известно, что при определении любых
средних величин сумму всех показателей необходимо делить на число независимых друг от друга величин.
При вычислении выборочной средней 𝑥𝑥 все величины (варианты) независимы друг от друга, поэтому их сумма делится на общее число вариант 𝑛𝑛
(сумма делится на число степеней свободы), т.е.
∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖
.
(6.1)
𝑥𝑥 =
𝑛𝑛
При вычислении исправленной выборочной дисперсии мы используем
формулу:
∑𝑛𝑛𝑖𝑖=1(𝑥𝑥𝑖𝑖 − 𝑥𝑥 )2 ∑𝑛𝑛𝑖𝑖=1(𝑥𝑥𝑖𝑖 − 𝑥𝑥 )2
𝑛𝑛
𝑛𝑛
2
𝑠𝑠 =
𝐷𝐷 =
∙
=
.
(6.2)
𝑛𝑛 − 1
𝑛𝑛 − 1
𝑛𝑛
𝑛𝑛 − 1
Здесь мы сумму квадратов отклонений делим на 𝑛𝑛 − 1, а следовательно,
число степеней свободы, при вычислении 𝑠𝑠 2 , на единицу меньше количества
вариант.
Возникает вопрос: почему количество независимых величин уменьшилось?
Дело в том, что формула (6.2) содержит в себе выборочную среднюю 𝑥𝑥.
Поэтому, когда уже известен ряд наблюдений 𝑥𝑥1 , 𝑥𝑥2 , …, 𝑥𝑥𝑛𝑛 , любое значение
ряда 𝑥𝑥𝑗𝑗 легко определить по 𝑥𝑥 и значениям остальных 𝑛𝑛 − 1 вариант
(варианта 𝑥𝑥𝑗𝑗 находится из соотношения (6.1)).
Поэтому любая отдельная варианта как бы лишена свободной вариации и
точно определяется варьированием всех остальных вариант и средним значением. В связи с этим число степеней свободы при определении 𝑠𝑠 2 равно не 𝑛𝑛,
а 𝑛𝑛 − 1.
Р. Фишер писал: «В математической статистике степени свободы –
наименьшее число независимых (свободных) величин в данной задаче».
Если 𝑛𝑛 – число величин, 𝑘𝑘 – число ограничений (связей), то число степеней свободы 𝑓𝑓 = 𝑛𝑛 − 𝑘𝑘.
Содержание
141
Приложение 7. Критические значения t–критерия Стьюдента на уровнях значимости 0,1; 0,05; 0,01
k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
0,10
6,3138
2,9200
2,3534
2,1318
2,0150
1,9432
1,8946
1,8595
1,8331
1,8125
1,7959
1,7823
1,7709
1,7613
1,7530
1,7459
1,7396
α
0,05
12,706
4,3027
3,1825
2,7764
2,5706
2,4469
2,3646
2,3060
2,2622
2,2281
2,2010
2,1788
2,1604
2,1448
2,1315
2,1199
2,1098
0,01
63,657
9,9248
5,8409
4,6041
4,0321
3,7074
3,4995
3,3554
3,2498
3,1693
3,1058
3,0545
3,0123
2,9768
2,9467
2,9208
2,8982
α
k
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
∞
0,10
1,7341
1,7291
1,7247
1,7207
1,7171
1,7139
1,7109
1,7081
1,7056
1,7033
1,7011
1,6991
1,6973
1,6839
1,6707
1,6577
1,6449
Приложение 8. Шкала Чеддока.
(характеристика связи)
Показатели
Характеристика
0,1 – 0,3
слабая связь
0,3 – 0,5
умеренная связь
0,5 – 0,7
заметная связь
0,7 – 0,9
высокая связь
0,9 – 0,99
весьма высокая связь
0,05
2,1009
2,0930
2,0860
2,0796
2,0739
2,0687
2,0639
2,0595
2,0555
2,0518
2,0484
2,0452
2,0423
2,0211
2,0003
1,9799
1,9600
0,01
2,8784
2,8609
2,8453
2,8314
2,8188
2,8073
2,7969
2,7874
2,7787
2,7707
2,7633
2,7564
2,7500
2,7045
2,6603
2,6174
2,5758
142
Содержание
Приложение 9. Таблица значений F-критерия Фишера
Таблица значений F-критерия Фишера на уровне значимости α = 0,05
k1
1
2
3
4
5
6
8
12
24
∞
k2
1 161,45 199,50 215,72 224,57 230,17 233,97 238,89 243,91 249,04 254,32
2 18,51 19,00 19,16 19,25 19,30 19,33 19,37 19,41 19,45 19,50
3 10,13
9,55
9,28
9,12
9,01
8,94
8,84
8,74
8,64
8,53
4 7,71
6,94
6,59
6,39
6,26
6,16
6,04
5,91
5,77
5,63
5 6,61
5,79
5,41
5,19
5,05
4,95
4,82
4,68
4,53
4,36
6 5,99
5,14
4,76
4,53
4,39
4,28
4,15
4,00
3,84
3,67
7 5,59
4,74
4,35
4,12
3,97
3,87
3,73
3,57
3,41
3,23
8 5,32
4,46
4,07
3,84
3,69
3,58
3,44
3,28
3,12
2,93
9 5,12
4,26
3,86
3,63
3,48
3,37
3,23
3,07
2,90
2,71
10 4,96
4,10
3,71
3,48
3,33
3,22
3,07
2,91
2,74
2,54
11 4,84
3,98
3,59
3,36
3,20
3,09
2,95
2,79
2,61
2,40
12 4,75
3,88
3,49
3,26
3,11
3,00
2,85
2,69
2,50
2,30
13 4,67
3,80
3,41
3,18
3,02
2,92
2,77
2,60
2,42
2,21
14 4,60
3,74
3,34
3,11
2,96
2,85
2,70
2,53
2,35
2,13
15 4,54
3,68
3,29
3,06
2,90
2,79
2,64
2,48
2,29
2,07
16 4,49
3,63
3,24
3,01
2,85
2,74
2,59
2,42
2,24
2,01
17 4,45
3,59
3,20
2,96
2,81
2,70
2,55
2,38
2,19
1,96
18 4,41
3,55
3,16
2,93
2,77
2,66
2,51
2,34
2,15
1,92
19 4,38
3,52
3,13
2,90
2,74
2,63
2,48
2,31
2,11
1,88
20 4,35
3,49
3,10
2,87
2,71
2,60
2,45
2,28
2,08
1,84
21 4,32
3,47
3,07
2,84
2,68
2,57
2,42
2,25
2,05
1,81
22 4,30
3,44
3,05
2,82
2,66
2,55
2,40
2,23
2,03
1,78
23 4,28
3,42
3,03
2,80
2,64
2,53
2,38
2,20
2,00
1,76
24 4,26
3,40
3,01
2,78
2,62
2,51
2,36
2,18
1,98
1,73
25 4,24
3,38
2,99
2,76
2,60
2,49
2,34
2,16
1,96
1,71
26 4,22
3,37
2,98
2,74
2,59
2,47
2,32
2,15
1,95
1,69
27 4,21
3,35
2,96
2,73
2,57
2,46
2,30
2,13
1,93
1,67
28 4,20
3,34
2,95
2,71
2,56
2,44
2,29
2,12
1,91
1,65
29 4,18
3,33
2,93
2,70
2,54
2,43
2,28
2,10
1,90
1,64
30 4,17
3,32
2,92
2,69
2,53
2,42
2,27
2,09
1,89
1,62
35 4,12
3,26
2,87
2,64
2,48
2,37
2,22
2,04
1,83
1,57
40 4,08
3,23
2,84
2,61
2,45
2,34
2,18
2,00
1,79
1,51
45 4,06
3,21
2,81
2,58
2,42
2,31
2,15
1,97
1,76
1,48
50 4,03
3,18
2,79
2,56
2,40
2,29
2,13
1,95
1,74
1,44
60 4,00
3,15
2,76
2,52
2,37
2,25
2,10
1,92
1,70
1,39
70 3,98
3,13
2,74
2,50
2,35
2,23
2,07
1,89
1,67
1,35
80 3,96
3,11
2,72
2,49
2,33
2,21
2,06
1,88
1,65
1,31
90 3,95
3,10
2,71
2,47
2,32
2,20
2,04
1,86
1,64
1,28
100
3,94
3,09
2,70
2,46
2,30
2,19
2,03
1,85
1,63
1,26
125 3,92
3,07
2,68
2,44
2,29
2,17
2,01
1,83
1,60
1,21
150 3,90
3,06
2,66
2,43
2,27
2,16
2,00
1,82
1,59
1,18
200 3,89
3,04
2,65
2,42
2,26
2,14
1,98
1,80
1,57
1,14
300 3,87
3,03
2,64
2,41
2,25
2,13
1,97
1,79
1,55
1,10
400 3,86
3,02
2,63
2,40
2,24
2,12
1,96
1,78
1,54
1,07
500 3,86
3,01
2,62
2,39
2,23
2,11
1,96
1,77
1,54
1,06
1000 3,85
3,00
2,61
2,38
2,22
2,10
1,95
1,76
1,53
1,03
2,99
2,60
2,37
2,21
2,09
1,94
1,75
1,52
1,00
∞ 3,84
Содержание
143
Приложение 10. Критические значения критерия Н.В. Смирнова 𝒖𝒖𝒖𝒖,𝒏𝒏 в зависимости от объема выборки 𝒏𝒏 и уровня значимости 𝒖𝒖
𝑛𝑛
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
𝛼𝛼 =0,10
1,15
1,42
1,60
1,73
1,83
1,91
1,98
2,03
2,09
2,13
2,17
2,21
2,25
2,28
2,31
2,34
2,36
2,38
2,41
2,43
2,45
2,47
2,49
𝑢𝑢𝛼𝛼,𝑛𝑛
𝛼𝛼 =0,05
1,15
1,46
1,67
1,82
1,94
2,03
2,11
2,18
2,23
2,29
2,33
2,37
2,41
2,44
2,48
2,50
2,53
2,53
2,58
2,60
2,62
2,64
2,66
𝛼𝛼 =0,01
1,15
1,49
1,75
1,94
2,10
2,22
2,32
2,41
2,48
2,55
2,61
2,66
2,70
2,75
2,78
2,82
2,85
2,88
2,91
2,94
2,96
2,99
3,01
Содержание
144
Приложение 11. Коэффициенты Диксона в зависимости от объема выборки 𝒏𝒏
и уровня значимости 𝒖𝒖
𝑛𝑛
3
4
5
6
7
8
9
1
4
5
6
7
8
9
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
3
𝛼𝛼 = 0,10
0,886
0,679
0,557
0,482
0,434
0,479
0,441
0,409
0,935
0,782
0,670
0,596
0,545
0,505
0,474
0,517
0,490
0,467
0,492
0,472
0,454
0,438
0,424
0,412
0,401
0,391
0,382
0,374
0,367
0,360
0,354
0,348
0,342
0,337
0,332
𝛼𝛼 = 0,05
0,941
0,765
0,642
0,560
0,507
0,554
0,512
0,477
0,967
0,845
0,736
0,661
0,607
0,565
0,531
0,576
0,546
0,521
0,546
0,525
0,507
0,490
0,475
0,462
0,450
0,440
0,430
0,421
0,413
0,406
0,399
0,393
0,387
0,381
0,376
𝛼𝛼 = 0,01
0,988
0,889
0,780
0,698
0,637
0,683
0,635
0,597
0,992
0,929
0,836
0,778
0,710
0,667
0,632
0,679
0,642
0,615
0,641
0,616
0,595
0,577
0,561
0,547
0,535
0,524
0,514
0,505
0,497
0,489
0,486
0,475
0,469
0,463
0,457
𝛼𝛼 = 0,005
0,994
0,926
0,821
0,740
0,680
0,725
0,677
0,639
0,996
0,950
0,865
0,814
0,746
0,700
0,664
0,713
0,675
0,649
0,674
0,647
0,624
0,605
0,589
0,575
0,562
0,551
0,541
0,532
0,524
0,516
0,508
0,501
0,495
0,489
0,483
Коэффициент
Диксона
r10
r11
r20
r21
r22
Содержание
145
Приложение 12. Распределение Кохрена
Квантили 𝐺𝐺𝛼𝛼,𝑚𝑚1,𝑚𝑚2 распределения Кохрена для уровня значимости 𝛼𝛼 = 0,05 в
зависимости от числа степеней свободы 𝑚𝑚1 и 𝑚𝑚2
m1
m2
2
1
0,9985
2
0,9750
3
0,9392
4
0,9057
5
0,8772
6
0,8534
7
0,8333
8
0,8159
9
0,8010
3
4
5
6
7
8
9
10
12
15
20
24
30
40
0,9669
0,9065
0,8412
0,7808
0,7271
0,6798
0,6385
0,6020
0,5410
0,4709
0,3894
0,3434
0,2929
0,2370
0,8709
0,7679
0,6838
0,6161
0,5612
0,5157
0,4775
0,4450
0,3924
0,3346
0,2705
0,2354
0,1980
0,1576
0,7977
0,6841
0,5981
0,5321
0,4800
0,4377
0,4027
0,3733
0,3264
0,2758
0,2205
0,1907
0,1593
0,1259
0,7457
0,6287
0,5441
0,4803
0,4307
0,3910
0,3584
0,3311
0,2880
0,2419
0,1921
0,1656
0,1377
0,1082
0,7071
0,5895
0,5065
0,4447
0,3974
0,3595
0,3286
0,3029
0,2626
0,2195
0,1735
0,1493
0,1237
0,0968
0,6771
0,5598
0,4783
0,4184
0,3726
0,3362
0,3067
0,2823
0,2439
0,2034
0,1602
0,1374
0,1137
0,0887
0,6530
0,5365
0,4564
0,3980
0,3535
0,3185
0,2901
0,2666
0,2299
0,1911
0,1501
0,1286
0,1061
0,0827
0,6333
0,5175
0,4387
0,3817
0,3384
0,3043
0,2768
0,2541
0,2187
0,1815
0,1422
0,1216
0,1002
0,0780
0,6167
0,5017
0,4241
0,3682
0,3259
0,2926
0,2659
0,2439
0,2098
0,1736
0,1357
0,1160
0,0958
0,0745
60 0,1737
120 0,0998
0,1131
0,0632
0,0895
0,0495
0,0765
0,0419
0,0682
0,0371
0,0623
0,0337
0,0583
0,0312
0,0552
0,0292
0,0520
0,0279
146
Содержание
Литература
1. Прикладная математика. Краткий курс лекций / Степовой Д.В., Середина
М.Н., Удинцова Н.М., Серегина В.В. [Электронный ресурс]: учебное пособие/ Д.В. Степовой., Середина М.Н., Удинцова Н.М., Серегина В.В. − Электрон. дан. – Зерноград: Азово-Черноморский инженерный институт ФГБОУ
ВО Донской ГАУ, 2022 – 158 с.
2. Д.В. Степовой, Л.В. Кравченко. Исследование операций. Учебное пособие.
− Зерноград: ФГОУ ВПО АЧГАА, 2011. – 116с.
3. Есипов Б.А. Методы исследования операций: учебник для вузов. − СПб.:
Издательство «Лань», 2010 .-256 с.
4. Кузнецов А.В. Высшая математика. Математическое программирование:
Учебник для вузов. СПб.: Издательство «Лань», 2010. -352 с.
5. Методы планирования и обработки результатов инженерного эксперимента: Учебное пособие / Н.А. Спирин, В.В. Лав-ров, Л.А. Зайнуллин, А.Р.
Бондин, А.А. Бурыкин; Под общ. ред. Н.А. Спирина. — Екатеринбург: ООО
«УИНЦ», 2015. — 290 с.
6. Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Издво Юрайт, 2014.
7. Налимов В.В, Голикова Т.И. Логические основы планирования эксперимента. — М.: Металлургия, 1980. — 152 с.
Содержание
147
Предметный указатель
А
Абсолютная ошибка аппроксимации, 66
Активный эксперимент, 13
Альтернативная гипотеза, 44
Б
Бесповторная выборка, 33
Биномиальное распределение, 131
В
Варианта, 33
Вариационная кривая, 37
Вариационный ряд, 33
Вероятность события, 16
Выборка, 33
Выборочная дисперсия, 39
Выборочная средняя, 38
Г
Генеральная совокупность, 33
Генерирующее соотношение, 110
Геометрическое распределение, 134
Гипергеометрическое распределение, 132
Гистограмма относительных частот, 37
Гистограмма частот, 36
Граничная прямая, 121
Д
Дискретная случайная величина, 19
Дискретный ряд распределения, 34
Дисперсия воспроизводимости отклика, 106
Дисперсия дискретной случайной величины, 21
Дисперсия непрерывной случайной величины, 25
Доверительная вероятность, 42
Доверительный интервал, 42
Допустимая область, 121
Допустимое множество задачи линейного
программирования, 119
Допустимое решение задачи линейного
программирования, 119
Достоверное событие, 15
Дробный факторный эксперимент, 109
З
Зависимый признак, 62
Закон распределения ДСВ, 19
И
Индекс детерминации, 91
Индекс корреляции, 92
Интервал варьирования факторов, 101
Интервальная оценка параметра, 42
Интервальный ряд распределения, 36
Исправленная выборочная дисперсия, 39
Исправленное среднее квадратическое отклонение, 40
К
Качественный эксперимент, 9
Классическое определение вероятности, 17
Количественный эксперимент, 10
Конкурирующая гипотеза, 44
Корреляционная связь, 63
Коэффициент вариации, 41
Коэффициент детерминации, 85
Кривая Гаусса, 27
Критерий χ2, 47
Критерий Пирсона, 47
Критерий согласия, 46
Критическая область проверяемой гипотезы, 45
Критическая точка критерия, 46
Л
Лабораторный эксперимент, 13
Линейная связь признаков, 63
Линейный коэффициент корреляции, 84
М
Математическое ожидание дискретной случайной
величины, 20
Математическое ожидание непрерывной случайной
величины, 25
Матрица условий задачи линейного программирования,
120
Метод наименьших квадратов, 67
Множественная регрессия, 64
Н
Наблюдаемое значение критерия, 45
Надежность критерия, 46
Надежность оценки, 42
Насыщенный план, 102
Невозможное событие, 15
Содержание
148
Непрерывная случайная величина, 19
Несовместные события, 16
Нормальная кривая, 27
Нормальное распределение, 27
Нормированная случайная величина, 31
Нормированное нормальное распределение, 31
Нулевая гипотеза, 44
О
Область принятия гипотезы, 46
Обратная связь признаков, 62
Общая дисперсия, 89
Общая задача линейного программирования, 118
Опорная прямая, 123
Определяющий контраст, 110
Оптимальное решение задачи линейного
программирования, 119
Опыт, 9
Ортогональный план, 104
Основная гипотеза, 44
Остаточная дисперсия, 90
Отклик, 11
Отклонение случайной величины, 21
Относительная ошибка аппроксимации, 66
Относительная частота варианты, 33
Относительная частота события, 17
Ошибка аппроксимации, 66
П
Парная регрессия, 64
Пассивный эксперимент, 12
План эксперимента, 13
Планирование эксперимента, 13
Плотность относительной частоты, 37
Плотность частоты, 36
Повторная выборка, 33
Показательное распределение, 136
Поле корреляции, 65
Полигон относительных частот, 36
Полигон частот, 36
Полная группа событий, 16
Полный факторный эксперимент, 103
Полуреплика, 109
Приведенная случайная величина, 31
Промышленный эксперимент, 14
Прямая связь признаков, 62
Р
Равномерное распределение дискретной случайной
величины, 131
Равномерное распределение непрерывной случайной
величины, 135
Размах варьирования, 35, 52
Ранжирование, 33
Распределение χ2, 138
Распределение Гаусса, 27
Распределение Пуассона, 135
Распределение Стьюдента (t-распределение), 138
Распределение Фишера (F-распределение), 138
Результативный признак, 62
Репрезентативная выборка, 33
Ротатабельный план, 107
С
Система ограничений задачи линейного
программирования, 119
Случайная величина, 19
Случайное событие, 15
Событие, 15
Совместные события, 16
Спецификация модели, 64
Среднее квадратическое отклонение, 22, 26
Средняя ошибка аппроксимации, 67
Стандартная форма задачи линейного
программирования, 119
Стандартное нормальное распределение, 31
Стандартное отклонение, 22
Статистическая вероятность, 18
Статистическая гипотеза, 44
Статистическая кривая распределения, 37
Статистический критерий, 45
Статистическое распределение выборки, 34
Степень свободы, 140
Стохастическая зависимость, 63
Т
Точечная оценка параметра, 42
У
Уравнение регрессии, 63
Уровень значимости статистического критерия, 45
Уровень фактора, 10
Ф
Фактор, 10
Факторная дисперсия, 90
Факторное пространство, 101
Факторный признак, 62
Функция Лапласа, 28
Функция отклика, 12
Функция плотности распределения вероятностей
непрерывной случайной величины, 24
Функция распределения случайной величины, 23
Ц
Целевая функция, 119
Содержание
149
Центрированная случайная величина, 30
Ч
Частота варианты, 33
Число степеней свободы, 140
Ш
Шкала Чеддока, 85
Э
Экспоненциальное распределение, 136
Эмпирический закон распределения, 34
150
Содержание
Учебное издание
Степовой Дмитрий Владимирович, канд. физ.-мат. наук, доцент,
Середина Марина Николаевна, канд. техн. наук, доцент,
Удинцова Надежда Михайловна, канд. техн. наук, доцент,
Жидченко Татьяна Викторовна, канд. техн. наук, доцент
ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА И
ОБРАБОТКА РЕЗУЛЬТАТОВ
Учебное пособие
Авторская редакция
Объем ЭИ: 2,24 Мб.
Формат ЭИ Portable Document Format (PDF).
Download