Глава 1 Адлер Как планировать

advertisement
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
РОССИЙСКОЙ ФЕДЕРАЦИИ
Государственное образовательное учреждение бюджетного образования
«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ПИЩЕВЫХ ПРОИЗВОДСТВ»
Конопленко Е.И., Хореева Н.К., Лапусь А.П.
Методические указания
по курсу ″ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА″
для студентов заочной формы обучения
Москва, 2011
ОГЛАВЛЕНИЕ
Планирование эксперимента............................................................................................................................................2
Регрессионный анализ для ортогональных двухуровневых планов...........................................................................14
Основной эксперимент, планы первого порядка..........................................................................................................21
Построение матрицы планирования...........................................................................................................................25
Алгоритм расчета полного факторного эксперимента типа 2n...............................................................................32
1. Построение матрицы планирования...................................................................................................................32
2. Расчет коэффициентов уравнения регрессии (линейная форма). ...................................................................33
3. Расчет ошибки опыта (дисперсии воспроизводимости)...................................................................................33
4. Принятие решений................................................................................................................................................34
5. Проверка значимости коэффициентов регрессии.............................................................................................34
6. Принятие решений................................................................................................................................................35
7. Проверка адекватности линейного уравнения регрессии.................................................................................36
8. Принятие решений................................................................................................................................................40
ПРИЛОЖЕНИЕ 1...........................................................................................................................................................40
Планирование эксперимента
Под планированием эксперимента понимается процедура выбора числа
опытов и условий их проведения, необходимых для решения поставленной
задачи с требуемой точностью. Все факторы, определяющие процесс,
изменяются
одновременно
по
специальным
правилам,
а
результаты
эксперимента представляются в виде математической модели,
Этапы построения математической модели
1. сбор и анализ априорной информации;
2. выбор входных и выходных переменных, области экспериментирования;
3. выбор математической модели, с помощью которой будут представляться
экспериментальные данные;
4. выбор критерия оптимальности и плана эксперимента;
5. определение метода анализа данных;
6. проведение эксперимента;
7. проверка
статистических
предпосылок
для
полученных
экспериментальных данных;
8. обработка результатов;
9. интерпретация и рекомендации.
Выбор входных и выходных переменных
Входные переменные (будем называть их факторами) определяют состояние
объекта.
Основное
требование
к
факторам
—
управляемость.
Под
управляемостью понимается установление нужного значения фактора (уровня)
и поддержание его в течение всего опыта. В этом состоит особенность
активного
эксперимента.
Факторы
могут
быть
количественными
и
качественными. Примерами количественных факторов являются температура,
давление, концентрация и т. п. Их уровням соответствует числовая шкала.
Различные катализаторы, конструкции аппаратов, способы лечения, методики
преподавания являются примерами качественных факторов. Уровням таких
факторов не соответствует числовая шкала, и их порядок не играет роли.
Выходные переменные — это реакции (отклики) на воздействие входных
переменных. Отклик зависит от специфики исследования и может быть
экономическим
(прибыль,
рентабельность),
технологическим
(выход,
надежность), психологическим, статистическим и т. д. Параметр оптимизации
должен быть эффективным с точки зрения достижения цели, универсальным,
количественным, выражаемым числом, имеющим физический смысл, быть
простым и легко вычисляемым.
Обозначим наблюдаемый отклик через у, а факторы — через x1, x2, ….xk.
Выбор модели зависит от наших знаний об объекте, целей исследования и
математического аппарата. При изучении кинетики химических процессов
принято
пользоваться
равновесия
часто
дифференциальными
описываются
уравнениями.
дробно-рациональными
Химические
функциями,
а
колебательные процессы в химических реакторах — тригонометрическими.
Если вид функции неизвестен, то полезным оказывается ее представление в
виде разложения в степенные ряды.
При определенных условиях такое разложение в многочлен возможно для
всех непрерывных функций. На основании экспериментальных данных нужно
получить некоторое представление о функции отклика η = f(x1, x2, ….., xk). Если
аналитический вид этой функции неизвестен, то её можно представить в виде
степенного ряда:
η = β0 + ∑ βi xi + ∑ βi j xi x j + ∑ βi i xi2 + ....
η = a 0 + ∑ a1 xi + ∑ β i j xi x j + ∑ β i i xi2 + ....
Пользуясь результатами эксперимента, можно получить лишь оценки
параметров этой модели:
yˆ = b0 + ∑bi xi + ∑bi j xi x j + ∑bii xi2 + .....
где
ŷ
— значение отклика, предсказанного этим уравнением. Оценки
коэффициентов получают с помощью метода наименьших квадратов.
После построения математической модели, проведем статистический
анализ.
При статистическом анализе проверяется значимость коэффициентов
регрессии и адекватность линейной модели. Под адекватностью понимается
соответствие модели экспериментальным данным по выбранному критерию.
Планированию экспериментов предшествует этап неформализованных
решений о выборе области экспериментирования (области факторного
пространства, изучение которой представляет интерес для экспериментатора),
Планированию эксперимента предшествует этап определённости
центра эксперимента и интервалов варьирования факторов. При этом
оцениваются
границы
принципиальными
областей
определения
ограничениями
либо
факторов,
задаваемых
технико-экономическими
соображениями.
Построение
наиболее
простых
-
планов
сводится
к
выбору
экспериментальных точек, симметричных относительно центра эксперимента.
В этом случае все k факторов изменяются на двух уровнях, и план
эксперимента носит название плана типа 2k. Уровни факторов изображаются
двумя точками на каждой из k координатных осей факторного k-мерного
пространства. Эти уровни симметричны относительно основного уровня. Один
из них — верхний, другой — нижний. Интервалом варьирования факторов
называется некоторое число (свое для каждого фактора), прибавление которого
к основному уровню дает верхний уровень, а вычитание — нижний. Чтобы
упростить и унифицировать запись условий опытов и облегчить обработку
экспериментальных данных, масштабы по осям задаются в виде кодированных
значений +1 и -1, Для количественных факторов это всегда можно сделать с
~ ~
помощью преобразования x j = ( x j − x j 0 ) / I j , где xj — кодированное значение
~
xj
фактора,
~
x j0
—
натуральное
его
значение,
— натуральное значение основного уровня, Ij — интервал варьирования.
Пусть в эксперименте изменяются два фактора на двух уровнях:
~
x1
— температура и
~
x2
- время реакции. Для температуры основным уровнем
является 50 °С, а интервал варьирования составляет 10 °С. Тогда для
~
x1
50+10=60 °С, будет верхним уровнем, а 50—10=40 °С — нижним. В
кодированных значениях это запишется так: (60—50)/10= 1 и (40—50)/10=-1.
Если для
~
x2
x 20 =30мини и I2=5 мин, то (35—30)/5=1 и (25—30)/5=-1.
, выбраны ~
Эксперимент, в котором реализуются все возможные сочетания уровней
факторов, называется полным факторным экспериментом (ПФЭ). Для двух
уровней это будет ПФЭ типа 2k, а для п уровней — ПФЭ типа пk. Условия
эксперимента представляются в виде таблицы — матрицы планирования, где
строки соответствуют различным опытам, а столбцы — значениям факторов.
Пример матрицы планирования для ПФЭ 22:
Номер
X1 X2
опыта
1
-1
-1
2
+1 +1
3
-1
+1
4
+1 -1
Геометрическая интерпретация ПФЭ типа 2 k:
Y
Y1
Y2
Y3
Y4
план 22 задается координатами
вершин квадрата, план 23 — координатами вершин куба, при k>3 —
координатами вершин гиперкуба (рис. 1 — геометрическая интерпретация
ПФЭ 22, рис. 2 — геометрическая интерпретация ПФЭ 23).
Рис. 1. Геометрическая интерпретация полного
факторного эксперимента 22
Рис, 2. Геометрическая интерпретация полного
факторного эксперимента 23
ПФЭ типа 2k обладает следующими свойствами.
Симметричность относительно центра эксперимента. Это значит, что
алгебраическая сумма элементов вектор-столбца для каждого фактора равна 0,
N
т. е.
∑x
i =1
ji
= 0 , где j — номер фактора (j=1, 2, ,.., k), i — номер опыта (i=1, 2, ...,
N).
Условие нормировки — формулируется следующим образом: сумма
N
квадратов элементов каждого столбца равна числу опытов, т. е.
∑x
i =1
2
ji
= N . Это
следствие того, что значения факторов в матрице задаются в кодированном
виде как +1 и —1.
Ортогональность
сумма почленных произведений любых двух вектор-
столбцов матрицы равна 0:
N
∑x
i =1
ji
xui = 0, j ≠ u, j , u = 1,2....., k .
Рис 3. Геометрическая интерпретация парного
эффекта взаимодействия факторов
Ортогональностью матриц планов, типа 2k.
ПФЭ позволяет количественно оценить все линейные эффекты факторов
и их взаимодействия. Взаимодействие возникает в том случае, если эффект
одного фактора зависит от уровня, на котором находится другой фактор.
x1
Рассмотрим пример: зависимость выхода продукта у от температуры ~
.На рисунке 3 приведена геометрическая
x 2 =25 мин) для некоторого химического
При малом времени реакции ( ~
процесса выход основного вещества увеличивается с ростом температуры от 40
x 2 =100 мин) тенденция изменения отклика
до 60 °С, а при большом времени ( ~
становится обратной. Это и есть эффект взаимодействия факторов х1 и х2.
Для ПФЭ 22 матрица планирования с учетом свободного члена b0 и эффекта
взаимодействия b12 выглядит так:
Номер X0
опыта
1
+1
2
+1
3
+1
4
+1
Этот план соответствует модели
X1
X2
X1X2 Y
-1
+1
-1
+1
-1
+1
-1
+1
+1
+1
-1
-1
Y1
Y2
Y3
Y4
yˆ = b0 x 0 + b1 x1 + b2 x 2 + b12 x1 x 2
Столбцы х1 и х2 задают планирование — по ним непосредственно
определяются условия проведения опытов, а столбцы х0 и х1х2 служат только
для расчета. Эффект взаимодействия двух факторов называется эффектом
взаимодействия первого порядка, трех факторов — второго порядка и т. д.
Полное число всех возможных эффектов, включая b0 линейные эффекты
bj и взаимодействия всех порядков, равно N –числу опытов ПФЭ. Чтобы найти
число
всех
возможных
взаимодействий
некоторого
порядка,
можно
воспользоваться формулой для числа сочетаний:
С km =
k!
m!( k − m)!
где k — число факторов, т — число взаимодействующих элементов. Так, для
плана 24 число парных взаимодействий равно шести.
С 42 =
4!
2!2!
Ортогональность матриц планирования позволяет при обработке данных с
помощью метода наименьших квадратов получить независимые друг от друга
оценки коэффициентов уравнения регрессии. Это означает, что величина
любого коэффициента не зависит от того, какие величины имеют другие
коэффициенты. Приведем формулу для расчета коэффициентов:
N
b j = ∑ x ji y i / N , j = 0, 1, ….k
i =1
При определении коэффициентов используются соответствующие векторстолбцы.
Независимость оценок коэффициентов, можно получить только при
специально запланированном эксперименте. Если экспериментатор будет
ставить опыты случайным образом или по своему произвольному выбору, не
соответствующему ортогональному плану, то оценки коэффициентов окажутся
коррелированными,
что
усложнит
интерпретацию.
Такое
положение
справедливо лишь для модели, включающей линейные эффекты и эффекты
взаимодействия. Между тем существенными могут оказаться коэффициенты
при квадратах факторов, их кубах и т. д. Так, модель с квадратичными членами
для двух факторов имеет вид:
2
2
yˆ = b0 x0 + b1 x1 + b2 x 2 + b12 x1 x 2 + b11 x1 + b21 x 2
Можно ли по плану 22 оценить b11 и b22? Попытка построения векторстолбцов для x12 и x 22 приводит к столбцам, совпадающим друг с другом и со
столбцом х0. Так как эти столбцы неразличимы, то нельзя определить, за счет
чего получается величина b0, Она зависит как от собственно b0, так и от вкладов
квадратичных членов. Здесь говорят, что имеет место смешанная оценка. Таким
образом, из ПФЭ нельзя извлечь информацию о квадратичных членах и членах
более высокого порядка. План и модель — эти понятия неразрывно связаны.
Нельзя приступать к выбору плана, если не определена модель. Для моделей с
квадратичными членами выбираются не ПФЭ 2k, а планы с числом уровней,
большим 2. Такой тип планирования описан, например, в [4, 5, 10, 26].
Ну а какими планами надо пользоваться, если речь идет о линейной модели и
взаимодействия считаются незначимыми? Количество опытов в ПФЭ 2 k при
k>=3 значительно превышает число линейных коэффициентов. Было бы
заманчивым сократить число опытов за счет той информации, которая не
существенна при построении линейных моделей. При этом нужно стремиться к
тому, чтобы матрица планирования не лишилась своих оптимальных свойств.
Обратимся вновь к ПФЭ 22. Пользуясь таким планированием, можно
вычислить четыре коэффициента: b0, b1, b2, b12. Если имеются основания считать,
что в выбранных интервалах варьирования процесс описывается линейной
моделью, то достаточно определить три коэффициента: b0, b1, b2. При линейном
приближении b12 → 0, и вектор -столбец х1х2 можно использовать для введения
в план нового фактора х3.'При этом линейные оценки смешиваются с оценками
взаимодействия следующим образом:
b1 → β 1 + β 23 , b2 → β 2 + β 13 , b3 → β 3 + β 12
Здесь греческими буквами обозначены истинные коэффициенты. Такое
смешение не опасно только в том случае, если адекватна линейная модель.
Итак, мы нашли способ сократить число опытов. Вместо восьми опытов для
трех факторов при ПФЭ 23, оказывается, можно поставить только четыре
опыта, воспользовавшись дробным планированием или дробной репликой —
1/2-репликой для 23.
Номер
X0
X1
X2
X3= X1X2
Y
опыта
1
2
3
4
+1
+1
+1
+1
-1
+1
-1
+1
-1
+1
-1
+1
+1
+1
-1
-1
Y1
Y2
Y3
Y4
При этом матрица планирования не теряет своих оптимальных свойств ' в
рамках линейной модели. Чтобы сократить число опытов, нужно новому
фактору поставить в соответствие вектор-столбец взаимодействия, которым
можно пренебречь. Тогда значения уровней нового фактора в условиях опыта
определяются знаками элементов этого столбца.
Мы рассмотрели самый простой случай: матрицу из четырех опытов для
трехфакторного планирования. С увеличением числа факторов вопрос о
минимизации числа опытов N становится очень актуальной задачей, ведь N
растет как показательная функция в зависимости от числа факторов.
Матрица из восьми опытов для четырехфакторного планирования будет
полурепликой от ПФЭ 24, а для пятифакторного планирования — четвертьрепликой от ПФЭ 25. Для обозначения дробных реплик, в которых р линейных
эффектов приравнено к эффектам взаимодействия, удобно, пользоваться
условным обозначением 2k-p. Так, полуреплика от 26 запишется в виде 26-1, а
четверть-реплика от 25 — в виде 26-2.
Насколько значительно дробное планирование позволяет сократить число
опытов, можно видеть из приведенной ниже табл. 1.
Целесообразность применения дробных реплик возрастает с ростом числа
факторов. Как видно из табл. 1, при исследовании влияния 15 факторов можно
в 2048 раз сократить число опытов, применяя реплику большой дробности
(поставив 16 опытов вместо 32 768 для ПФЭ 2 15). Такое сокращение числа
опытов возможно только для случая, когда линейная модель адекватно
описывает исследуемый объект.
Детальное описание дробного планирования содержится в [3].
Таблица 1
Сокращение количества опытов при дробном планировании
Кол
ичес
тво
Дробная реплика
факт
оров
Условное Число
Для
дро
бно
й
реп
лик
и
3
4
5
6
7
5
6
7
8
9
10
11
12
13
14
1/2 – реплика от 23
1/2 – реплика от 24
1/4 – реплика от 25
1/8 – реплика от 26
1/16 – реплика от 27
1/2 – реплика от 25
1/4 – реплика от 26
1/8 – реплика от 27
1/16 – реплика от 28
1/4 – реплика от 29
1/32– реплика от 210
1/128 – реплика от 211
1/256 – реплика от 212
1/512 – реплика от 213
1/1024 – реплика от
214
23-1
24-1
25-2
26-3
27-4
25-1
26-2
27-3
28-4
29-5
210-6
211-7
212-8
213-9
214-10
4
8
8
8
8
16
16
16
16
16
16
16
16
16
16
Для
полно
го
факто
рного
экспер
имент
а
8
16
32
64
128
32
64
128
256
512
1 024
2 048
4 096
8 192
1 6384
15
1/2048 – реплика от 215-11
215
16
3 2768
Пример. Обсудим ситуацию, возникающую при получении гальванических
покрытий с минимальными внутренними напряжениями. Несколько слов об
объекте исследования [27].
Гальванические покрытия служат для защиты изделий от коррозии и
обеспечения
нужных
свойств
их
поверхности.
Покрытия
получают
электроосаждением металлов на поверхность изделий в гальванических ваннах.
Существенно, чтобы нанесенное покрытие не отслаивалось от поверхности и
обладало заданными физико-механическими свойствами, среди которых одним
из главных является внутреннее напряжение. Высокие внутренние напряжения
вызывают растрескивание слоя, отслаивание его от подложки, ухудшение
защитных свойств. Разработана методика измерения внутреннего напряжения
по деформации изделия.
Наша цель заключается в том, чтобы выяснить, каким образом влияют на
внутренние напряжения различные факторы, от которых оно зависит, а также в
том, чтобы найти такие условия осаждения, при которых внутренние
напряжения окажутся минимальными или даже практически исчезнут. Таким
образом, параметром оптимизации (откликом) выбрано внутреннее напряжение
«у» в условных единицах. Предварительные исследования показали, что
наибольший интерес представляют следующие три фактора: концентрация
x3 .
x1 , плотность тока ~
x 2 , температура раствора ~
сахарина в растворе ~
Таблица 2
Уровни и интервалы варьирования факторов
Основной уровень
Интервал
варьирования
Концентрация Плотность
Температура
x1 , тока, ~
x2 ,
сахарина, ~
x3
раствора, ~
г/л
0,7
0,3
А/дм2
55
25
, °С
45
15
Верхний уровень
Нижний уровень
1,0
0,4
80
30
60
30
Т а б лица 3
Порядок проведения, план эксперимента и результаты опытов
Номер
Порядок
Факторы
Отклики
двойного проведения
опыта
двух
повторных
опытов
X0 X1 X2 X3 первый повтор- средный
ний
Y′
Y ′′
Y
1
8; 13
+1 -1 -1 -1 3,40
4,10
3,75
2
3; 12
+1 -1 +1 +1 2,35
3,15
2,75
3
11; 15
+1 -1 +1 -1 -0,40
-0,60
-0,50
4
6; 14
+1 -1 -1 +1 2,70
1,80
2,25
5
2; 4
+1 +1 -1 -1 2,20
3,30
2,75
6
5; 7
+1 +1 -1 +1 0,60
0,90
0,75
7
1; 9
+1 +1 +1 -1 -0,84
-1,16
-1,00
8
10; 16
+1 +1 +1 +1 0,60
0,40
0,50
А теперь приступим к выбору модели и плана эксперимента. Прежде всего,
важно уяснить, оценки каких эффектов интересуют экспериментатора. В
данном случае это линейные эффекты и парные взаимодействия. Поэтому
модель объекта имеет вид:
Таблица 4 Дисперсии среднего
Номер опыта
1
2
3
4
5
6
7
8
S i−2
0,122
0,160
0,010
0,202
0,302
0,022
0,025
0,010
yˆ = b0 + b1 x1 + b2 x2 + b3 x3 + b12 x1 x2 + b13 x1 x3 + b23 x2 x3
Наиболее простой план, допускающий оценку всех коэффициентов этой
модели, — полный факторный эксперимент 23. Уровни факторов и их
интервалы варьирования, выбраны на основе априорных сведений и
представлены в табл. 2, табл. 3 содержит план и результаты опытов, а табл. 4 —
оценки
дисперсий
средних
арифметических.
Для
оценки
ошибки
воспроизводимости все опыты дублировались.
Регрессионный анализ для ортогональных двухуровневых планов
Благодаря выбору ортогонального плана и равномерному дублированию
опытов (два параллельных опыта в каждой из восьми комбинаций уровней
факторов) вычислительная процедура для нашего примера оказывается очень
простой и сводится к следующей схеме.
1. Оценка дисперсий среднего арифметического в каждой строке плана
эксперимента
∑( y
n
S i−2 =
q =1
iq
− yi )
2
n(n - 1)
где yiq — результат отдельного опыта, yi — среднее значение отклика по
повторным опытам, п — количество параллельных опытов, q — номер
параллельного опыта, q=1….n, i — номер строки матрицы плана, i = 1 ... N.
2. Проверка однородности дисперсий с помощью критерия Кохрена G.
Критерий Кохрена определяется отношением максимальной дисперсии к
сумме всех дисперсий:
N
G = S i− 2 max / ∑ S i− 2
i =1
С этим критерием связаны числа степеней свободы п-1 и N. Гипотеза об
однородности дисперсий не отвергается, если экспериментальное значение
критерия Кохрена не превысит табличного.
3. Если
дисперсии
однородны,
то
рассчитывается
оценка
усредненной дисперсии воспроизводимости:
∑∑ ( y
N
S{2y } =
n
i =1 q =1
iq
− yi ) 2
Nn(n − 1)
N
=
∑S
i =1
−2
i
N
В реальных условиях гипотеза об однородности дисперсий подтверждается
далеко не всегда. Тогда можно идти различными путями. Например, найти
преобразование зависимой переменной, отыскать иной закон распределения
случайной
величины
или
обратиться
к
какому-нибудь
робастному
статистическому методу. Этот этап относится к выбору модели ситуации.
4. Мы уже говорили о том, что благодаря ортогональности плана
вычислительная процедура сильно упрощается:
N
bj =
∑y x
i
i =1
N
,
ji
N
buj =
∑y x
i =1
i ui
x ji
N
где xji — значение j-го фактора в i-ом опыте, и,j - номера факторов, j, u=0,1, ...,
k, j ≠ u .
5.
Проверка
гипотезы
об
адекватности
на расчетах дисперсии адекватности
N
2
2
S àä
и
S = ∑ ( yi − yˆ i ) / f
2
ад
i =1
модели
основана
критерия Фишера (F-критерия)
, f = N − p , F = Sàä2 / S{2y}
где ŷi — рассчитанное по уравнению регрессии значение отклика, f — число
степеней свободы, связанное с дисперсией адекватности, р — число
оцениваемых коэффициентов регрессии. Рассчитанное значение F-критерия
сравнивается с табличным значением, определяемым числами степеней
свободы f и N (п—1). Если экспериментальная величина F-критерия не
превышает табличного значения, гипотеза об адекватности модели не
отвергается.
'6. Проведем проверку значимости коэффициентов регрессии. Поскольку
план ортогонален, они определяются с одной и той-же дисперсией:
S{2b} = S{2y} / N
Далее
для
коэффициентов
регрессии
рассчитывается
доверительный
интервал
∆b j = ±ts{ b}
с некоторой доверительной вероятностью. В этом выражении t-критерий
(критерий Стьюдента) имеет то же число степеней свободы, что и дисперсия
воспроизводимости
S{2y}
Коэффициент значим, если его абсолютная величина больше доверительного
интервала.
7, Незначимые
и
вновь
коэффициенты
проводится
проверка
регрессии
адекватности
модели
исключаются,
со
значимыми
коэффициентами.
8. Статистический анализ завершается интерпретацией модели в терминах
объекта исследования.
Продолжение примера. А теперь приведем численные результаты. В. табл. 4
даны значения дисперсий среднего арифметического для каждой строки плана
эксперимента. Критерий Кохрена G=0,302/0,853=0,35. Ниже помещен фрагмент
таблицы критерия Кохрена для уровня значимости 0,05:
n-1
1
N
7
0,727
8
0,679
9
0,638
Табличное значение для п—1 =
2
3
0,561
0,480
0,515
0,437
0,477
0,402
1 и N=8 равно 0,679. Экспериментальная
величина G-критерия меньше этого значения, в силу чего гипотеза об
однородности
дисперсий
не
отвергается*.
Это
усредненную оценку дисперсии воспроизводимости
позволяет
рассчитать
S{2y } = 0,853 / 8 = 0,107 .
Число
степеней свободы равно N(n-1)=8(2-1)=8
* Наш пример носит главным образом иллюстративный характер. На практике
же делать выводы при наличии одной степени свободы рискованно.
Таблица 5 Расчетная таблица и результаты опытов
Номе Аддитивная
Матрица
Векторы Экспериментальный
р
постоянная планирования
столбцы
отклик
опыта
взаимодействия
X0
X1 X2 X3 X1X2 X1X2 X1X2
Y
+1
+1
1
- 1 -1 -1
+1
+1
3,75
+1
2
+1
- 1 +1
-1
-1
+1
2,75
-1
-1
3
+1
- 1 +1 -1
+1
- 0,50
-1
4
+1
- 1 -1 +1 +1
-1
2,25
-1
-1
5
+1
+1
-1
-1
+1
2,75
-1
-1
6
+1
+ 1 -1 +1
+1
0,75
7
8
+1
+1
+1
+1
-1
+1
+1
+1
+1
+1
-1
-1
+1 -
+1
- 1,00
0,50
Для получениякоэффициентоврегрессии составляется расчетная таблица
(табл. 5).
Коэффициенты регрессии равны:
b0 = 1,406,
b = -0,968,
B = 0,156,
b = -0,031,
b = -0,281,
B = 1,031.
Информация, требуемая для проверки гипотезы адекватности, приведена в
12
2
3
13
23
табл. 6. Например, для первого опыта ŷ1 =1,406-0,656 (-1)-0,968 (-1) +0,156 (-1) -0,031 * (-1) -0,281
(-1) (-1) +1,031 (-1) (-1) =3,593. Число степеней свободы дисперсии адекватности f=8—7=1 и сама дисперсия равна
S àä2 = 0,195 .
Критерий
Фищера
для
проверки
гипотезы
адекватности
модели
F==0,195/0,107= 1,82. Приведем фрагмент таблицы F-критерия для уровня
значимости 0,05.
f
N(n-1)
7
8
9
1
2
3
5,6
5,3
5,1
4,7
4,5
4,3
4,4
4,1
3,9
Расчет дисперсии адекватности
Номер
Номер
y
y
ˆ(∆y ) 2 ⋅ 10 4
ˆ ) 2 ⋅ 10 4
ŷ
∆y = y − y
ŷ
∆y = y −
y
(∆y
опыта
опыта
3,75 3,59
2,75 2,905
1
0,157
246,49
240,25
5
-0,155
0
3
0
2,75 2,59
0,75
2
0,157
246,49
246,49
6
0,593 0,157
0
3
0
3
246,49
-1,000
0,155
240,25
-0,500 -0,343
-0,157
7
-1 ,155
2,25 2,40
4
-0,155
240,25
0,500
0,657
246,49
8
-0,157
0
5
Расчет дисперсии адекватности для модели со значимыми
коэффициентами регрессии
Номер
опыта
y
ŷ
Номер
опыта
ˆ ) 2 ⋅ 10 4
∆y = y −
y
(∆y
y
ŷ
ˆ ) 2 ⋅ 10 4
∆y = y −(y
∆y
-0,030
3,75 3,78
0
0
2,75 2,40 0,344
0
6
-0,500 -0,218
-0,282
-0,030
2,25 2,28
0
0
1
2
3
4
9
2,75 3,03 -0,280
0
0
0,75 0,40 0,344
0
6
-1,000
-0,968
-0,032
0,50 0,53 -0,032
0
2
5
1183 6
795
7
8
9
784
1183
10
10
В нашем случае f=8—7=1, N (п—1)=8, табличное значение F-критерия равно
5,3. Экспериментальная величина F-критерия не превышает табличного
значения, поэтому гипотеза об адекватности выбранной модели не отвергается.
Число
степеней
свободы
Далее
найдем
5
6
7
8
значимые
коэффициентов регрессии
tкритерий
2,57
-2,45
2,37
2,31
коэффициенты
регрессии.
Дисперсия
S{2b} = 0,107 / 8 = 0,0134
Из фрагмента таблицы для t-критерия (уровень значимости 0,05) следует, что в
нашем случае t=2,31. Доверительный интервал
∆b j = ±2,31 ⋅ 0,115 = ±0,256
Оставляя только значимые коэффициенты регрессии,
получим yˆ = 1,406 − 0,656
x2—0,968 х2—0,281 x2х3+1,031 x2х3. Предсказанные
значения зависимой переменной и данные для расчета дисперсии адекватности
приведены в табл. 7.
В этом случае
f=8-5=3;
S àä2 =
0,3983
= 0,133 ;
3
F=
0,133
=1,24
0,107
Табличное значение F-критерия при f=3, N (n-1)=8 равно 4,1 и гипотеза об
адекватности модели не отвергается. Займемся теперь интерпретацией модели,
Как интерпретировать?
Задача интерпретации весьма сложна. Ее решают в несколько этапов.
Первый этап состоит в следующем. Устанавливается, в какой мере каждый,
из факторов влияет на параметр оптимизации. Величина коэффициента
регрессии — количественная мера этого влияния. Чем больше коэффициент,
тем сильнее влияет фактор. О характере влияния факторов говорят знаки
коэффициентов. Линейные коэффициенты полинома являются частными
производными функции отклика по соответствующим переменным. Их
геометрический смысл — тангенсы углов наклона гиперплоскости к
соответствующей оси. Больший по абсолютной величине коэффициент
соответствует большему углу наклона и, следовательно, более существенному
изменению параметра оптимизации при изменении данного фактора.
Продолжение примера. Вернемся к нашему примеру. Сразу видно, что
априорные
соображения
экспериментатора
в
значительной
степени
подтвердились, поскольку значимыми оказались не только линейные эффекты
факторов, но и некоторые парные взаимодействия. Из трех линейных эффектов
выделились два: эффект фактора х1 — концентрации сахарина и фактора х2 —
плотности тока,
Судя по количественной, оценке коэффициентов, плотность тока влияет
несколько сильнее концентрации сахарина. Характер их влияния одинаков. С
увеличением концентрации и плотности тока внутренние напряжения
уменьшаются, так как коэффициенты регрессии имеют отрицательный знак.
Температура (x3) в выбранных интервалах варьированная не оказывает
значимого
влияния
на
внутреннее
напряжение,
поскольку
линейный
коэффициент b3 незначим. Но влияние этого фактора проявилось весьма
сильным образом в парных взаимодействиях. Ведь эффект совместного
влияния плотности тока и температуры (b23) превосходит по величине даже
линейные эффекты. Смысл эффекта взаимодействия состоит в том, что влияние
одного фактора зависит от того, на каком уровне находится другой фактор.
К росту отклика будет вести одновременное увеличение х2 и х3 или их
одновременное
уменьшение.
Задача
же
экспериментатора
состоит
в
уменьшении отклика. Поэтому надо либо уменьшать х3 и увеличивать х3, либо
наоборот. Коэффициент взаимодействия b13 имеет отрицательный знак. Это
означает, что уменьшение внутреннего напряжения связано с действием
концентрации сахарина и температуры в одном направлении: либо надо
одновременно увеличивать концентрацию и температуру, либо уменьшать.
Этот эффект взаимодействия по величине заметно уступает всем остальным
значимым эффектам.
Воспользуемся полученным ранее уравнением для отыскания оптимальных
условий осаждения. Особый интерес представлял поиск условий проведения
процесса при концентрации сахарина 0.6 ÷ 1,06 г/л (x1=-0,33 ÷ 1,2), плотности тока
60 ÷ 80 А/дм2 (x2=0,2 ÷ l,0), температуре 50 ÷ 60 °C (x3=0,33 ÷ 1,0). При этом
получались качественные покрытия заданного состава. В практических целях
достаточно иметь уравнения для температур 50, 55 и 60 °С, что было сделано
подстановкой в уравнение регрессии кодированных значений х3 (0,33; 0,66 и
1,0). Принимая у=0, получим
0,749 x1+0,625 x2=1,406;
0,841 x1+0,286 х2= 1,406;
0,937 x1-0,063 х2=1;406.
Из последних двух уравнений следует, что даже при х2= ± 1, х1>1,3, т. е.
концентрация сахарина выходит за заданный интервал. Поэтому для
определения значений факторов, обеспечивающих минимальные внутренние
напряжения, необходимо пользоваться только первым уравнением. Полагая
x2=1,0, согласно уравнению получим x1=1,04. Натуральные значения факторов:
концентрация сахарина 1,01 г/л, плотность тока 80 А/дм 2, температура
электролита 50 °С. Несколько опытов, проведенных в данных условиях,
подтвердили, что внутренние напряжения покрытий действительно близки к
нулю.
Основной эксперимент, планы первого порядка
Задача основного эксперимента — получение математической
модели исследуемого объекта, которая используется для оптимизации объекта
исследования или для целей аппроксимации.
Для получения математической модели,
используется факторный эксперимент:
Все факторы объекта исследования вирируются по определенному плану.
Рассмотрим пример построения
Матрица планирования эксперимента для двух факторов на двух уровнях
Таблица 1
Опыты X0 Планирование Переменная состояния y
X1
X2
1
+1
+1
+1
y1
2
+1
-1
+1
y2
3
+1
+1
-1
y3
4
+1
-1
-1
y4
Предположим, что объектом исследования является реактор, в
котором выход продукта
у зависит от температуры х1 и давления х2 в реакторе. Дополнительно
известно, что изменение температуры от 60 до 80° С и давления от 1 до 1,5 атм изменяет выход продукта.
Обозначим максимальные и минимальные значения факторов х1 и х2 символами + 1 и -1. Тогда все возможные
комбинации факторов при варьировании на двух уровнях (минимальном и максимальном) будут определены
четырьмя опытами. Такой план эксперимента принято записывать в виде матрицы планирования (табл. 22).
Во второй графе таблицы приведены значения фиктивной переменной
х0
(тождественно равной -1 +1), которая понадобится при вычислении свободного члена полинома. В первой строке
таблицы спланирован первый опыт, когда факторам х 1 и х2 придают максимальные значения; во второй строке —
когда фактору х1 придают минимальное значение, а фактору — максимальное, и т. д. Оказывается подобное
планирование имеет ряд достоинств и поэтому широко применяется для получения моделей. Например, пользуясь
планом — табл. 1, можно после проведения эксперимента определить коэффициенты линейного уравнения
регрессии
yˆ = b0 + b1 x1 + b2 x2
(1)
Сущность факторного эксперимента первого порядка состоит в одновременном варьировании всех
факторов при его проведении по определенному плану, представлении математической модели (функции отклика) в
виде линейного полинома и исследовании этой зависимости методами математической статистики.
Уровнем фактора
называют определенное значение фактора, которое будет фиксироваться при
проведении эксперимента. В предыдущем примере уровнями факторов будут 60 и 80° С для фактора «температура»,
а также 1 и 1,5 атм— для фактора «давление». Уровнем факторов можно назвать и средние значения
рассматриваемых интервалов, т. е. 70° С и 1,25 атм.
Рис 1 Геометрическая интерпретация области определения факторов L и
области проведения эксперимента М.
Эти значения факторов называются нулевыми уровнями, они определяют некоторую точку факторного
пространства, которая в предварительном эксперименте была оценена наилучшей по максимуму (или по минимуму)
переменной состояния. Обозначим нулевой уровень i-го фактора, выраженного в натуральных единицах (в данном
примере в °С и атм), через
Интервал
X i0
.
варьирования. Это такое значение фактора в натуральных единицах, прибавление которого к
нулевому уровню дает верхний, а вычитание — нижний уровень фактора. Обозначим его
Границы
∆X i
существования факторов - это экстремальные значения, которые могут принимать факторы, не
меняя своих физико-химических свойств и не искажая сути исследуемого процесса, Область определения
факторов (область L на рис. 1)- это интервал (Xmin
÷X
max
).
Интервал варьирования факторов должен составлять часть области определения факторов, если решается задача
оптимизации. Это необходимо для того, чтобы осуществить движение к оптимуму в области- определения факторов.
На рис. 1 область проведения эксперимента обозначена буквой М. В задачах же аппроксимации (или интерполяции)
интервал варьирования охватывает всю описываемую область, т. е. для двухфакторной задачи верхними уровнями
факторов Х1 и Х2 являются
X 1 max , X 2 max ,
а нижними уровнями —
X 1 min
и
X 2 min
Тогда область L можно
назвать интерполяционной, область М — областью постановки экстремального эксперимента.
Из определений следует, что областей М может быть несколько (в общем
случае конечное множество). Можно также предположить несколько областей
оптимума. Область определения факторов для данной задачи исследования
одна. Обозначение верхних и нижних уровней факторов символами «+1», «—
1» фактически соответствует кодированию факторов по формуле
xi =
X i − X i0
∆X i
.
(2)
Для рассмотренного примера (табл. 22) кодированные значения факторов
(верхние и нижние уровни) следующие:
x1B =
x2 B =
1,5 −1,25
= +1
0,25
x1H =
x2 H =
80 − 70
= +1
10
60 − 70
= −1
10
1,0 −1,25
= −1
0,25
Рис.2. Геометрическая интерпретация плана 22 на плоскости
а) – в натуральных координатах, б) в кодированной форме.
Рис. 3. Геометрическая интерпретация плана 32
Кодирование факторов, по сути, означает переход от системы координат в натуральных единицах (рис. 2, а) к
системе координат в кодированной форме (рис. 2, б). Каждая точка факторного пространства — (+1, +1), (—1, +1),
(+1, —1), (—1, —1) — это опыт в исследованиях.
В общем случае эксперимент, в котором реализуются все возможные
сочетания уровней факторов, называется
полным факторным экспериментом (ПФЭ). Если
каждый фактор варьируется на двух уровнях, то получается ПФЭ тина 2 n. Для двух факторов (n = 2) число опытов N
= 22 =4, что видно из табл. 1 и рис. 2.
Можно осуществлять планирование эксперимента на трех уровнях (верхний,
средний, нижний), тогда ПФЭ будет типа 3
n
и для n = 2 общее число опытов будет N = 32 = 9 см.
рис. 3.
Этот этап выделяют как этап принятия решений перед составлением плана эксперимента. Построение плана
эксперимента начинают с выбора определяющих его характеристик. Обычно первой рас сматривают область
определения факторов. Область определения факторов фиксируется в предварительном эксперименте. Для этого
используются результаты опытов и теоретические представления о процессе.
Далее из области определения факторов выбором нулевых уровней и
интервалов
варьирования
факторов
выделяется
планирования эксперимента (область М, рис.
часть
области
для
1). Правильный выбор нулевых уровней (центра
эксперимента) и интервалов варьирования факторов имеет решающее значение для действенности математической
модели.
Идеальным случаем при выборе нулевых уровней факторов является
«попадание»
центра
эксперимента
в
область
оптимальных
значений
переменной состояния. Но это возможно лишь при очень высоком уровне
априорной информации.
Если имеется некоторый опыт управления объектом исследования, можно принять в качестве нулевых уровней
те величины факторов, которые дали наилучшее значение переменной состояния.
Но это может привести к получению лишь локального оптимума при нескольких экстремумах функции отклика,
Основное требование к интервалу варьирования состоит в том, чтобы он
превышал удвоенную квадратическую ошибку фактора:
2sxi < ∆ X i < ( X imax − X imin )
где s x
( X imax − X i min )
i
— среднеквадратическое отклонение фактора
(3)
X i ; ∆X i — интервал варьирования;
— область определения фактора.
Это требование связано с тем, что интервал между двумя соседними
уровнями должен значимо (неслучайно) влиять на переменную состояния.
Обычно
интервал
варьирования
выбирается
на
основании
априорной
информации (или интуитивно) и затем уточняется (если он выбран неудачно)
после получения математической модели.
Повторение эксперимента, резко увеличивает число
опытов. Удачный выбор интервала варьирования факторов гарантирует получение достоверной математиче ской
модели объекта.
Определенные сведения о нулевых уровнях и интервалах варьирования получаются на этапе предварительного
эксперимента.
Пример 1.
Рассмотрим процесс ионообменного разделения смесей группы редкоземельных элементов растворами
иминодиуксусной кислоты. Переменная состояния—содержание (в %) неодима в выходном растворе.
Предварительный эксперимент выделил два фактора — концентрацию (в
вес. %) входного раствора Х
1
и рН раствора Х2. Область определения фактора X1 находилась из
следующих услови.
Известно, что при X
1
> 3 работать нельзя, так как это предел растворимости данного вещества при
нормальной температуре. Таким образом,
X 1max = 3 .
При выборе нижней границы области определения фактора
учитывалось то, что чем ниже концентрация, тем дольше идет процесс. При
X 1min = 0,5 время протекания процесса
находится еще в допустимых пределах; дальнейшее снижение его уже нецелесообразно.
При выборе области определения Х
2
исходили из теоретического положения, что ионообменное
разделение происходит благодаря одновременному присутствию в системе двух соединений: моно- и ди-комплексов.
Предварительный эксперимент показал, что при рН < 3 кислота находится в недиссоциированном состоянии, а при
рН > 8 оба соединения разрушаются. Следовательно,
X 2 max = 8 , X 2 min = 3 .
В качестве нулевых уровней были приняты значения
X10 = 1,5, Х20 = 7. В точке
факторного пространства с такими координатами был получен наилучший результат предварительного эксперимента. Важно также то, что она лежит внутри области определения факторов.
Результаты предварительных опытов, явилось следующее:
1.
точность фиксирования факторов средняя (по результатам ряда
опытов);
2.
поверхность отклика линейная (по однофакторным экспериментам);
3.
диапазон изменения переменной состояния небольшой.
Рослее предварительного эксперимента пришлось выбрать широкий (до 20% от области определения) интервал
варьирования, чтобы его изменение было заметно по изменению переменной состояния:
∆X 1 = 0,5 , ∆X 2 = 1.
Построение матрицы планирования.
План, содержащий запись всех комбинаций факторов или их части в кодированной форме, называется матрицей
планирования. Табл. 1, например, является матрицей планирования для двух факторов на двух уровнях.
Для построения матрицы планирования с большим числом факторов
использовать следующий прием.
можно
Элементарное сочетание первого фактора (+1, —1) повторяется для каждого следующего фактора на верхнем и
нижнем уровнях. Этот прием распространяется на построение матриц любой размерности. Столбец х0 — это столбец
значений фиктивной переменной.
Этот прием построения матриц планирования можно трактовать как прием чередования знаков. Действительно, в
первом столбце знаки не меняются, во втором — меняются поочередно, в третьем — они чередуются через два, в
четвертом — через 4 и т. д. (по показателям степеней двойки).
Свойства матрицы планирования. Рассмотренные матрицы планирования
обладают такими свойствами, которые позволяют считать, что их построение
выполнялось оптимально с точки зрения получаемой но результатам
реализации матрицы планирования математической модели. Если мы ищем
модель в виде уравнения регрессии, то коэффициенты должны быть
наилучшими и точность предсказания значений переменной состояния
одинакова в любом направлении факторного пространства. Эти требования
формулируются как условия ортогональности и рототабельности.
№п/п
Тип эксперимента
x0
Таблица 2
Факторы
x1 x2 x3 x4 x5
2
3
4
ПФЭ ПФЭ ПФЭ ПФЭ
+1
25
24
23
22
+1
+1
+1
5
6
7
8
+1
+1
+1
+1
+1
-1
+1
-1
+1
+1
-1
-1
-1
-1
-1
-1
+1
+1
+1
+1
+1
+1
+1
+1
9
10
11
12
13
14
15
16
+1
+1
+1
+1
+1
+1
+1
+1
+1
-1
+1
-1
+1
-1
+1
-1
+1
+1
-1
-1
+1
+1
-1
-1
+1
+1
+1
+1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
+1
+1
+1
+1
+1
+1
+1
+1
17
+1 +1 +1 +1 +1 -1
1
+1 +1 +1 +1 +1
-1 +1 +1 +1 +1
+1 -1 +1 +1 +1
-1 -1 +1 +1 +1
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
+1
+1
+1
+1
+1
+1
+1
+1
+1
+1
+1
+1
+1
+1
+1
Симметричность
-1
+1
-1
+1
-1
+1
-1
+1
-1
+1
-1
+1
-1
+1
-1
+1
-1
-1
+1
+1
-1
-1
+1
+1
-1
-1
+1
+1
-1
-1
+1
+1
+1
-1
-1
-1
-1
+1
+1
+1
+1
-1
-1
-1
-1
+1
+1
+1
+1
+1
+1
+1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
относительного центра эксперимента - алгебраическая сумма элементов в вектор-
столбце для каждого фактора равна 0
N
∑x
u =1
iu
=0
(4)
Условие нормировки –сумма квадратов элементов каждого столбцаравна
числу опытов.
N
∑x
u =1
=N
2
iu
(i = 1,2......n; u = 1,2,.....N)
(5)
где n — число факторов; N —- число опытов (или строк матрицы планирования).
Условие ортогональности предполагает равенство нулю суммы почленных произведении любых
двух столбцов матрицы:
N
∑x
u =1
iu
x ju = 0 (i, j = 1,2,...., n, i ≠ j )
(6)
Эти условия легко проверить по табл. 2. Действительно, полный факторный эксперимент типа 2" является
ортогональным.
Ортогональные планы ПФЭ (для линейных моделей) имеют также еще одно
свойство — рототабельность.
Рототабельность - предполагает равенство и минимальность дисперсии предсказанных значений переменной
состояния для всех точек факторного пространства.
По закону накопления ошибок можно записать для дисперсии предсказанных уравнением регрессии значений
переменной состояния:
s ~y2 = sb20 + sb21 x12 + ..... + sb2n xn2
(7)
2
где sbi — дисперсия коэффициентов модели bi.
Из условия (6) вытекает, что дисперсии коэффициентов регрессии равны
между собой. Тогда можно записать:
n


s ~2y = sbi2 1 + ∑ xi2 
 i =1 
n
2
2
Учитывая, что ∑ xi = ρ
где
ρ
(8)
радиус сферы:
i =1
(
s ~y2 = sb2i 1 + ρ 2
)
(9)
Отсюда ясно, что дисперсия предсказанного значения выходной переменной
зависит только от радиуса сферы. Это свойство рототабельностн эквивалентно
независимости дисперсии выходной переменной от вращения координат в
центре плана и оправдано при поиске оптимума градиентными методами..
Основное преимущество факторного эксперимента
Основное преимущество факторного эксперимента заключается в том, что в эксперименте варьируются
одновременно все факторы. Это приводит к тому, что дисперсия в оценке коэффициентов регрес сии оказывается в N
раз меньше ошибки опыта.
При классическом подходе эксперименты ставятся в определенной
последовательности: все факторы фиксируются на некотором
уровне, а один фактор
переводят на другой уровень. Затем это повторяют для другого фактора. В оценке каждого из коэффициентов
уравнения участвует только какая-то часть опытов.
Рассмотрим пример двух факторов и классический подход в экспериментировании.
Результаты эксперимента представлены в табл. 3.
Таблица 3. Неоптимальная схема эксперимента для двух факторов
опыты x0 x1 x2
1
+1 +1 +1
2
+1 +1 -1
3
+1 -1 +1
y
y1
y2
y3
Каждый коэффициент уравнения ~y = b0 x0 + b1 x1 + b2 x2
b0 =
y2 + y3
2
определяют по двум точкам:
с дисперсией sb2i =
so2
2
b1 =
y1 − y3
2
b2 =
y1 − y2
2
2
где so — ошибка опыта.
При использовании факторного эксперимента следует поставить четыре
опыта, т. е. реализовать ПФЭ 2 .
2
Коэффициенты уравнения определяют по результатам четырех
опытов и дисперсия будет равна:
sb2i =
so2
4
.
Точность проведения эксперимента в этом случае вдвое выше. Для
достижения такой точности при классическом подходе необходимо 3 ⋅ 2 = 6
опытов. Еще более показательна эта особенность факторного эксперимента при
большом количестве факторов. Так, при числе факторов n = 7 воспользуемся
частью (1/16) ПФЭ 27, поставив всего 8 опытов, как и при классическом
подходе. Однако дисперсия в оценке коэффициентов уравнения в этом случае
будет
so2
s =
8
2
bi
против той же, что и ранее
s o2
s =
2
2
bi
. Для такой же
высокой точности при классическом подходе следует поставить 8 • 4 = 32
опыта.
Достоинства ПФЭ:
1.
независимость дисперсии переменной состояния от вращения системы
координат в центре плана;
2.
одинаковую и минимальную дисперсию коэффициентов регрессии;
3.
независимость определения коэффициентов регрессии друг от друга;
4.
простоту в вычислениях коэффициентов.
Последние дна свойства ПФЭ молено оценить па конкретном примере, используя понятия матричной алгебры (см. приложение 2).
Рассмотрим
план типа ПФЭ 22 (см. табл.1), для которого X – матрица факторов и
Y – столбец наблюдений имеет вид:
+ 1
+ 1
X =
+ 1

+ 1
+ 1 + 1
 y1 
y 

− 1 + 1
Y =  2
 y3 
+ 1 − 1

 
− 1 − 1
 y4 
Найдем произведение матриц:
+1
T
X X =
+1

+1
+1
−1
+1
+1
+1
−1
+1
+1 
+1
−1
⋅
 +1
−1
 +1

+1
−1
+1
−1
+1 4

+1
 = 0
−1 
 
−1 0
0
4
0
 4

 y1   ∑ x0u yu 
 + 1 + 1 + 1 + 1    u =41

y
2


T
X Y =  + 1 − 1 + 1 − 1 ⋅   =  ∑ x1u yu 

y  
 + 1 + 1 − 1 − 1  3   u4=1

 y4   ∑ x2u yu 
 u = 1

Система нормальных выражений записывается:
(X T Y)B = X T Y
(10)
 4

 ∑ x0u yu 
 4 0 0  b0   u =41

 0 4 0 ⋅  b  =  x y 
1u u

  1 ∑

u =1
 0 0 4 b2   4

 ∑ x2u yu 
 u =1

(11)
Решение системы в общем виде
B = (X T Y) -1 X T Y
(12)
Или для конкретного примера:
1
 b0   4
b  =  0
 1 
 b2  
0

0
1
4
0
4
  x y
0   ∑ 0u u 
u =1

  4
0  ⋅  ∑ x1u yu 

  u =1
4


1
 x2u yu 
4   ∑
u =1

(13)
0
0



4
Из
b0
выражения
равен
(13)
среднему
видно,
что
арифметическому
свободный
всех
значений
член
уравнения
выходной
регрессии
переменной
(х0 = 1), а b1 и b2, находят как среднее алгебраической суммы yu со знаками столбца х1 или х2. Простота расчета коэффициентов уравнения
регрессии не вызывает сомнения. Ясно также, что вычеркивание или добавление столбцов xi не меняет расчет других коэффициентов, т. е.
коэффициенты регрессии определяются независимо друг от друга.
Расчет коэффициентов уравнения.
Таблица 4. План ПФЭ23
опыты x1 x2 x3 y
1
+1 +1 +1 y1
2
-1 +1 +1 y2
3
+1 -1 +1 y3
4
-1 -1 +1 y4
5
+1 +1 -1 y5
6
-1 +1 -1 y6
7
+1 -1 -1 y7
8
-1 -1 -1 y8
Реализация матрицы планирования. После построения матрицы
планирования приступают непосредственно к эксперименту. Обычно
матрицу планирования представляют в виде, удобном для реализации
опытов — все кодированные значения факторов заменяют на­
туральными. Такую
матрицу планирования называют рабочей. В рабочую матрицу также заносят время
проведения опытов, значения ограничительных переменных и некоторые временные изменения в анализируемых
пробах. Такая подробность в описании условий эксперимента очень часто бывает полезной в принятии решений о
достоверности тех или иных опытов, о влиянии систематических ошибок и др.
Поскольку на изменение выходной переменной влияют помехи, план чаще
всего реализуют несколько раз, получая
m параллель- пых значений переменной состояния.
Первоначальное число m выбирают по результатам предварительного эксперимента или с помощью специально
поставленных опытов, оценивающих их воспроизводимость.
Для того чтобы избежать появления некоторой неслучайной связи между
реализациями каждого эксперимента или серии экспериментов, рекомендуется,
опыты рандомизировать во времени. Здесь
рандомизация
предполагает
случайное
расположение или случайную реализацию плана эксперимента.
Появление и влияние неслучайной составляющей в опытных данных
можно показать на следующем примере.
Пример 2. В табл. 4 приведена матрица ПФЭ 23, полученная с помощью уже описанного приема (см. табл. 3): два
раза повторяется план 22 — один раз на верхнем уровне фактора х3, другой раз — на нижнем.
Предположим, что четыре опыта реализуются в первый день, а остальные —
во второй день. Предположим также, что условия опытов в эти дни отличались
ε
друг от друга на некоторую ошибку
(например, сбился нуль измерительного прибора). Тогда
при подсчете b3 получается:
b3 =
1
[ y1 + y2 + y3 + y4 − ( y5 + ε ) − ( y6 + ε ) − ( y7 + ε ) − ( y8 + ε )] → β3 − ε
8
2
Таблица 5. Последовательность случайных чисел
где β3
№п/п
1
2
3
4
5
6
7
8
Рандомизированные опыты
05
02
03
07
06
01
08
04
— истинное значение коэффициента при х3. Таким образом, значение b3 искажается. Отметим, что
ε
на
b1 и b2 не влияет.
Рандомизация обычно проводится следующим образом. В таблице случайных чисел из любого столбца
выбирают числа в порядке их следования от 1 до N. Если матрица предполагает параллельные опыты, то тогда
количество случайных чисел возрастает от 1 до mN, т. е. нумеруются не только строки матрицы, но и параллельные
опыты. Каждое число от 1 до N или mN из таблицы случайных чисел берут только один раз.
Для рассматриваемого примера в таблице случайных чисел были выбраны
числа от 1 до 8 в последовательности, которая приведена в табл.
5. Это значит, что
опыт № 1 в матрице планирования («+1, +1,+1, табл. 5) реализуется пятым по порядку, опыт № 6 («—1, +1, —1»)
реализуется первым и т. д.
Алгоритм расчета полного факторного эксперимента типа 2n
(при равном числе параллельных опытов в каждой точке
факторного пространства)
1. Построение матрицы планирования
Если априорные сведения предполагают невысокую воспроизводимость
результатов, то в матрицу планирования эксперимента включают параллельные
опыты, как показано, в табл. 6 для ПФЭ 2 .
2
Таблица 6. Матрица ПФЭ 22 с параллельными опытами
Переменная
опыты x0 Планирование
1
2
3
4
+1
+1
+1
+1
x1
+1
-1
+1
-1
x2
+1
+1
-1
-1
yu1
y11
y21
y31
y41
состояния
yu2 …. yum
y12 …. y1m
y22 …. y2m
y32 …. y3m
y42 …. y4m
yu
y1
y2
y3
y4
m — число параллельных опытов; Nm — общее
число опытов; n — число факторов
2. Расчет коэффициентов уравнения регрессии (линейная форма).
Коэффициенты рассчитывают по формуле (см. приложение 2)
bi =
1
N
N
∑x
u =1
iu
yu
(14)
(i = 1,2, ....., n)
Где
yu =
1 m
∑ yuk
m k =1
(15)
среднее значение по параллельным опытам
u-й строки матрицы планирования. Объединяя
формулы (14) и (15) получили:
bi =
1 N m
∑∑ xiu yuk
Nm u =1 k =1
(16)
После вычисления коэффициентов регрессии переходят к статистическому анализу уравнения регрессии.
Статистический анализ уравнения регрессии состоит из трех этапов:
1.
оценка дисперсии воспроизводимости (или оценка ошибки опыта),
2.
оценка значимости коэффициентов уравнения регрессии и
3.
оценка адекватности модели.
3. Расчет ошибки опыта (дисперсии воспроизводимости).
2
Известно, что ошибка опыта so
оценивается по параллельным опытам. Перед расчетом ошибки опыта
необходимо убедиться, что рассеяние опытов в каждой точке факторного пространства не превышает некоторой
2
величины. Для этого рассчитываются построчные дисперсии su
и проверяются их однородность.
Расчет проводится по формуле:
su2 =
1 m
∑( yuk −yu )2
m − 1 k =1
Проверить однородность дисперсий
(17)
su2 можно по критерию Кохрена.
Его расчетное значение определяют так:
Gp =
su2max
N
u =1
2
где su
max
N
∑s
u =1
2
u
(18)
∑s
2
u
— максимальная из рассчитанных построчных дисперсии;
— сумма всех дисперсий по N строкам матрицы планирования.
Если выполняется условие:
G <G
p
(19)
T
то гипотеза об однородности дисперсий принимается.
GT находят но таблицам
(приложение 1) для чисел степеней свободы f1 = m — 1 и f2 = N и уровня значимости q. В технических расчетах
принимается 5%-ный уровень значимости q = 0,05.
4. Принятие решений.
Если условие (19) не выполняется, то одним из решений является увеличение числа параллельных опытов, т. е.
еще раз или несколько раз необходимо реализовать матрицу планирования.
Если увеличение
m не дает результата, то следует изменить метод контроля переменной состояния,
увеличив его точность. Иногда прибегают к масштабированию переменной состояния — вводится некоторая
математическая функция от у (например квадратный корень или логарифм).
При выполнении условия (19) построчные дисперсии усредняют по формуле:
so2 =
где f
0
1
N
N
∑ su2 =
u =1
N m
1
∑∑ ( yuk − yu )2
N (m − 1) u =1 k =1
(20)
= N (m — 1) — число степеней свободы.
Таким образом, получают ошибку опыта
so2 . Неоднородные дисперсии усреднять нельзя.
5. Проверка значимости коэффициентов регрессии.
Очевидно, что один фактор больше влияет на переменную состояния, другой — меньше. Для оценки этого
влияния используют проверку значимости каждого коэффициента двумя равноценными способами. В обоих случаях
вначале находят дисперсию коэффициентов регрессии по формуле:
sb2i =
s o2
N
(21)
т. е. дисперсии всех коэффициентов равны, поскольку зависят только от
ошибки опыта
so2 и числа строк матрицы планирования N.
По первому способу оценку значимости коэффициентов определяется по формуле:
tip =
bi
sbi
(22)
и условию
(23)
tip > tT
где bi — абсолютное значение i-гo коэффициента регрессии;
tT
— табличное значение критерия Стьюдента,
которое находят по числу степеней свободы
f0 = N (m — 1) и уровню значимости q
sbi
— среднеквадратичное отклонение bi.
По второму способу для проверки значимости коэффициентов регрессии используют доверительный
интервал
∆bi , который, вследствие равенства sb2 для всех коэффициентов, одинаков для всех bi:
i
∆bi = ±tT sbi
(24)
Тогда значимость оценивают, сравнивая абсолютные значения коэффициента и
доверительного интервала:
| bi |>| ∆bi |
(25)
Если выполняются условия (24) и (25), то i-й коэффициент признается значимым.
6. Принятие решений.
Если для какого-то коэффициента условия (78) и (80) не выполняются, то соответствующий фактор можно
признать незначимым и исключить его из уравнения регрессии.
Однако надо быть осторожным и всегда помнить, что в предварительном
эксперименте уже отсеивались незначимые факторы, скорее всего полученная
незначимость фактора является следствием неудачно выбранного интервала
варьирования: он был выбран малым.
Более правильным является решение повторить эксперимент
при расширенном интервале варьирования для исследуемого фактора. Конечно, при этом число опытов, а значит,
время эксперимента, возрастает. Иногда половину опытов сохраняют тем, что расширение интервала варьирования
проводят только в одну сторону: один (верхний или нижний) уровень остается.
Если фактор остался незначимым после повторения эксперимента и всех
необходимых расчетов, то его (или их) отбрасывают и переходят к оценке
адекватности полученной математической модели.
7. Проверка адекватности линейного уравнения регрессии.
Пригодность линейного уравнения регрессии для решения задачи поиска области оптимума проверяется методом,
изложенным в гл. II, § 6. Сравниваются две дисперсии — одна показывает рассеяние средних опытных данных
переменной состояния
yu относительно тех значений переменной состояния ~
yu , которые предсказаны
полученным линейным уравнением регрессии. Эта дисперсия называется
дисперсией адекватности и рассчитывается по формуле:
s ад2 =
m N
( yu − ~
yu )
∑
N − 1 u =1
2
(26)
где m — число параллельных опытов; N — число строк матрицы планирования; l — число
членов в уравнении регрессии, оставшихся после оценки значимости.
Вторая дисперсия — это ошибка опыта. Адекватность проверяют, оценивая
отношение
Fp =
s ад2
(27)
s o2
по критерию Фишера
F p < FT
(28)
для степеней свободы
fад = N — l, f0 = N (m — 1) и заданного уровня значимости q. Если выполняется
условие (28), то линейное уравнение регрессии признается адекватным, т. е. рассеяние экспериментальных данных
переменной состояния относительно уравнения регрессии того же порядка, что и рассеяние, вызванное случайными
изменениями в объекте исследования (ошибка опыта)
Таблица 7. Формула расчета ПФЭ2
Блок
n
Обозначения
Формулы расчета
и
1
n
yˆ = ∑ bixi, (i = 1,2...., n)
i =1
Или
yˆ = B T X
ŷ –
переменная состояния расчетная);
X , xi – факторы;
B, bi – коэффициенты уравнения
Блок
Обозначения
Формулы расчета
и
регрессии;
n – число факторов;
Y , y i – переменная состояния (экс-
периментальная);
X T – транспонированная матрица
X;
N – число опытов
s u2 – построчная
дисперсия;
y uk –переменная состояния (в
параллельных опытах)
G p – расчетные
значения критерия
Кохрена;
m–
GT –
число параллельных опытов
табличное значение критерия Кохрена;
f1 , f 2 – число степеней свободы;
q – уровень значимости
s o2 – ошибка
опыта (дисперсия
воспроизводимости);
s b2i – дисперсии
t i p – расчетное
коэффициентов;
значение критерия
Стьюдента;
sbi – среднеквадратичные
откло-
нения
t T – табличное
значение критерия
Стьюдента;
f1 , f 2 – число степеней свободы;
2
sад
– дисперсия
адекватности;
F p – расчетное
значение критерия
Блок
Обозначения
Формулы расчета
и
Фишера
f1 , f 2 – число степеней свободы
2
3
bi =
1
N
N
∑x
u =1
su2 =
iu
(i = 1,2, ....., n)
yu
1 m
∑( yuk −yu )2
m − 1 k =1
yu =
Gp =
1 m
∑ yuk
m k =1
su2max
N
∑s
u =1
3а
2
u
Условие однородности
G p < G T ( q, f 1 , f 2 )
f1 = m − 1
f2 = N
4
s o2 =
1
N
sb2i =
5
ti p =
5а
N
∑s
u =1
2
u
so2
N
bi
s bi
Условие значимости
коэффициентов
tip > tT
f = N (m − 1)
6
s àä2 =
N
m
( y u − yˆ u )
∑
( N − n − 1) u =1
Fp =
6а
sàä2
so2
Условие адекватности модели
Fp < FT (q, f1,f2)
f1 = N − ò − 1
f 2 = N (m − 1)
2
Блок
Обозначения
Формулы расчета
и
Рис. 4. Алгоритм расчета и анализа математической модели
При расчете F
предполагается, что sад > sо . Однако на практике бывает, что sад ≤ sо . Тогда
2
p
2
вывод об адекватности модели может быть сделан без проверки условия (23).
2
2
8. Принятие решений.
При невыполнении условия (23), т. е. при неадекватной линейной модели наиболее часто принимают решение об уменьшении интервалов варьирования факторов и повторении эксперимента. Такое решение
может привести к появлению незначимых коэффициентов. Очень эффективно включать в план эксперимента новый
фактор из числа тех, которые в предварительном эксперименте отсеялись, побыли близки по своему эффекту к
оставшимся факторам.
Если условие (23) выполняется, то адекватный линейный полином можно использовать для поиска
области оптимума объекта исследования.
Блок-схема алгоритма расчета представлена на рис 4. Все расчетные формулы сведены в табл. 7.
ПРИЛОЖЕНИЕ 1
Процентные точки распределения
q
f
1
2
3
4
5
6
7
8
9
10
11
12
13
J4
15
16
17
18
19
20
21
22
23
24
25
26
27
99,5%
0,39 • 10
0,010
0,072
0,207
0,412
0,676
0,989
1,344
1,735
2,156
2,630
3,074
3,565
4,075
4,601
5,142
5,697
6,256
6,844
7,434
8,034
8,643
9,260
9,886
10,520
11,160
11,808
-4
97,5%
0,98 • 10
0,050
0,216
0,484
0,831
1,237
1,690
2,! 80
2,700
3,247
3,816
4,404
5,009
5,629
6,262
6,908
7,564
8,231
8,907
9,591
10,283
10,982
11,688
12,401
13,120
13,844
14,573
-3
95%
0,39 • 10
0,103
0,352
0,711
1,145
1,635
2,167
2,733
3,325
3,940
4,575
5,226
5,892
6,571
7,261
7,962
8,672
9,390
10,117
10,851
11,591
12,338
13,091
13,848
14,611
15,379
16,151
-2
5%
3,841
5,991
7,815
9,488
11,070
12,592
14,067
15,507
16,919
18,307
19,575
21,026
22,362
23,685
24,996
26,296
27,587
28,869
30,144
31,410
32,671
33,924
35,172
36,145
37,652
38,885
40,113
2,5%
5,024
7,378
9,348
11,143
12,832
14,449
16,013
17,535
19,023
20,483
21,920
23,336
24,736
26,119
27,448
28,845
30,191
31,526
32,852
34,170
35,479
36,781
38,076
39,364
40,646
41,923
43,194
0,5%
7,879
10,597
12,838
14,860
16,750
18,548
20,278
21,955
23,589
25,188
26,757
28,300
29,819
31,319
32,801
34,267
35,718
37,156
38,582
39,997
41,401
42,796
44,181
45,558
46,928
48,290
49,645
28
12,461
13,121
13,787
29
30
15,308
16,047
16,791
16,928
17,708
18,493
41,337 44,461
42,557 45,722
43,773 46,979
50,993
52,336
53,672
Процентные точки распределения Стьюдента
q
f
1
2
3
4
5
10%
6,31
2,92
2,35
2,13
2,02
5%
12,71
4,30
3,18
2,78
2,57
2%
31,82
6,96
4,54
3,75
3,36
1% f
63,66
9,92
5,84
4,60
4,03
q
6
7
8
9
10
10% 5% 2%
1
%
1,94
1,89
1,86
1,83
1,81
2,45
2,36
2,31
2,26
2,23
3,14
3,00
2,90
2,82
2,76
3,71
3,50
3,36
3,25
3,17
Download