Загрузил eseniya9697

Определение кодированных коэффициентов регрессии

реклама
Определение кодированных коэффициентов регрессии (ПФЭ)
В этом случае используется применяемая при линейном регрессионном анализе матричная формула
метода наименьших квадратов (МНК), которая с учётом кодирования факторов имеет вид:
 ~
~
a  
m 11  m 1n

T
~ 
 
n m 1 

1
~

m 1n
T

y ,
n1
где кодированная матрица, зависящая от независимых переменных для двух факторов включает
только +1 и -1 и имеет вид:
 z10
z
~
20

 z
 43 
 z30

 z 40
z11
z 21
z31
z 41
z12   1

z 22   1

z32   1
 
z 42   1
 1  1
 1  1
 1  1

 1  1
Матрица z
при активном экспериментировании называется матрицей планирования и обладает
тремя оптимальными свойствами:
 симметричности: сумма элементов всех столбцов матрицы, кроме первого (точнее, нулевого)
равна нулю
n
 zij  0, j  1,...m;
i 1
 ортогональности: скалярное произведение двух любых столбцов матрицы равно нулю
n
z zu   zij ziu  0
T
j
i 1
j , u  0,1,...m u  j;
 нормировки: скалярное произведение двух одинаковых столбцов матрицы равно n ( n = 2m в ПФЭ)
n
z Tj z j   zij2  n
i 1
j  0,1,...m .
Благодаря перечисленным оптимальным свойствам матрицы планирования
матрица в ПФЭ при m=2 равна
~
~
  
33 
T
~
  z
34  43 
T
34 
z
информационная
n 0 0 
z  0 n 0,
43 
0 0 n
т.е. она является диагональной с одинаковыми элементами на главной диагонали, равными n=22=4.
Соответственно, корреляционная матрица C также будет диагональной и с одинаковыми
элементами главной диагонали:
~ ~ ~
C     
33 


T
1
1

n
1
T



 z z   0


0

0
n 1
0
0

0
n 1 
Результатом подстановки последних соотношений в матричную формулу для определения
кодированных коэффициентов регрессии будет простая формула:
n
a~ j 

z
y
 ij i
i 1
,
n
j  0,1,...m
При учёте взаимодействия двух факторов z1 и z2 кодированное уравнение регрессии принимает вид:
yˆ  a~0  a~1 z1  a~2 z2  a~12 z1 z2
и в матрицу планирования z включается ещё один дополнительный последний столбец, каждый
элемент которого равен произведению элементов столбцов, соответствующих взаимодействующим
факторам:
 z10
z
~
  z   20
 44 
 z30

 z 40
z11
z12
z 21
z 22
z31
z32
z 41
z 42
z11z12   1
z21z22   1


z31z32   1
z41z42   1
 1  1  1
 1  1  1
 1  1  1

 1  1  1
При этом матрица планирования сохраняет все три оптимальных свойства: симметричности,
ортогональности и нормировки, а кодированный коэффициент уравнения регрессии при члене,
характеризующем взаимодействие факторов, определяется по формуле:
 z z y
n
a~ ju 
i 1
ij iu
n

i
,
j , u  1,...m u  j
В теории ПФЭ доказывается, что при увеличении числа факторов ( m >2 ) матрица
планирования nz p  строится с использованием рассмотренной методики, в том числе и с учётом
взаимодействия факторов (не только двойного, но и тройного, четверного и т.д.).
В этом случае число столбцов матрицы p зависит от числа учёта взаимодействий факторов n
= 2m и матрица планирования сохраняет перечисленные оптимальные свойства.
Поэтому для определения
приведённые выше формулы.
кодированных
коэффициентов
регрессии
используются
Для расчёта натуральных значений коэффициентов в кодированное уравнение регрессии
вместо кодированных факторов zj ( j = 1, … m ) следует подставить выражения для последних через
натуральные значения факторов x j ( j = 1, … m ) в соответствии с приведённой выше схемой
кодирования.
Определение значимости кодированных коэффициентов регрессии (ПФЭ)
Незначимость кодированных коэффициентов регрессии определяется с использованием
табл
a~ j
квантиля t – распределения Стьюдента t   f  при помощи неравенства:
e
 t табл
 fe  ,
S a~ j
где β – доверительная вероятность (в инженерных расчётах равная 0,95);
fe – число степеней свободы дисперсии воспроизводимости (при одной серии параллельных опытов
равная k -1).
Выборочное значение квадратного корня дисперсии кодированного коэффициента регрессии
определяется по формуле:
~
S a~ j  C jj Se ,
где Se - квадратный корень из дисперсии воспроизводимости, определяемой по k параллельным опытам в
центре плана эксперимента:
 y
k
S 
2
e
j 1
2

0S
 yc
k 1

SS e

,
fe
где SSe - сумма квадратов дисперсии
воспроизводимости;
fe - число степеней свободы дисперсии
воспроизводимости.
Как было показано выше, диагональные элементы корреляционной матрицы в ПФЭ при кодировании
факторов одинаковы и равны 1/n, вследствие чего
Se
S a~ j 
.
n
В результате условие незначимости кодированных коэффициентов регрессии принимает вид:
a~ j
Se
Так как корреляционная матрица
~
C
n  t табл
 f e .
в этом случае является диагональной, то кодированные
коэффициенты регрессии статистически независимы и при одновременной незначимости
нескольких кодированных коэффициентов регрессии они (в отличие от процедуры обработки
пассивного эксперимента) могут быть сразу, все вместе, исключены из кодированного уравнения
регрессии.
Скачать