На правах рукописи - Учебно-методические разработки ЮФУ

advertisement
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное образовательное
учреждение высшего профессионального образования
«Южный федеральный университет»
В.И. ФИНАЕВ
ПЛАНИРОВАНИЕ
ЭКСПЕРИМЕНТОВ
И ОБРАБОТКА
ЭКСПЕРИМЕНТАЛЬНЫХ
ДАННЫХ
Учебное пособие
Допущено Учебно-методическим объединением вузов по
образованию в области автоматизированного
машиностроения (УМО АМ) в качестве учебного пособия
для студентов высших учебных заведений, обучающихся
по направлению подготовки дипломированных
специалистов – «Автоматизированные технологии и
производства» (специальность 210200 – «Автоматизация
технологических процессов и производств (в энергетике))».
Таганрог 2013
2
УДК 518.5.001.57(075.8)
Рецензенты:
доктор технических наук, профессор, руководитель
регионального
(областного)
центра
новых
информационных технологий Целых А.Н.;
доктор технических наук, профессор, заведующий
кафедрой информатики ТГПИ Ромм Я.Е.
Финаев В.И. Планирование экспериментов и обработка
экспериментальных данных: Учебное пособие. - Таганрог:
Изд-во ЮФУ, 2013. - 92 с.
Учебное поcобие пpедназначено для cтудентов высших
учебных заведений, изучающиx дисциплины, связанные с
моделиpованием и оптимизацией функционирования
cиcтем. В учебном пособии приведены основные
теоретические
положения
теории
вероятностей,
планирования эксперимента и обработки статистических
данных.
Табл. 13. Ил. 22. Библиогр.: 6 назв.
 ЮФУ, 2013
 В.И. Финаев, 2013
3
СОДЕРЖАНИЕ
ВВЕДЕНИЕ…………………………………………..…….. 4
1. ЛИНЕЙНЫЕ МОДЕЛИ НАБЛЮДЕНИЙ…………….. 6
1.1. Основные определения…………………………….……... 6
1.2. Формализация линейной модели наблюдений……….….8
2. ПОЛНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ…………... 14
2.1. Определение эксперимента………………………….…… 14
2.2. Определение полного факторного эксперимента…..…... 16
2.3. Полный факторный эксперимент 22…………………..…. 17
2.4. Полный факторный эксперимент 23…………………..…. 20
2.5. Полный факторный эксперимент 2k……………..………. 21
3. ДРОБНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ…………. 25
3.1. Определение дробных реплик………………………...…. 25
3.2. Выбор дробных реплик………………………………...… 30
4. ПОИСК ЭКСТРЕМУМА ФУНКЦИИ ОТКЛИКА….. 38
4.1. Определение стратегии поиска………………………... 38
4.2. Метод крутого восхождения…………………………... 39
4.3. Метод Бокса и Уильсона……………………………….... 41
4.4. Пример расчета крутого восхождения………………... 45
5. ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ
ДЛЯ ЗАДАЧ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА………..52
6. ОБРАБОТКА СТАТИСТИЧЕСКИХ ДАННЫХ…..… 57
6.1. Сведения из теории вероятностей….….….….….………. 57
6.2. Применение нормального закона для оценки
вероятности и проверки гипотез……...…………..…………... 64
6.3. Значимость оценки………………………...……………… 70
6.4. Формулы и алгоритмы для оценки результатов
моделирования………………………………………….………78
БИБЛИОГРАФИЧЕСКИЙ СПИСОК……….…….………. 91
4
ВВЕДЕНИЕ
Цель данного пособия состоит в предоставлении возможности
студентам изучить основные разделы теории планирования
эксперимента и обработки статистических данных, необходимые
для решения исследовательских задач.
В первом разделе приведено определение линейных моделей
наблюдений, основные сведения из теории планирования
эксперимента. Показано, как определяются неизвестные
коэффициенты линейной модели наблюдения и как проверяется
адекватность модели.
Во втором разделе рассмотрены особенности построения
полных факторных экспериментов на примерах моделей с двумя,
тремя и k факторами. Показаны особенности кодирования
переменных модели. Определены матрицы плана эксперимента,
формулы для оценки неизвестных параметров модели
планирования эксперимента.
В третьем разделе рассмотрены особенности построения
дробных факторных экспериментов. Определено понятие
генератора дробного плана и рассмотрены примеры построения
дробного факторного эксперимента 23-1 и дробного факторного
эксперимента 24-1. Рассмотрен пример использования реплик для
случая, когда число неизвестных параметров функции отклика
больше числа опытов.
В четвертом разделе рассмотрен метод крутого восхождения,
применяемый для поиска экстремума функции отклика.
Сформулирована стратегия поиска экстремума функции отклика,
изложена суть «шагового» метода изучения поверхности
отклика, рассмотрен метод Бокса и Уильсона, а также пример
его применения для поиска экстремума функции отклика.
В пятом разделе приведено описание информационного
обеспечения для задач планирования эксперимента. Работа
информационного обеспечения рассмотрена на конкретном
примере.
В шестом разделе приведены сведения из теории
вероятностей и математической статистики. Приведено
5
пояснение понятий «испытания», «событие», «вероятность»,
«частота», «частость» и других терминов теории вероятностей и
математической статистики.
Приведены основные формулы для определения моментных
функций, объяснено назначение математического ожидания,
дисперсии,
среднего
квадратического
отклонения
и
корреляционной функции при обработке статистических данных.
Приведите формулы основных вероятностных теоретических
распределений и объяснён их смысл. Приведена теорема Лапласа
и теорема Бернулли.
Показано определение доверительного интервала при
проверке гипотез относительно вероятностей случайной
величины. Приведено объяснение понятий «значимость оценки»,
«уровень значимости», а также пример проверки гипотез о
законе распределения с применением критери Пирсона.
Приведены алгоритмы, которые можно применить в
информационном обеспечении для обработки статистических
данных.
При изложении материалов учебного пособия использованы
сведения из работ В.И. Аcатуpяна, Е.C. Вентцель, И.В. ДунинБаpковcкого, Л.А. Овчарова и Б.Я. Cмиpнова.
6
1. ЛИНЕЙНЫЕ МОДЕЛИ НАБЛЮДЕНИЙ
1.1. Основные определения
Одной
из
распространенных
задач
научноисследовательского характера является задача исследования
вектора выходных параметров Y=(y1,y2,…,yn) некоторого объекта,
на вход которого подается вектор входных воздействий
X=(x1,x2,…,xn).
Исследование может осуществляться с целью поиска
экстремумов функции выходных параметров.
Математической моделью объекта является система
уравнений
yi  f i(x1 ,x2 ,..., xk ), i  1,F .
Входные переменные xj, j  1,k называют факторами, а
функции fj(…) - функциями отклика.
Фактором называется измеряемая переменная величина,
подаваемая на вход объекта и принимающая в некоторый
момент времени определенное значение. Каждый фактор будет
задан, если вместе с его названием указана область определения.
Под областью определения понимается множество значений Xj,
которые может принимать i-й фактор.
Факторы определяют как сам объект, так и его состояние.
Поэтому к факторам предъявляют такие требования, как
управляемость и однозначность.
Управлять фактором - значит установить нужное значение и
поддерживать его постоянным в течение опыта или изменять по
заданной программе. Планировать эксперимент можно только
тогда,
когда
уровни
факторов
подчиняются
воле
экспериментатора.
В планировании эксперимента [1 - 4] могут участвовать
сложные факторы или совокупность факторов, к которым
предъявляются требования совместимости и отсутствия
линейной корреляции. При этом выбранное множество факторов
должно быть полным, а точность фиксации факторов - высокая.
7
Экспериментатор ставит опыты с целью идентификации
параметров модели.
Каждый из факторов xj может принимать в u-м опыте,
проводимом
экспериментатором,
одно
из
возможных
(задаваемых) значений xiu  X i , называемых условиями.
Значения факторов задаются в виде дискретных уровней.
Фиксированный набор уровней факторов
x1u , x 2u ,..., x ku
определяет одно из возможных состояний черного ящика zj. Если
перебрать все наборы состояний, то получим полное множество
Z состояний объекта.
Соответствие кортежей (x1,x2,…,xk) и элементов множества Z
устанавливается отображением Ф, задаваемым в виде таблицы,
причем в таблице указывается число возможных различных
опытов, которое определяется сложностью принятой модели.
Оценка числа состояний объекта соответствует числу уровней
факторов P, возведенных в степень числа факторов k. Очевидно,
что даже такая простая система с p=4 и k=4 требует 256 опытов
для оценки 256 состояний.
Очевидно
желание
исследователя
сократить
число
экспериментов с объектом, так как каждый эксперимент стоит
денег и времени. Задача определения требуемого числа опытов
решается методами планирования экспериментов.
Планирование эксперимента - это процедура выбора числа
условий протекания опытов, необходимых и достаточных для
решения поставленной задачи с требуемой точностью.
При этом существенным являются:
- стремление к минимизации общего числа опытов;
- одновременное
варьирование
всеми
переменными,
определяющими процесс, по специальным правилам алгоритмам;
- использование математического аппарата, формализующего
действия эксперимента;
- выбор четкой стратегии, позволяющей принимать
обоснованные решения после каждой серии экспериментов.
Задачи, для решения которых может использоваться
планирование эксперимента, чрезвычайно разнообразны, а там,
где есть эксперимент, имеет место и наука о его проведении -
8
планирование эксперимента.
При
планировании
экстремального
эксперимента
определяется параметр, который нужно оптимизировать
(например, найти его экстремум).
Параметр оптимизации - это реакция (отклик) на воздействия
факторов, которые определяют поведение изучаемой системы.
Параметры оптимизации бывают экономическими, техникоэкономическими, технико-технологическими и т.д. Параметр
оптимизации должен быть измеримым, т.е. мы должны уметь его
измерить при любой возможной комбинации выбранных
уровней факторов.
При исследованиях должны быть определены существенные
факторы, оказывающие влияние на функционирование объекта.
Ошибка опыта возрастет, если какой-либо из существенных
факторов окажется не учтенным. Обычно на практике, если
число опытов больше пятнадцати, следует обратиться к методам
отсеивания несущественных факторов.
1.2. Формализация линейной модели наблюдений
1.2.1. Формальное
описание
модели.
В
задачах
планирования эксперимента нашли применение линейные
модели наблюдений.
Выбор модели - процесс творческий и итеративный. Выбрать
модель - значит выбрать вид некоторой аналитической функции
в виде определенного уравнения.
На рис. 1.1 показана графическая интерпретация модели
(называемой функцией отклика) в виде поверхности в
трехмерном пространстве. На горизонтальной плоскости
определена область изменения факторов x1 и x2. Каждому
состоянию объекта соответствует точка y на поверхности,
которой, в свою очередь, соответствует точка на горизонтальной
плоскости, определяемая факторами x1 и x2.
Понятие
линейной
модели
наблюдений
является
фундаментальным в математической статистике, так как многие
статистические зависимости описываются функциями регрессии,
линейными по неизвестным параметрам и в общем случае
9
нелинейными по независимым переменным (факторам в теории
планирования эксперимента).
Y
X2
X1
Рис. 1.1
Рассмотрим понятия линейной модели наблюдений [1 - 3].
Пусть имеется n измерений y1, y2,…, yn случайной величины Y,
для которых
(1.1)
M{y }  x β  x β  . . .  x β , i  1,n ,
i
i1 1 i 2 2
ip p
где
σ 2 , i  j ,
cov {y y }  
i j
0 , i  j ,
={1,2,…,n} - вектор неизвестных параметров;
(1.2)
2 – дисперсия;
X=(xij), i  1,n , j  1,p - матрица известных коэффициентов
порядка np;
cov{yi,yj}=M(yi–M{yi})(yj–M{yj}) - ковариация между yi и yj;
M{…} - операция математического ожидания.
Формула (1.1) задает априорный вид связи результатов
наблюдений {yi} и величин {xij}, а формула (1.2) определяет
10
требование некоррелированности случайных величин {yi} и
одинаковости дисперсий 2 для всех yi.
В векторной форме эти уравнения примут вид
M{ Y }  Xβ; D{ Y }   2 I n ,
где Y={y1,y2,…,yn}T - вектор наблюдений; ={1,2,…,n}T - вектор
неизвестных параметров; M{Y} - математическое ожидание
вектор-столбца Y, причем
M{y 1 }
M{y }

2
M{Y}  
.
.
.

M{y n },
M{Y}=(cov{yi, yj})=2In - ковариационная матрица вектора
наблюдений Y; In - единичная матрица порядка n.
Определим погрешность измерений в виде вектора
E={E1,E2,…,En}T.
Тогда для i-го наблюдения
E=yi - M{yi), i  1, n Yi=xi11+xi22+…+xipp+Ei,
M{Ei}=0, cov{Ei,Ej}=cov{yi,yj}, i, j  1, n .
В матричной форме это запишется в виде
Y=X+E,
(1.3)
M{E}=0, D{E}=H(EET)=2In,
(1.4)
где D{E} - ковариационная матрица; 0 - нулевой вектор-столбец.
Формулой (1.3) с условиями (1.4) определена линейная
модель с некоррелированными наблюдениями.
Модель наблюдений (1.3) называется моделью полного ранга,
если ранг матрицы X равен числу неизвестных параметров j в
уравнении (1.1) (rankX=p).
1.2.2. Оценивание параметров модели. Неизвестные
параметры 1,2,…,n называются коэффициентами регрессии и
подлежат оцениванию по наблюдениям y1,y2,…,yn.
Оценивание неизвестных коэффициентов осуществляется
методом наименьших квадратов, суть которого состоит в
минимизации суммы квадратов отклонений наблюдаемых
величин yi и теоретических оценок
11
n
Q   ( y i - xi1 b1 - xi2 b2 - . . . - xip b p ) 2 .
i 1
Значения b j  ̂ j ,
j  1, p ,
(1.5)
минимизирующие функционал
(1.5) при наблюдаемых значениях yi, i  1,n , называются
оценками метода наименьших квадратов (МНК-оценками)
неизвестных параметров i [2].
Необходимые
условия
существования
МНК-оценки
ˆ
ˆ
ˆ
ˆ
параметра

=(

,

,…,

)
определяются
при
1 2
p
  (  1 ,  2 ,...,  p )
dQ
 0 ,   1, p .
db
Тогда
n
dQ
 2 ( yi - xi 1b1 - xi 2 b2 - . . . - xi p b p )xi   0 ,   1, p
db
i 1
Отсюда
n
n
x  x
i 1
i
j 1
n
i j b j   xi  y i ,
i 1
или в матричной форме
XTXB=YTX.
(1.6)
Если ранг матрицы X равен p, т.е. числу известных
параметров {j}, то уравнение (1.6) имеет единственное
решение, так как ранг матрицы S=XTX также равен p и она
является невырожденной.
Матрица S=XTX называется информационной. Для нее
существует обратная матрица. Вектор оценок ̂ неизвестных
параметров {j} определяется формулой
ˆ =S-1YTX.
(1.7)
После вычисления коэффициентов модели необходимо
проверить ее пригодность, т.е. убедиться в адекватности модели.
Это осуществляется путем применения известных критериев
статистических оценок [5,6].
Вводится понятие числа степеней свободы. Числом степеней
свободы называется разность между числом опытов и числом
коэффициентов, которые уже вычислены по результатам этих
12
опытов независимо друг от друга. Если, например, проведен
полный факторный эксперимент 22, т.е. все факторы
комбинируются друг с другом, то число степеней свободы
f=N - (k+1)=8 - (3+1)=4,
где N - число комбинаций (экспериментов), k - число входных
факторов модели.
Остаточная сумма квадратов, деленная на число степеней
свободы, называется дисперсией адекватности, которая имеет
вид
N
S
2
ag

 y
i 1
f
i
.
В планировании эксперимента число степеней свободы для
дисперсии адекватности равно числу различных опытов,
результаты которых используются при подсчете коэффициентов
регрессии минус число определяемых коэффициентов.
Для проверки гипотезы адекватности модели часто
используется F-критерий Фишера, который определяется
следующей формулой [5,6]:
2
F  S ag
/S 2 {y} ,
где S2{y} - дисперсия воспроизводимости, в случае двух
повторных опытов вычисляемая по формуле
N
S{y} 
2 ( y i g - y i* ) 2
i 1
N
N

 ( y
i 1
N
i
)2
,
где y - значение параметра оптимизации в каждом опыте; y* среднее значение параметра оптимизации из N повторных
наблюдений.
Контрольные вопросы
1. Какая система уравнений является математической
моделью объекта в теории планирования эксперимента?
2. Что представляет собой планирование эксперимента?
13
3. Приведите формулу линейной модели наблюдений,
содержащую неизвестные параметры.
4. Приведите вывод формулы для оценки неизвестных
параметров линейной модели наблюдений по методу
наименьших квадратов.
5. Какой критерий применяется для проверки гипотезы
адекватности линейной модели наблюдений? Приведите
формулу критерия.
14
2. ПОЛНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ
2.1. Определение эксперимента
Моделью объекта будем считать одномерную функцию
отклика.
Если y - случайная одномерная величина, то ее
математическое ожидание при фиксированном значении вектора
X определится
M{y/X}=M{y(X)}=F(X).
k
Функция 2 есть функция отклика и представляет собой
среднее значение выходной переменной y при фиксированном
значении вектора контролируемых параметров X=(x1, x2,…, xk),
задающих точку в k-мерном векторном пространстве.
Одномерная регрессионная модель эксперимента представима
в виде
p
  M{y(X)}  f T ( X )   f j (x1 , x 2 , . . . , x p ) j ,
j 1
где =(1, 2,…, n) - p-мерный вектор неизвестных параметров;
{fj=(x1, x2,…, xp)} - известные функции. Функция  линейна по
неизвестным параметрам j.
При планировании эксперимента необходимо определить
границы областей определения факторов. При этом должны
учитываться принципиальные ограничения для значений
факторов, а также ограничения, определяющиеся существующей
аппаратурой, технологией, организацией производства и
управления. При оптимизации обычно используется априорная
информация, т.е. информация, содержащаяся в результатах
предыдущих опытов.
Наилучшим условием, определенным из анализа априорной
информации, соответствует комбинация уровней факторов.
Каждая комбинация факторов является многомерной точкой в
факторном пространстве, которую можно рассматривать как
исходную точку для построения плана эксперимента. Эту точку
называют основным (нулевым) уровнем.
T
15
Построение плана эксперимента сводится к выбору
экспериментальных
точек,
симметричных
относительно
нулевого уровня.
После того как выбран основной уровень, необходимо
перейти к выбору интервала варьирования, представляющего
собой некоторое число (свое для каждого фактора), прибавление
которого к основному уровню дает верхний, а вычитание нижний уровни факторов.
При выборе интервала варьирования полезны следующие
сведения априорной информации: точность, с которой
экспериментатор фиксирует значения факторов, кривизна
поверхности отклика и диапазон изменения параметра
оптимизаций в разных точках факторного пространства.
Рассмотрим эксперимент, в котором проводится N измерений
зависимой переменной y в некоторых точках факторного
пространства.
Пусть в u-м опыте (u  1, N ) в точке X=(x1u, x2u,…, xku)
определено значение переменной Yu. В результате будет
получена совокупность измерений Y1,X1; Y2, X2 ;…; YN, XN.
На рис. 2.1 приведена схема эксперимента, который носит
название N- эксперимент.
X
Объект

Рис. 2.1
Набор точек X u ( u  1, N ) называется планом эксперимента.
Точки при этом необязательно должны быть различными.
Матрица
x11 x 2 1 . . . xk 1
D
x1 2 x 2 2 . . . x k 2
. .. . .. .. . . . .
x1N x 2 N . . . xkN
16
называется матрицей плана эксперимента (N). Совокупность
точек X1, X2,…, XN плана называется спектром плана.
Для каждого u-го наблюдения
p
M{y u /x1 u , x2 u , . . . , xk u }   f j ( x1 u , x 2u , . . . , xk u ) j
j 1
или в векторной форме M{Y}=X, где X={Xju}  матрица
известных коэффициентов, называемая матрицей независимых
переменных, или матрицей планирования.
2.2. Определение полного факторного эксперимента
Эксперимент, в котором уровни каждого фактора
комбинируются со всеми уровнями других факторов,
называются полным факторным экспериментом (ПФЭ).
Если Si, i  1,k - число уровней фактора xi, то число точек
спектра плана определится по формуле
N=S1S2S3…Sk.
План (N) называется неполным или дробным факторным
планом, если число точек его спектра
N< S1S2S3…Sk.
План (N) называется симметричным, если все факторы
имеют одинаковое число уровней S1=S2=S3=…=Sk.
Рассмотрим построение ПФЭ 2k.
Запись 2k соответствует тому, что число уровней каждого
фактора равно двум, а число точек спектра плана N=2k.
Определим понятие кодированных переменных.
Будем рассматривать функцию отклика =(x1, x2,…, xk),
определенную в области GR.
Задана матрица плана (N) – D(Xiu), i  1,k , u  1, N .
Пусть каждая переменная xi во всех опытах может принимать
два значения Xiu{xi1,xi2}, где xi1 -- верхний уровень фактора, xi2
- нижний уровень фактора, xi2 >xi1.
Определим основной уровень
xi0  ( xi 1  xi 2 ) / 2 , i  1,k .
Интервал варьирования фактора xi равен
17
Si  ( xi 2  xi 1 ) / 2 , i  1,k .
Введем кодированные переменные
xi= ( xi  xi0 ) / Si , i  1,k ,
которые на верхних уровнях принимают значения +1, а на
нижних уровнях -1.
Функция отклика запишется через кодированные переменные
=(x1, x2,…,xk).
2.3. Полный факторный эксперимент 22
Рассмотрим случай при k=2. Этот эксперимент определим как
ПФЭ 22. Функция отклика имеет вид
=f(x1, x2).
Матрица планирования эксперимента с двумя факторами
приведена в табл. 2.1.
Таблица 2.1
Комбинации уровней двух факторов
№
x1
x2
y
Буквенные
опыта
обозначения
1
-1
-1
y1
(1)
2
+1
-1
y2
a
3
-1
+1
y3
b
4
+1
+1
y4
ab
Каждый столбец в матрице планирования называют векторстолбцом, а каждую строку - вектор-строкой. То, что записано в
столбце, можно изобразить геометрически. Для этого в области
определения факторов найдем точку, соответствующую
основному уровню, и проведем через нее новые оси координат
(рис. 2.2).
Выберем масштаб по новым осям так, чтобы интервал
варьирования для каждого фактора равнялся единице. Тогда
условия проведения опытов будут соответствовать вершинам
квадрата, центром которого является основной уровень.
Номера вершин квадрата соответствует номерам опытов.
Площадь, ограниченная квадратом, называется областью
18
эксперимента.
x2
3
x22
4
(-1,1)
(1,1)
x20
1
x21
2
(-1,-1)
x11
(1,-1)
x10
x1
x12
Рис. 2.2
Для сокращения записи матрицы планирования удобно ввести
условные буквенные обозначения строк. При этом порядковый
номер фактора ставится в соответствие букве: x1 - а, x2 - b,
x1x2 - ab и т.д.
Буква записывается в случае, если фактор находится на
верхнем уровне.
Опыт со всеми факторами на нижних уровнях обозначим
через (1) (см. табл. 2.1).
Пусть функция отклика имеет вид
=M{y}=0x0 + 1x2 + 2x2 + 12x1x2.
(2.1)
где x0=1 - фиктивная переменная (эквивалент среднего значения,
не влияющего существенно на результаты оценки); y выходная переменная.
При условии, что в каждом варианте испытаний проводятся
по одному наблюдению, матрица D2 ПФЭ 22 запишется в виде
- - - - - - - y1
-1 -1
- - - - - - - y2 .
1 -1
(2.2)
D2 
- - - - - - - y3
-1
1
1
1
- - - - - - - y4
Если определить 12=3, x1ux2u=x3u, то получим
19
3
M{y}    j x j u , u  1,4 .
j 0
Матрица планирования ПФЭ 22 приведена в табл. 2.2.
Таблица 2.2
Комбинации уровней ПФЭ 22
№ опыта
x0
x1
x2
x1x2
y
1
+1
+1
+1
+1
y1
2
+1
-1
+1
-1
y2
3
+1
-1
-1
+1
y3
4
+1
+1
-1
-1
y4
Матрица независимых переменных X=(xju), j  0,3 ,u  1,4 ,
соответствующая матрице плана (2.1) и функции отклика (2.1),
имеет вид
X
1
-1
-1
1
1
1
1
1
-1
1
-1
1
1
-1
-1
1
Отметим, что, поскольку
N
x
lu
x s u  0 , l, s  0,3 , l  s ,
u1
то планирование является ортогональным.
В соответствии с формулой (1.7) МНК-оценки параметров 0,
1, 2, 3 определяется
4
4
u 1
u 1
 j   x j u y u /  x 2j u , j  0,3 .
Оценки некоррелированы, и их дисперсия
D{  j }   2 / 4 ,
j  0,3 .
Отметим следующее:
D2 
D1
E1
D1
E1
, D1 
где D1 - матрица плана ПФЭ 21.
-1
,
1
E1 
1
1
,
20
2.4. Полный факторный эксперимент 23
Предположим, что при комбинации уровней переменных x1,
x2, и x3 проводится по одному опыту в каждом варианте
испытаний.
Функция отклика имеет вид
η  β0  β1 x1  β 2 x 2  β 3 x 3  β12 x1 x 2  β13 x1 x 3  β 23 x 2 x 3 
 β123 x1 x2 x3  β0 
βx  β
1i 3
i i
1i  j 3
x x j  β123 x1 x2 x3 .
i j i
(2.3)
Все различные комбинации уровней переменных x1, x2, x3
приведены в табл. 2.3.
Таблица 2.3
Комбинации уровней ПФЭ 2
Матрица независимых переменных
Вариант Набиспыта- людеx0 x1 x2 x3 x1,x2 x1,x3 x2,x3 x1,x2,x3
ний
ния
1 -1 -1 -1
1
1
1
-1
(1)
y1
1
1 -1 -1
-1
-1
1
1
a
y2
1 -1 1 -1
-1
1
-1
1
b
y3
1
1 1 -1
1
-1
-1
-1
ab
y4
1 -1 -1 1
1
-1
-1
1
c
y5
1
1 -1 1
-1
1
-1
-1
ac
y6
1 -1 1 1
-1
-1
1
-1
bc
y7
1
1 1 1
1
1
1
1
abc
y8
Произведение xi, xj называется парным взаимодействием
(взаимодействием 1-го порядка). Произведение x1,x2,x3
называется тройным взаимодействием (взаимодействием 2-го
порядка).
Если определить
4=12, 5=13, 6=23, 7=123,
x4u=x1ux2u, x5u=x1ux3u, x6u=x2ux3u, x7u=x1ux2ux3u,
то функция отклика (2.3) запишется в виде
7
    j x j u , u  1,8 .
j 0
21
Планирование
является
ортогональным
следовательно, из формулы (1.7) находятся оценки
8
8
8
u 1
u 1
u 1
(rankX=8),
 j   x j u y u /  x j u  0 ,125 x j u y u .
Оценки {j} некоррелированы, так как D{j}=2/N, j  0,7 .
Матрица D3 ПФЭ 23 определится
-1 -1 -1
1 -1 -1
D3 
D2
D2
- E2 ,
E2
D3 
-1
1
1 -1
1 -1
-1 -1
1 -1
1
1
-1
1
1
1
1
1
,
где E2=(1,1,1,1)T.
2.5. Полный факторный эксперимент 2k
Обобщим построение полных факторных экспериментов для
случая k независимых переменных, на базе рекуррентных
процедур построения матрицы плана и функции отклика.
Из табл. 2.2 и 2.3 очевидно, что матрица ПФЭ 23 получается
путем повторения матрицы плана ПФЭ 22 при х3= -1 и х3=1.
Тогда матрица плана ПФЭ 24 будет получена повторением
матрицы плана ПФЭ 23 для x4= -1 и x4=1.
Таким образом, матрица плана ПФЭ 2k+1 может быть
представлена в рекуррентном виде
Dk - E k
,
Dk 1 
Dk
Ek
где Ek=(1,1,…,1)T  двухмерный единичный вектор, Dk 
матрица плана ПФЭ 2k.
Полный факторный эксперимент типа 2k обладает
следующими свойствами:
- алгебраическая сумма элементов вектор-столбца каждого
22
фактора равна нулю (свойство симметрии)
N
x
i 1
iu
 0 , i  1, k ,
где N  число опытов, i  номер фактора;
- сумма квадратов элементов каждого столбца равна числу
опытов (условие нормировки), т.е.
N
x
i 1
2
iu
 Xi
2
N,
где Xi  i-й вектор-столбец матрицы X;
- сумма почленных произведений любых двух векторстолбцов матрицы Х равна нулю (свойство ортогональности
матрицы планирования):
N
X
u 1
lu
X s u  X lT X s  0, l, s  0, k , l  s ;
- свойства рототабельности, т.е. точки в матрице
планирования подбираются так, что точность предсказания
значений параметра оптимизации одинакова на равных
расстояниях от центра эксперимента и не зависит от
направления.
Матрица независимых переменных Хk ПФЭ 2k также может
быть построена из матрицы независимых переменных Xk-1 ПФЭ
2k-1 в соответствии с рекуррентной формулой
X k -1 - X k -1
.
Xk 
X k -1
E k -1
Пусть функция отклика имеет вид
η  β0   β i xi   β i j xi x j 

β
i jl
1i  j l  k
1 i  k
1 i  j  k
x i x j x l  . . .  β 1 2 3 . . . k x1 x 2 x 3 . . . x k .
(2.4)
Тогда в соответствии с видом этой функции уравнение
регрессии запишется в виде
k
k
m 1
i 1
   0   S m , S    i xi ,
23
Sm 
β
i1i2 . . . im
1i1 i2  . . . im  k
Произведение
взаимодействием
xi1 xi2 . . . xim ,
m  2, k .
x i1 x i2 ...x in , 1  i1  . . .  i m  k
называется
порядка
xi1 xi2 ...xin .
(m-1)-го
факторов
Коэффициент регрессии i называется линейным эффектом
переменной xi, а коэффициент  i1i2 ...im
 эффектом
взаимодействия факторов xi1 xi2 ...xin .
Число всех возможных эффектов, включая линейные эффекты
и взаимодействия всех порядков, равно числу опытов полного
факторного эксперимента. Чтобы найти число возможных
взаимодействий некоторого порядка, можно воспользоваться
обычной формулой числа сочетаний
C km 
k!
,
m! (k - m)!
где k  число факторов; m  число элементов во
взаимодействии.
Функцию отклика k ПФЭ 2k можно также записать в виде
рекуррентного соотношения [2] k=k-1(1+xk), где k-1  функция
отклика ПФЭ 2k-1.
Контрольные задания
1. Приведите формулу одномерной регрессионной модели
эксперимента.
2. Что представляет собой кодирование переменных модели?
3. Приведите общий вид матрицы плана эксперимента.
4. Приведите определение полного факторного эксперимента.
5. Приведите матрицу планирования эксперимента с двумя
факторами.
6. Приведите матрицу полного факторного эксперимента 22.
7. Приведите формулы для оценки неизвестных параметров
модели планирования эксперимента с двумя факторами.
8. Приведите матрицу планирования эксперимента с тремя
24
факторами.
9. Приведите матрицу полного факторного эксперимента 23.
10. Приведите формулы для оценки неизвестных параметров
модели планирования эксперимента с тремя факторами.
11. Приведите матрицу планирования эксперимента с k
факторами.
12. Приведите матрицу полного факторного эксперимента 2k.
13. Приведите формулы для оценки неизвестных параметров
модели планирования эксперимента с k факторами.
25
3. ДРОБНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ
3.1. Определение дробных реплик
Число опытов в ПФЭ превышает число коэффициентов
линейной модели, причем тем больше, чем больше факторов.
Если можно ограничиться линейным приближением, то число
опытов можно сократить, используя для планирования дробные
реплики от полного факторного эксперимента [2, 3].
С ростом числа переменных k число опытов N быстро растет,
а при большом числе k реализация ПФЭ 2k становится
практически невозможной. Также с ростом N увеличивается
число взаимодействий и их порядок в формуле (2.4).
Кроме того, при анализе функционирования объекта может
быть известно, что в уравнении (2.4) эффектами воздействия
высоких порядков можно пренебречь либо они не существуют.
Следовательно, число опытов для нахождения оценок
неизвестных коэффициентов уравнения (2.4) может быть
уменьшено. Это производится с помощью применения дробных
факторных экспериментов (ДФЭ), представляющих собой
дробные реплики от ПФЭ.
Для построения дробного факторного плана типа 2k-p из
множества k отбирают (k - p) основных факторов, для которых
строят полный факторный план с матрицей Хk-p.
Этот план дополняют затем р столбцами, соответствующими
оставшимся факторам. Каждый из этих p столбцов получается
как результат поэлементного перемножения не менее двух и не
более (k - p) определенных столбцов, соответствующих
основным факторам.
Для определения столбца образования каждого из р столбцов
дробного факторного плана вводится понятие генератора плана
[2]. Генератор представляет собой произведение основных
факторов, определяющее значение элементов каждого из
дополнительных столбцов матрицы плана. Очевидно, что в
случае плана типа 2k-p должно иметься р генераторов.
Допустим, что нужно получить линейное приближение
26
некоторого небольшого участка поверхности отклика при трех
независимых переменных. Для решения этой задачи можно
ограничиться четырьмя опытами, если в планировании для ПФЭ
типа 22 произведение x1x2 обозначить третьим фактором x3. Будет
получена матрица планирования, представленная в табл. 3.1.
Таблица 3.1
Матрица планирования
№
x0
x1
x2
x3=x1x2
Кодовое
Y
опыта
обозначение
1
1
-1
-1
1
(1)
y1
2
1
1
-1
-1
a
y2
3
1
-1
1
-1
b
y3
4
1
1
1
1
ab
y4
Функция отклика имеет вид
3
   0    i xi .
(3.1)
i 1
Эффекты парных и тройного взаимодействия равны нулю, а
это позволяет уменьшить число опытов вдвое по сравнению с
ПФЭ 23 (N=8) в случае, если бы эти эффекты были бы отличны
от нуля.
Матрица плана в этом случае имеет вид
x1
x2
x3
  y1 ;
-1 -1
1
  y2 ;
1 -1 -1
D3 -1 
  y3 ;
-1
1 -1
1
1
1
  y4 .
Матрица D3-1 получена из матрицы D3 ПФЭ 23 путем
вычеркивания строк (1, -1, 1), (-1, 1, 1), (-1, -1, -1), (1, 1, -1).
Построенный ДФЭ представляет собой полуреплику (1/2
реплику) от ПФЭ 23. Матрица D3-1 обладает, как и матрица D3,
свойствами
симметрии,
нормирования
и
попарной
ортогональности:
4
x
u 1
iu
 0,
4
x
u 1
2
iu
 4 , i  1,3,
4
x
u 1
iu
x j u  0 , i, j  1,3, i  j .
27
Таким образом, для построения полуреплики 23-1 взяты не
произвольные точки плана 23. Переменная х3 в точках плана
удовлетворяет соотношению х3=x1x2, которое называется
генерирующим. Еще одна полуреплика может быть построена,
если взять генерирующее соотношение х3=-х1x2. Чтобы
построить матрицу D2-1, следует сформировать матрицу D2 ПФЭ
22, а затем с помощью генерирующего соотношения построить
вектор-столбец Х3.
Матрица Х будет ортогонального планирования
x0
x1
x2
x3
X
1
1
1
1
-1
1
-1
1
-1
-1
1
1
1
-1
-1
1
 ( x j u ).
.
МНК - оценки неизвестных параметров j функции (3.1)
определяются
4
̂ j  1 / 4  X i u Yu ,
j  0,3 .
u 1
Оценки {j} некоррелированы и их дисперсия равна
D{  j }   2 / 4 , j  0,3 .
Для построения дробного факторного плана при N=4 исходим
из полного факторного плана 23 для факторов х1, х2 и х3 и
дополняем его столбцами, образованными произведениями
столбцов плана 23 х1х2, х1х3, х2х3, х1х2х3. Эти произведения могут
использоваться в качестве генераторов для дробных планов.
Используя один из четырех возможных генераторов, можно
построить четыре различных дробных плана типа 24-1:
x4=x1x2, x4=-x1x2; x4=x1x3, x4=-x1x3; x4=x2x3, x4=-x2x3;
x4=x1x2x3, x4=-x1x2x3.
По сравнению с 24=16 опытами полного факторного
эксперимента полученный дробный план состоит из 24–1=8
опытов.
Функции отклика (2.3) ПФЭ 23 соответствует матрица
независимых переменных
28
1 -1 -1 -1 1 1
1 1 -1 -1 -1 -1
X3 
1 -1
1 1
1 -1
1 1
1 -1 -1 1 -1 1
1 -1 1 -1 -1 -1
1 -1 -1
1 1 -1
1 1 -1 -1 1
1 -1 1 -1 -1
1 -1
1 1
1 -1 -1
1 1 1
1
1
1 -1
1 1

 

матрица плана ПФЭ 2 3
Матрица ДФЭ 24–1 с генерирующим соотношением x4=x1x2
будет иметь вид
x1 x2 x3 x4
-1 -1 -1
1
1 -1 -1 -1
-1
1 -1 -1
1
1 -1
1
D4 -1 
-1 -1
1
1
1 -1
1 -1
-1
1
1 -1
1
1
1
1
Множество
D4–1
обладает
свойствами
симметрии,
нормирования и попарной ортогональности, поэтому оценки
функции отклика
4
   0    i xi
i 1
имеют единственные решения
8
 j  0 ,125 x j u y u , j  0,4.
u 1
Множество всех генерирующих соотношений для полуреплик
k-1
2 совпадает со множеством всех взаимодействий до (k - 2)-го
29
порядка включительно, взятых со знаком плюс и минус. Число
различных полуреплик 2k-1 определится формулой v=2(2k-1 - k).
Наряду с дробным факторным планом 2k-1 в исследованиях
могут быть использованы также дробные факторные планы 2k-g.
Дробный факторный план 2k-2 называется четверть-репликой от
ПФЭ 2k. Для построения четверть-реплики ПФЭ 2k используются
два генерирующих соотношения.
Рассмотрим построение четверть-реплики 25-2. Матрица плана
D5-2 четверть-реплики строится исходя из матрицы плана ПФЭ 23
с
применением
двух
генерирующих
соотношений,
определяющих переменные x4 и x5.
Для построения дробной реплики 25-2 может быть
использовано 24 варианта генерирующих соотношений:
1) x4 = x1x2, x5 = x1x2 x3;
2) x4 = x1x2, x5 = - x1x2 x3;
3) x4 = - x1x2, x5 = x1x2 x3;
4) x4 = - x1x2, x5 = - x1x2 x3;
5) x4 = x1x3, x5 = x1x2 x3;
6) x4 = x1x3, x5 = - x1x2 x3;
7) x4 = - x1x3, x5 = x1x2 x3;
8) x4 = - x1x3, x5 = - x1x2 x3;
9) x4 = x2x3, x5 = x1x2 x3;
10) x4 = x2x3, x5 = - x1x2 x3; и т. д.
Общее число взаимодействий до (k-3)-го порядка
включительно определится =2k-3(k - 1), а число всех дробных
реплик 2k-2 равно   4C 2k -3 .
Воспользуемся генерирующими отношениями x4=x1x2,
x5=x1x2x3, построим матрицу дробного факторного плана 25-2
D5 - 2
x1
x2
x3
-1
1
-1
1

-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
x4
1
-1
-1
1
1
-1
-1
1
x5
-1
1
1
1
1
-1
-1
1


Матрица плана ПФЭ 2
  y1
  y2
  y3
  y4
  y5
  y6
  y7
  y8
30
Примем, что функция отклика имеет вид
5
   0    i xi ,
i 1
матрица независимых переменных
X  (X j u ), j  0,5 , u  1,8
является матрицей ортогонального планирования. Оценки
неизвестных коэффициентов функции отклика определятся
8
 j  0 ,125 x j u y u , j  0,4 .
u 1
Очевидно, что по сравнению с ПФЭ 25 в ДФЭ 25-2 число
опытов уменьшено в четыре раза.
Методом математической индукции можно определить, что
число дробных реплик 2k-g равно
  4C 2k ( q 1 ) ,
где k-(g-1)  число всех взаимодействий до [k - (g+1)]-гo порядка
включительно, причем k-(g-1)=2k-g - [k - (g - 1)].
3.2. Выбор дробных реплик
При выборе функций отклика предполагалось, что известные
коэффициенты при взаимодействиях факторов равны нулю, что
далеко не всегда соответствует реальным ситуациям. Если
применять регулярные реплики, то в этом случае возможны
события, когда число неизвестных параметров функции отклика
будет больше числа опытов {Yu}.
В этом случае допускается оценивание коэффициентов при
линейных членах, смешанных со взаимодействиями высших
порядков. Может быть смешанной часть оценок при парных
взаимодействиях.
Рассмотрим пример использования реплик для случая, когда
число неизвестных параметров функции отклика больше числа
опытов.
Пусть функция отклика имеет вид
= 0 + 1x1 +2x2 + 3x3 + 12x1x2 +13x1x3 + 23x2x3.
(3.2)
Имеется дробный факторный план D, задаваемый
генерирующим соотношением х3=х1х2:
31
D3 -1
x1
x2
x3
-1
1

-1
1
-1
-1
1
1
1
-1
-1
1
  y1
  y2 .
  y3
  y4
Число неизвестных коэффициентов в функции отклика p+1=7,
число наблюдений N0=4, N0<p+1.
Составим матрицу независимых переменных
x0 x1 x 2 x 3 x1 x 2 x1 x 3 x 2 x
3
1 -1 -1 1
1
-1
-1
1 1 -1 -1 -1
-1
1
X  1 -1 1 -1 -1
1
- 1  ( X j u ).
1
1
11
1
1 

1
xˆ
x4
Информационная матрица S=XTX будет вырожденной, так как
она матрица порядка 7×7, а rankS=4. Следовательно, уравнение
для определения оценок параметров функции отклика (1.7) будет
иметь бесконечное множество решений.
Для рассмотренного примера модель наблюдений M{Y}=X,
D{Y}=21In0 является моделью наблюдений неполного ранга,
поскольку rankX=N0<p+14. Здесь 2  неизвестный параметр,
In0  единичная матрица порядка N0.
Для получения решений сводят задачу исследований модели
наблюдений неполного ранга к задаче исследования модели
наблюдений полного ранга M{Y}=X0r, D{Y}=21In, где X0=(Xij),
r
0
r
T
i  1, n , j  1, r  матрица порядка r;  = +A*,  =(1,2,…,r)
 вектор неизвестных параметров;
A=(X0TX)-1X0TX*,0=(1,2,…,r)T, *=(r+1,r+2,…,p)T, X=(X0,X*).
Свести модель наблюдений неполного ранга к модели
наблюдений полного ранга можно, если допустить смешивание
неизвестных параметров векторов 0 и *.
Как видно из матриц D3-1 и X, в точках плана, в которых
32
выполняются наблюдения {Yu}, имеют место следующие
равенства:
x1=x2x3, x2=x1x3, x3=x1x2.
Функцию отклика (3.2) запишем в виде
5
   0    i xi ,
(3.3)
i 1
r
2= 2+ 13,
r0=0, r1=1+23, 
 
r3=3+12.
Эта функция отклика будет определена в точках плана D3-1, а
матрица X0 будет иметь вид
x0 x1 x 2 x 3
1 -1 -1
1
1
1 -1 -1
X0 
 ( X 0j u )
1 -1
1 -1
1
1
1
1
Функция отклика (3.3) соответствует модели наблюдений
полного ранга, которая называется приведенной моделью
M{Y}=X0r,
D{Y}=2I4, rankX0=rankX=4.
0
Матрица X является матрицей ортогонального планирования,
следовательно, существуют однозначные оценки вектора r
r=(X0TX0)-1X0TY=(X0TY)/N,
или для каждой j-й компоненты
N0
4
u 1
u 1
 jr  (  x 0j u yu ) / N 0  0 ,25 x 0j u yu , j  0,3 .
Отметим, что
x1 x 2
1
-1
X* 
-1
1
x1 x 3
x2 x3
-1
-1
1
1
-1
1
-1
1
.
Определено, что r=0+A*, причем  r  (  0r ,  1r ,  2r ,  3r )T ,
 0  (  0 ,  1 ,  2 ,  3 )T ,   (  12 ,  13 ,  23 ) , а матрицу
находим из уравнения A=(X0TX)-1X0TX* и она имеет вид
*
T
A
33
0
0
0
0 0 1
.
0 1 0
1 0 0
Если решить при этих условиях уравнение r=0+A*, то
получим систему параметрических функций
 r0=0,  r1=1 + 23,  r2= 2 +13,  r3=3 + 12.
Для получения правила смешивания, с помощью которого
можно было определить, совокупность каких линейных
эффектов и эффектов взаимодействия оценивается, введено
понятие контраста плана или определяющего контраста. Правила
смешивания
с
помощью
определяющего
контраста
отображаются в системе линейно независимых параметрических
функций, допускающих посмещенное оценивание.
Определяющим контрастом полуреплики 2k-1 называют ее
генерирующее соотношение, умноженное на свою левую часть
[2].
Если генерирующее соотношение полуреплик 2k-1 задано
соотношением x k  xi1 xi2 xi3 . . . xim , где 1i1<i2<…<imk - 1,
A
1<m<k - 2, то, умножив его на xk, получим xk2  xi1 xi2 . . . xim xk .
Так как xk[-1,+1], то определяющий контраст имеет вид
1  xi1 xi2 . . . xim x k .
Умножая данные уравнения последовательно на переменные
xi , ( i  1,k ) , получим систему равенств, на базе которой
составляется система параметрических функций.
Например, для дробной реплики 23-1, задаваемой
генерирующим соотношением х3=х1х2, определяющий контраст
имеет вид 1=x1x2x3.
Умножим его на переменные х1, х2 и х3 и получим систему
равенств:
2
2
x1  x12 x 2 x3  x 2 x3 , x 2  x1 x 2 x3  x1 x3 , x3  x1 x 2 x3  x1 x 2 .
Эта система равенств устанавливает соответствие для
составления системы параметрических функций
34
r1=1 + 23 <===> x1=x2x3;
r2= 2 +13 <===> x2=x1x3;
r3=3 + 12 <===> x3=x1x2.
Но данный подход не позволяет получить несмещенные
(раздельные) оценки параметров 1, 2, 3. Чтобы решить эту
задачу, достаточно построить еще полуреплику 23-1, которая
будет задаваться генерирующим соотношением х2= - х1х3.
Система равенств, отображающих смешивание, будет иметь вид
x1= - x2x3; x2= - x1x3; x3= - x1x2.
Следовательно,
возможно
МНК-оценка
следующих
неизвестных коэффициентов:
 r*1=1+23,  r*2=2+13,  r*3=3+12.
На основе оценок полуреплик 23-1 (х4=х1x3) и 23-1 (х4= - х1x3)
находим несмещенные оценки
 i  0 ,5(  i   ir* ), i  1,3 .
Рассмотрим аналогичную задачу нахождения смещенных
оценок для полуреплики 24-1.
Пусть функция отклика имеет вид
   0    i xi    i j xi x j 


1i  4
i jl
1i  j l  4
1i  j  4
x i x j x l   1 2 3 4 x1 x 2 x 3 x 4 .
Матрица плана ДФЭ 24-1 построена с использованием
генерирующего соотношения х4=х1х2. Определяющий контраст
имеет вид
1=x1x2x4.
Умножим его последовательно на переменные х1, х2, х3, х4.
Получим следующую систему равенств:
1=x1x2x4; x1=x2x4; x2=x1x4; x3=x1x2x3x4; x4=x1x2; x1x3=x2x3x4;
x2x3=x1x3x4; x3x4=x1x2x3.
Исходя из этой системы равенств, построим систему
параметрических
функций,
допускающих
несмещенное
оценивание параметров функции отклика:
 r0=0 +124,  r1=1 + 12,  r2= 2 +14,  r3=3 + 1234.
 r4=4 + 12,  r5= 13 +234,  r6=23 + 134,  r7=34 + 123.
Если для оценивания параметров функции отклика
35
применяется (1/4)-реплика или реплики более высокой
дробности, то система смешивания линейных эффектов и
эффектов взаимодействий между собой будет более сложной,
поскольку для задания (1/g)-реплик (g>2) необходимо не менее
двух генерирующих соотношений.
Пусть четверть-реплика 25-2 задается генерирующими
соотношениями x4=x1x2 и x5=x1x2x3. Умножив их на x4 и x5
соответственно, получим определяющие контрасты
1=x1x2x4; 1=x1x2x3x5.
Если их перемножим, то получим еще один определяющий
контраст
1=x3x4x5.
Затем получаем обобщенный определяющий контраст
1=x1x2x4=x1x2x3x5=x3x4x5.
Для получения системы равенств, отображающих систему
смешивания независимых переменных и взаимодействий,
следует умножать отображенный определяющий контраст
последовательно на независимые переменные x1, x2, x3, x4, x5.
Система уравнений будет иметь следующий вид:
x1=x2x4=x2x3x5=x1x3x4x5;
x2=x1x4=x1x3x5=x2x3x4x5;
x3=x1x2x3x4=x1x2x5=x4x5;
x4=x1x2=x1x2x3x4x5=x3x5;
x5=x1x2x4x5=x1x2x3=x3x4;
x1x3=x2x4x3=x2x5=x1x4x5;
x1x5=x2x4x5=x2x3=x1x3x4.
С учетом обобщенного определяющего контраста получено
восемь равенств, которые однозначно определяют систему
параметрических функций смешивания эффектов:
 r0=0+ 124 + 335 + 1235;
 r1=1 + 24 + 235 + 1345;
r
 2=2+ 14 + 135 + 2345;
 r3=3 + 45 + 125 + 1234;
 r4=4+ 12 + 35 + 12345;
 r5=5 + 34 + 123 + 1245;
r
 6=13+ 25 + 145 + 234;
 r7=15 + 13 + 134 + 245.
Получен вектор  r  (  1r ,  2r ,... 7r ) , оценивание которого
возможно по данным вектора наблюдений Y=(y1,y2,…,y8)T и
данным матрицы X0
36
1 -1 -1 -1 1 1
1 1 -1 -1 -1 -1
X0 
1 -1
1 1
1 -1
1 1
1 -1 -1 1 -1 -1
1 -1 1 -1 -1 1
1 -1 -1
1 1 -1
1 1 -1 -1 -1
1 -1 1 -1 -1
1 -1
1 1
1 -1 -1
1 1 1
1
1
1
1
,
1
1
которая является матрицей ортогонального планирования и ее
rankX0=8.
Проблема выбора дробных планов является основной при
планировании факторных экспериментов. Ее решение
направлено на нахождение таких дробных реплик 2k-g, которые
бы позволили получить несмещенные МНК-оценки для всех
неизвестных
параметров
функции
отклика.
Отметим
особенности применения дробных реплик:
- число опытов N0<p+1 - числа неизвестных параметров
модели;
- модель наблюдений является моделью неполного ранга,
равного N0;
- матрица независимых переменных приведенной модели
полного ранга является матрицей ортогонального планирования;
- система параметрических функций, допускающих оценку,
выводится из определяющих контрастов.
Контрольные задания
1. Что представляет собой понятие генератора плана?
2. Каким образом может быть получена матрица дробного
факторного эксперимента 23-1?
3. Приведите вид функции отклика дробного факторного
эксперимента 23-1.
4. Приведите формулу для получения МНК - оценок
неизвестных параметров функции дробного факторного
эксперимента 23-1.
37
5. Каким образом может быть получена матрица дробного
факторного эксперимента 24-1?
6. Приведите вид функции отклика дробного факторного
эксперимента 24-1.
7. Приведите формулу для получения МНК - оценок
неизвестных параметров функции дробного факторного
эксперимента 27-1.
8. Какие
генерирующие
соотношения
могут
быть
использованы для построения дробной реплики 25-2.
9. Приведите вид матрицы дробного факторного плана
эксперимента 25-2 при применении генерирующего соотношения
x4=x1x2.
10. Приведите вид функции отклика дробного факторного
эксперимента 25-2 и формулу для оценки неизвестных
коэффициентов функции отклика.
11. Приведите пример использования реплик для случая,
когда число неизвестных параметров функции отклика больше
числа опытов.
12. Что такое «определяющий контраст»? Какой смысл
заключен в этом понятии?
38
4. ПОИСК ЭКСТРЕМУМА ФУНКЦИИ ОТКЛИКА
4.1. Определение стратегии поиска
Если линейная модель наблюдений описывает некоторые
процессы, то ставится задача нахождения набора входных
параметров, при которых выходной параметр будет
экстремальным либо будет находиться в определенной области
значений.
Например,
линейная
модель
описывает
технологический процесс и необходимо определить набор
условий (входных факторов), при которых производительность
процесса будет максимальной, либо набор условий, при которых
выход бракованных изделий сведен к минимуму. Формально
задача сводится к отысканию вектора Х=(х1,x2,...,хk)G при
условии
M{y/x 1 , x 2 , . . . , x k }  max f(x1 , x 2 , . . . , x k ).
xG
Для нахождения экстремума функции отклика необходимо
исследовать поверхность отклика посредством проведения
изменений поверхности в различных точках факторного
пространства.
Стратегия поиска состоит в том, чтобы число измерений
(опытов) было сведено к минимальному значению, так кака
каждый опыт - это эксперимент на функционирующем объекте.
Наибольшее распространение получили градиентные методы
поиска экстремума, при которых движение по поверхности
отклика происходит в направлении оценки градиента. Оценка
градиента gradf(x1,x2,...,xk) в точке (x1,x2,...,xk) происходит по
результатам измерений, проводимым в окрестностях этой точки
в факторном пространстве.
Бокс
и
Уильсон
[3]
предложили
использовать
последовательный «шаговый» метод изучения поверхности
отклика. При этом ставится небольшая серия опытов для
локального описания поверхности отклика полиномом первой
степени. Далее движение осуществляется по поверхности
отклика в направлении градиента линейного приближения. Если
39
одного линейного приближения достаточно, то ставится новая
небольшая серия опытов и находится новое направление
движения по поверхности отклика.
Такой процесс движения продолжается, пока исследователь
не попадет в почти стационарную область, где линейное
приближение оказывается недостаточным. В этой области
ставится большая серия опытов и поверхность отклика
описывается полиномом второго и третьего порядка.
Метод Бокса и Уильсона состоит в повторении процедуры:
- построение факторного эксперимента в окрестности
некоторой точки;
- вычисление оценки градиента в этой точке по результатам
эксперимента;
- крутое восхождение в направлении оценки градиента;
- нахождение оценки экстремального значения функции
отклика по этому направлению.
4.2. Метод крутого восхождения
Метод крутого восхождения предполагает, что функция
отклика =f(x1,x2,...,xk) непрерывна, имеет непрерывные частные
производные первого порядка на множестве GR - k-мерному
евклидову пространству и унимодальна, т.е. в области G имеет
единственный экстремум.
Основу метода отыскания экстремума функции =f(x1,x2,...,xk)
составляет метод подъема (или спуска) по поверхности функции
. При этом находится последовательность точек X0,X1,...,Хm в
области
G,
таких,
что
f(X0)>f(X1)>...>f(Xm)>...
(или
0
1
m
f(X )<f(X )<...<f(X )<... ).
Градиентным называется метод, согласно которому точка
m+1
Х выбирается из условия [13] Хm+1=Хm+gradf(Хm), где
  f  f
 f 
- grad f(X )   f(X )    m , m , . . . , m   вектор x k 
  x1  x 2
T
m
m
градиент функции f(x1,x2,...,хk) в точке X m 1  (x 1m , x 2m , . . . , x km ) ;
-   некоторая скалярная величина, >0.
40
Различие градиентных методов состоит в разных методиках
выбора величин .
Рассмотрим суть крутого восхождения (спуска), иллюстрация
которого приведена на рис. 4.1. На этом рисунке при К=2,
задавая различные значения С из уравнения f(x1,x2)=C, получены
совокупности линий уровня.
x2
X3
X1
X2
x1
X0
Рис. 4.1
Пусть X0  начальная точка при поиске максимума функции
отклика =f(x1,x2,...,хk). Вектор-градиент  в точке Х0
определится
T
 f  f
f 
grad f(x , x , . . . , x )   0 , 0 , . . . , 0  ,
 xk 
  x1  x 2
0
0
0
 f(x1 , x 2 , . . . , x k )
f
где

, i  1, k .
0
 xi
xi0
При условии, что все частные производные не равны нулю
(точка X не является стационарной), направление векторградиента в этой точке будет направлением наибыстрейшего
возрастания функции.
Затем делается шаг в направлении градиента с целью поиска
точки X1, в которой значение функции будет наибольшим.
0
1
0
2
0
k
41
Новая точка X1 определяется из решения уравнения при
предположении, что функция унимодальна в направлении
градиента
 f
X 1  X 0   0 grad f(X 0 ), xi1  xi   0
, i  1, k .
 xi0
В точке X1 функция f(X1) будет максимальна в направлении
градиента из точки Х0, т. е.
f (x11 , x 21 , . . . , x k1 )  f (x10 (  0 ), x 20 (  0 ), . . . , x k0 (  0 )) 
 max f (x10 (  ), x20 (  ), . . . , xk0 (  )) .

Затем вычисляется grad f(X1) и делается шаг в его
направлении по поверхности f(X) с целью поиска точки X2 и т. д.
В общем случае при наискорейшем подъеме координаты
очередной точки Xm+1 находят при решении уравнений
f (x1m 1 , x 2m 1 , . . . , x km 1 )  f (x1m (  m ), x 2m (  m ), . . . , x km (  m )) 
 max f (x1m (  ), x2m (  ), . . . , xkm (  )),

 f
.
 xi0
В векторной форме Хm+1=Хm+mgradf(Хm).
Так как f(Xm+1)>f(Xm), то последовательность {Хm} сходится к
точке максимума функции отклика.
Параметр m (m=1,2,…) находится из решения одномерной
задачи максимизации [2]
max f [X m  grad f(X m ) ],   0 .
причем xim 1 (  )  xim (  m )  xim   m

4.3. Метод Бокса и Уильсона
Выше было отмечено, что движение по поверхности отклика
осуществляется в направлении оценки градиента функции
отклика. Рассмотрим нахождение оценки градиента.
Пусть в области определения GR задана функция отклика
=f(x1,x2,...,xk).
Пусть X0 (см. рис. 4.1)  произвольно выбранная начальная
точка. Используя ее как центр плана, построим ПФЭ или ДФЭ в
42
окрестностях этой точки X 0  (x 10 , x 20 , . . . , x k0 ) . Как показано на
рис. 4.2, для примера введем кодированные переменные
x i  ( xi - xi0 ) / S i0 , i  1, k , через которые выразим функцию
отклика =f(x1,x2,...,xk).
x2
X1
X0
x1
Рис. 4.2
Как видно из рис. 4.2, переход к кодированным переменным
означает перенос начала координат и растяжение (сжатие) по
координатным осям функции отклика.
Разложим функцию  в точке ( x10 , x 20 , . . . , x k0 ) в ряд Тейлора:
k
η  f(x1 , x2 ,..., xk )  f(x , x ,..., x )  
0
1
k
0
k
i 1
f
xi 
xi0
 f
xi x j  0( x - x 0 ), lim0 0( x - x 0 )  0 .
0
0
x x
j 1 xi x j
k
 0,5
i 1
0
2
2
Введем обозначения
 0  f ( x10 , x 20 , . . . , x k0 ) ;  i0 
 i0i 
 f
;
 xi0
2 f
2 f ; 0


.
ij
(  x i0 ) 2
 xi0  x 0j
После этого функция отклика примет вид
43
f ( x )     00 
β
1i  k
0
i
xi 
β
1i  j  k
0
i j
xi x j 
β
1i  k
0
ii
(x i ) 2 .
Так как градиент функции отклика gradf(x0)=(1,2,...,k), то
оценивание градиента сводится к нахождению МНК-оценок
неизвестных параметров 1,2,...,k.
Для простоты предполагают, что функция отклика достаточно
точно аппроксимируется гиперплоскостью
k
   00    i0 xi .
i 1
Тогда при выбранном плане D  (X i u ), i  1, k , u  1, N , МНКоценки определяются
N
ˆ 0j  1 / N  X j u Yu , j  0, k .
u 1
Таким образом, найдена оценка градиента функций отклика 
в точке x 0 :
ˆ f( x 0 )  ( ˆ , ˆ , . . . , ˆ )T .
grâd f (x10 , x20 , . . . , xk0 )  
1
2
k
Метод Бокса и Уильсона позволяет отыскивать максимум
функции
отклика
при
предположении
ее
строгой
унимодальности в области определения G.
После того, как была выбрана начальная точка, введено
кодирование переменных и осуществлена оценка градиента
функции  в точке ( x10 , x 20 , . . . , x k0 ) , для поиска максимума
делается шаг из точки X0 в направлении grâd f( x 0 )
X 01  X 0   01 grad f(X 0 )   01  0 ,
где  01  0 - параметр шага,   (  10 ,  20 , . . . ,  k0 )T ,
X 1  ( x110 , x 210 , . . . , x k10 )T .
Каждая компонента точки X1 находится из формулы
xi10   01  i0 , i  1, k.
От кодированных переменных осуществляется переход к
натуральным переменным, причем координаты точки X 01
определяются
44
xi10  xi0  xi10 S 01 .
Затем в точке X 01 производится ряд измерений функции  и
по наблюдениям (измерениям) y 110 , y 210 , . . . , y k10 находится оценка
N
  1 / N  y u1 0 .
u 1
Если    - значения функции отклика в точке X, то
делается еще шаг в направлении градиента. Для некоторого l-го
шага координаты точки Xl определяются xi10   01  0 .
1
0
Определяется оценка функции отклика в точке X 01
N
 0l  1 / N  y ul 0 ,
u 1
l0
u
N
1
где {y } - множество выполненных наблюдений функции
отклика в точке X1.
Если X1 будет первой точкой, для которой  0l   0l -1 , то
считаем, что максимум функции отклика в направлении оценки
градиента из точки X0 будет в найденной точке X 0l -1 . На этом
оканчивается первый цикл поиска.
Как показано на рис 4.2, этой точкой будет X 02 .
Найденная точка X 01 из кодированной пересчитывается в
натуральную X1 с координатами
xil  xi0  xi(l -1)0 Si0 , i  1, k .
Для точки X1 повторяем заново рассмотренные выше
процедуры оценки градиента gradf(X1) и поиска максимального
значения  в направлении оценки градиента. На каждом цикле
поиска вычисляется функция отклика f(X0), f(X1), f(X2) и т. д.
Исходя из выбранной погрешности E, поиск осуществляется
до тех пор, пока на некотором f-м цикле не будет выполнено
условие
f(Xf) - f(Xf-1)<E.
В этом случае точка Xf=(xf1,xf2,…,xfk) считается точкой, в
которой функция отклика достигает максимума.
45
Пример. Пусть функция отклика имеет вид =f(x1,x2) и
является функцией кодированных переменных.
Матрица плана и результаты наблюдений представлены в
виде следующих данных:
x
x
1
2
- 1  1  y1  124;
 y 2  116 ;
D  1 1
- 1 1  y 3  102;
1 1  y 4  98.
Используя результаты наблюдений и аппроксимацию
функции  в области T={(x1,x2)T; -1xi1}, заданную в виде
0+1x1+2x2+12x1x2,
необходимо найти оценку градиента в центре плана, т.е. в точке
( x10 , x20 )T , где x10 , x 20  0 .
Очевидно, что
f f
gradf 1 ( x10 , x 20 )  ( 10 , 10 )T  (  1 ,  2 )T .
x1 x 2
Так как матрица независимых переменных имеет вид
1 1 1
X 
1
1 1 1 1
1 1 1 1
1 1
1
1
и является матрицей ортогонального планирования, то в
результате вычислений получим


 1 =(-y1+y2 - y3+y4)/4= -3;  1 =(-y1-y2+y3+y4)/4= -10.
Отсюда МНК-оценки градиента в точке ( x10 , x20 )T имеют вид
 
gradf 1 ( x10 , x 20 )  (  1 ,  2 )T  ( 3,10 )T .
4.4. Пример расчета крутого восхождения
Предположим, что в результате проведения полного
факторного эксперимента типа 22 получены следующие
результаты наблюдений yu:
46
первая серия: y1=95,6; y2=90,6; y3=84,3; y4=83;
вторая серия: y1=94,4; y2=89,4; y3=85,7; y4=81.
В табл. 4.1 приведено среднее значение y*.
Таблица 4.1
№ опыта
x0
x1
x2
y*
1
+1
-1
-1
95,0
2
+1
+1
-1
90,0
3
+1
-1
+1
85,0
4
+1
+1
+1
82,0
Для вычисления коэффициентов регрессии определим
следующие матрицы:
1 -1 -1
1 1 -1
X
1 -1 1
1 1 1
95,0
b0
90,0
; Y 
; B  b1 .
85,03
b2
82,0
Определим матрицу системы нормальных уравнений и
определим оценки коэффициентов:
1 -1 -1
1 1 1 1
400
1 1 -1
T
X X  -1 1 -1 1
 040 ,
1 -1 1
-1 -1 1 1
004
1 1 1
95
1 1 1 1
T
X Y  -1 1 -1 1
-1 -1 1 1
1/4 0
B  (X X) X Y 
T
-1
T
352
90
 -8 ,
85
- 18
82
0
0 1/4 0
0 0 1/4
352
88
-8  -2 .
- 18
- 4,5
Следовательно,
y=88–2x1–4,5x2 .
Область определения факторов задана табл. 4.2.
(4.1)
47
Уровень
Основной уровень
Интервал варьирования
Верхний уровень
Нижний уровень
x1
1,5
0,5
2,0
10
Таблица 4.2
x2
7,0
1,0
8,0
6,0
Для проверки гипотезы адекватности выбранной модели
используем F-критерий
F
где:
2
S ag
S2 y
,
2
- дисперсия адекватности [5, 6];
S ag
S 2 y - дисперсия воспроизводимости;
n
2
S ag

 (y
i 1
i
- y i* )
, f=N-(k+1)=4-(2-1)=1 - число степеней
f
свободы.
n
Для
расчета
 (y
i 1
i
- y i* )
составим
табл. 4.3
расчета
остаточной суммы квадратов.
№ опыта
1
2
3
4
x0
1
1
1
1
x1
-1
1
-1
1
x2
-1
-1
1
1
y
95
90
85
82
yi
94,5
90,5
85,5
81,5
Таблица 4.3
yi-y*
y-y*
-0,5
0,25
0,5
0,25
0,5
0,25
-0,5
0,25
Для вычисления дисперсии воспроизводимости составим
расчетную табл. 4.4.
Следовательно, [5, 6]:
N
S 2{ y } 
2 (y i g - y i* )
i 1
N

2 ,21  2
 1,105 .
4
48
№ опыта
1
2
3
4
y’
y’’
95,6
90,6
84,3
83
y
94,4
89,4
85,7
81
95
90
85
82
y
’
0,6
0,6
0,7
1,0
y
Таблица 4.4
’’
0,36
0,36
0,49
1,0
N
(y
i
)*
2,21
Вычислим значение F-критерия [5, 6]:
F
S a2 g
S
2
âîñï

1
 0 ,9 .
1,105
Табличное значение критерия Фишера для числа степеней
свободы 1, 4 и 5-го уровня значимости равно 7,7. Поэтому
гипотеза адекватности линейной модели может быть принята как
справедливая.
Проверку значимости величины дисперсии вычислим по
формуле [14, с.207]
2
S âîñï
1,105

 0 ,137 .
Nn
8
Определим доверительный интервал: bj=tS{bj}= -t S{bj}, где
S 2 {b j } 
t - табличное значение критерия Стьюдента [5, 6] при числе
степеней свободы, с которыми определялась S2{y}, и выбранном
уровне значимости (0,05). При f=N=4 имеем bj=2,7760,37=1,03.
Отсюда видно, что вычисленные коэффициенты значимости,
т.е. их абсолютные значения, больше доверительного интервала
[5, 6].
Рассмотрим этапы расчета крутого восхождения. Результаты
расчетов будем фиксировать в табл. 4.5.
1. Определим
составляющие
градиента.
Для
шага
варьирования 0,5 и 1,0 имеем
b1x1= -20,5= -1; b2x2= -4,51,0= -4,5.
Прибавим составляющие градиента к основному уровню
факторов
x1=1,5 - 1,0=0,5.
49
Основной уровень
Интервал варьирования
Верхний уровень
Нижний уровень
Кодированные значения переменных
Опыты:
1
2
3
4
bj
bj, умноженное на интервал
варьирования
Шаг при изменении x2 на 0,5
Округление
Опыты в направлении крутого
восхождения
5
6
7
8
9
x1
1,5
0,5
2,0
1,0
x1
Таблица 4.5
x2
y*
7,0
1,0
8,0
6,0
x2
-1
-1
-1
-1
-2,0
-1,0
-0,11
-0,1
-1
-1
-1
-1
-4,5
-4,5
-0,5
-0,5
x1*
x *2
1,4
1,3
1,2
1,1
1,0
6,5
6,0
5,5
5,0
4,5
95,0
90,0
85,0
82,0
Опыт 5
x2=7,0 - 4,5=2,5, x1=0,5 - 1,0=-0,5.
Опыт 6
x2=2,5 - 4,5=-2,0.
Условия опыта 6 не реальны, так как значения xj при этом
выходят за границы допуска. Следовательно, шаг движения
велик.
2. Воспользуемся условием: умножение составляющих
градиента на любое положительное число дает точки, лежащие
на градиенте.
В данной задаче удобно изменить х2 на 0,5, т.е. уменьшить
составляющую градиента в 9 раз. Во столько же раз уменьшается
50
и составляющая градиента по первому фактору (- 0,11).
Изменению составляющих градиента соответствует в табл. 6.8
строка «Шаг при изменении х2 на 0,5». Округлим шаг до 0,1.
3. Осуществим последовательное прибавление составляющих
градиента к основному уровню. Получим серию опытов 5 - 9
крутого восхождения. Эти опыты часто называют мысленными.
Иногда имеет смысл оценить ожидаемые значения
параметров оптимизации в мысленных опытах.
Проведем расчет для опытов 7 и 8 крутого восхождения. Для
оценки параметра оптимизации использовано уравнение
регрессии (4.1). Однако в табл. 4.5 приведены натуральные
значения факторов, а в уравнении применяются кодированные
значения. Поэтому необходимо натуральные значения перевести
в кодированные по формуле
x
x j - x j0
Jj
,
(4.2)
где xj - кодированное значение фактора; xj - натуральное
значение фактора; xj0 - натуральное значение основного уровня;
Jj - интервал варьирования; j - номер фактора.
Согласно (4.2) для опытов 7 и 8 соответственно вычислим
x1= -0,6; x2= -1,5;
x1= -0,8; x2= -2,0.
Подставляя эти значения в уравнение регрессии (4.1),
получаем y7=95,95; y8=98,6, где yj - значение зависимой
переменной, предсказанное с помощью уравнения регрессии.
Все выполненные расчеты по данному примеру сведены
в табл. 4.5. Здесь x* - факторы в натуральных единицах; y* среднее значение из двух параллельных опытов.
Контрольные задания
1. В чем состоит стратегии поиска экстремума функции
отклика?
2. Что представляет собой градиент многомерной функции?
51
3. В чем состоит суть «шагового» метода изучения
поверхности отклика?
4. Какие процедуры составляют метод Бокса и Уильсона?
5. Определите понятие «унимодальность функции».
6. Приведите разложение функции в ряд Тейлора.
7. Приведите графическую иллюстрацию метода Бокса и
Уильсона.
8. Приведите пример поиска экструмума функции отклика с
применением полного факторного эксперимента 22.
9. Приведите пример крутого восхождения при поиске
экструмума функции отклика.
52
5. ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ ДЛЯ
ЗАДАЧ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА
Для решения задачи поиска экстремума функции отклика с
применением метода крутого восхождения можно разработать
информационное обеспечение, так как процесс решения задачи
достаточно просто алгоритмизируется. Ниже приводится пример
работы с информационным обеспечением для решения этой
задачи.
Первым шагом при использовании данного информационного
обеспечения является ввод начальных данных. На рис. 5.1
приведен вид диалогового окна с формой ввода значений задачи.
Рис. 5.1
На рис. 5.1 левая таблица представляет собой набор факторов,
т.е. измеряемых переменных величин, принимающих в
конкретный момент времени определенное значение.
Правая таблица - результаты наблюдений для каждой серии
экспериментов. Ещё правее находятся пункты настройки, где
53
можно выбрать количество настраиваемых наборов факторов,
количество опытов и количество серий экспериментов.
Для примера анализа работы информационного обеспечения
взят набор факторов, показанный в табл. 5.1.
Таблица 5.1
№ опыта
x1
x2
1
-1
-1
2
+1
-1
3
-1
+1
4
+1
+1
Результаты наблюдений:
- первая серия измерений:
y1 = 95,6; y2 = 90,6; y3 = 84,3; y4 = 83;
- вторая серия:
y1 = 94,4; y2 = 89,4; y3 = 85,7; y4 = 81.
Как видим, количество опытов - 4. На рис. 5.2 представлена
форма с введенными значения опытов.
Рис. 5.2
После ввода значений осуществляется переход к диалоговому
окну, в котором вводится область определения факторов
(рис. 5.3).
54
Рис. 5.3
В этом окне вверху выводится уравнение регрессии,
соответствующее введенным ранее значениям.
Для дальнейших расчетов требуется ввести основной уровень
факторов и интервал варьирования факторов.
Основной уровень - исходная точка для построения плана
эксперимента. Построение плана эксперимента сводится к
выбору экспериментальных точек, симметричных относительно
нулевого уровня.
Интервал варьирования необходим для расчета параметров
крутого восхождения и является начальным шагом для
градиентного метода. Данные, взятые для примера, приведены в
табл. 5.2. На рис. 5.4 показано диалоговое окно ввода области
определения факторов.
Таблица 5.2
Уровень
x1
x2
Основной уровень
1,5
7,0
Интервал варьирования
0,5
1,0
После того, как все значения введены, начинается поиск
экстремума по уравнению регрессии. Окно поиска экстремума
приведено на рис. 5.5.
55
Рис. 5.4
Рис. 5.5
Пользователь при расчете каждого шага может менять
значение коэффициента шага крутого восхождения α,
возвращаться назад и производить поиск экстремума с
измененными значениями, что отображено на рис. 5.6.
56
Рис. 5.6
57
6. ОБРАБОТКА СТАТИСТИЧЕСКИХ ДАННЫХ
6.1. Сведения из теории вероятностей
В теории вероятностей существует понятие «испытание», под
которым понимается осуществление определенного комплекса
условий, который может быть воспроизведен сколь угодно
большое число раз.
Явления, происходящие при реализации этого комплекса,
называются событиями.
В результате испытаний в зависимости от случайных
обстоятельств может произойти то или иное событие из
некоторого множества.
События должны отражать качество проводимых испытаний,
т.е. обладать репрезентативностью.
Пусть проведено N опытов в одних и тех же условиях.
Событие X в серии опытов произошло nX раз. Значение
характеризует частоту появления события X.
Отношение nA/N числа появления событий X к общему числу
событий N называют частостью p*A события или относительной
частотой.
Частость p*X события X является оценкой вероятности pX
появления этого события и считают, что p  lim p*X .
N 
Случайные величины, принимающие отделенные друг от
друга значения, называют дискретными случайными величинами.
Для каждого значения Xi дискретной случайной величины
существует значение вероятности pi её появления.
Упорядоченные значения вероятностей pi называют
дискретным распределением вероятностей (или просто
распределением) случайной величины X.
Для дискретной случайной величины X определяют числовую
характеристику в виде математического ожидания, которую
обозначают символом МX. Смысл математического ожидания
иллюстрирован на рис. 6.1.
58
10/32
5/32
1/32
0
1
2
3
4
5
МX
Рис. 6.1
Точка МX рассматривается как центр группирования
случайной величины X или центр тяжести. Известно, что
абсцисса центра тяжести может быть определена путем подсчета
средней «взвешенной» абсцисс точек (1, 2, 3, 4, 5). Взвешивание
значений величины получается путем умножения каждого её
значения на его «вес». Отсюда вытекает физический смысл
формулы для определения математического ожидания МX
n
МX   xi р( xi ), xi  X .
(6.1)
i 1
Могут рассматриваться целые степени Xk случайной
величины X. В этом случае математическое ожидание МXk
называют моментом k–го порядка случайной величины X и
определяют формулой
n
МX k   ( xi )k р( xi ), xi  X .
(6.2)
i 1
Модой теоретического распределения случайной величины X
называют наиболее вероятное её значение и обозначают
символом МоX.
В
теории
вероятностей
существует
понятие
центрированной случайной величины X=X - МX, еще
называемое отклонением случайной величины X.
59
Моменты центрированной случайной величины X
называют центральными моментами случайной величины
X.
Центральный момент k–го порядка теоретического
распределения случайной величины X обозначают, как правило,
греческими буквами
n
 k [М( X  )k ]   ( xi  МX )k р( xi ), xi  X ,
(6.3)
i 1
т.е. центральный момент k–го порядка представляет среднюю
величину (математическое ожидание) k–й степени отклонения
случайной величины X от центра.
Центральный момент 2–го порядка называют дисперсией и
обозначают символам D X. Название «дисперсия» появилось по
аналогии с механикой как мера рассеивания. Дисперсию можно
истолковать как момент инерции «масс вероятностей» (рис. 6.2).
В электротехнике дисперсия имеет простой смысл: исходя из
определения мощности P=i2R (i  мгновенное значение силы
изменяющегося тока, R  сопротивление), дисперсию можно
трактовать как среднее значение мощности флуктуаций, которая
рассеивалась бы на единице сопротивления.
Согласно определению (6.3), дисперсия имеет размерность,
определяемую квадратом размерности случайной величины X.
Чтобы получить характеристику рассеивания, имеющую
размерность, одинаковую с размерности случайной величины X
и её математическим ожиданием, применяют положительный
корень квадратный из дисперсии
 X  DX .
(6.4)
квадратическим или
Величину X называют средним
стандартным отклонением.
В качестве относительной характеристики рассеивания
применяют коэффициент вариации, представляющий среднее
квадратическое отклонение в процентах к математическому
ожиданию
X 
X
МX
.
(6.5)
60
Коэффициент вариации показывает, насколько велико
рассеивание по сравнению со средним значением случайной
величины X.
На практике при обработке статистических данных ещё
применяют центральные моменты третьего и четвертого
порядков, а моменты более высоких порядков не используются.
Центральный момент третьего порядка применяют для
числового измерения асиметрии распределения, примером
которого является распределение Релея
f(x)
График распределения Релея показан на рис. 6.2.
f(t)
x
2

e
x2
2 2
.
t
Рис. 6.2
Для перехода к безразмерной характеристики центральный
момент третьего порядка делят на куб среднего квадратического
отклонения. Показатель ассиметрии в этом случае определяется
выражением
X 
3
.
3
(6.6)
В качестве характеристики большего или меньшего подъема
графика (большей или меньшей вершинности), по сравнению с
графиком нормального распределения, применяют показатель k,
определяемый формулой
k 
4
.
4
(6.7)
Случайные величины, значения которых непрерывно
заполняют некоторый отрезок, называют непрерывными
случайными величинами. Для непрерывной случайной величины
61
существует понятие «функция распределения вероятностей»,
которая обозначается F(x)=P(X<x).
Для непрерывно распределенной случайной величины X
математическое ожидание определится по формуле

MX 
 xf ( x )dx ,
(6.8)

где f(X) - функция распределения плотности вероятности
случайной величины X.
Математическое ожидание МXk (момент k–го порядка)
непрерывной случайной величины X определяют формулой
 k  MX k 

x
k
f ( x )dx .
(6.9)

Центральный момент k–го порядка непрерывной случайной
величины X определяют формулой

 k   ( x  MX ) k f ( x )dx .
(6.10)

Дисперсия непрерывной случайной величины X определится
по формуле

DX   2   ( x  MX ) 2 f ( x )dx .
(6.11)

Для оценки функции распределения вероятностей
в
результате проведения испытаний получают эмпирическую
кумулятивную функцию распределения, возможный вид которой
показан на рис. 6.3.
В табл. 6.1 приведен результат проведения испытаний
(опытов), попадания значений случайной величины А в отрезки,
заданные от нуля до границы оценки D(I). В счетчиках K(I)
записаны результаты частот попадания в интервалы,
определенные границами D(I).
Частости попадания случайной величины X в I-й интервал
определяются по формуле
PIX*  K ( I ) / K ( 8 ), I  1,8
так как в счетчике K(8) определено общее число опытов.
62
1,0
P(x) - теоретическая функция
0,9
0,85
0,8
0,725
0,7
0,6
0,56
0,5
0,48
0,4
0,385
0,3
0,2
0,2
0,1
0,075
2
4
6
8
10
15
20
25
Рис. 6.3
Таблица 6.1
Статистические данные результатов моделирования
Границы
D(1) D(2) D(3) D(4) D(5) D(6) D(7) D(8)
оценки
2
4
6
8
10
15
20
25
Номер
К(1) К(2) К(3) К(4) К(5) К(6) К(7) К(8)
счетчика
Частота
37
100 193 240 280 362 425 500
события
По полученным значениям PIX* строится гистограмма
кумулятивной эмпирической функции распределения так, что в
точке I (I=2,4,5,…,25) значение функции равно
PIX*  P1*X  P2*X  ...  PIX* .
Затем выдвигается гипотеза, состоящая в том, что найденная
кумулятивная эмпирическая функция распределения может быть
аппроксимирована теоретическим распределением F(x) (см.
рис. 6.3). Проверка гипотезы осуществляется по критерию 2.
63
В табл. 6.2 приведены некоторые законы распределения
непрерывных случайных величин и их характеристики математическое ожидание MX, дисперсия DX [5].
Таблица 6.2
1. Равномерное распределение
MX =(a+b)/2,
1 /( b  a ), a  x  b
,
f(x) 
DX =(a-b)2/12
 0, x  a, x  b
F(x)=(x-a)/(b-a)
2. Экспоненциальное распределение
MX =1/,
0
,
x
0

f(x) 
,
DX =1/2
 x
  e
F(x)=1–ex, x0
f(x)
3. Нормальное распределение
MX =a, Dx=2

2
( x  a )2
1
e
 2
2
4. Распределение Рэлея
f(x)

x

2
e
F( x )  1  e

x2
2 2
,
x2
2 2
MX   2 2 ,
2 Mx
DX 
2
5. Распределение Коши

1
Mx, Dx не существуют
,
f(x)
2
2
 ( x  a) 
1 1
xa
F ( x )   arctg
2 

6. Распределение Эрланга
MX=m/a,
a m x m 1  ax
f(x)
e , x0,
DX =m/a2
( m  1 )!
e  ax ( ax )k
k!
k 0
m 1
F( x )  1  
64
6.2. Применение нормального закона для оценки
вероятности и проверки гипотез
6.2.1. Нормальное распределение как приближение
биноминального.
В
теории
вероятностей
известно
теоретическое
биноминальное
распределение,
согласно
которому вероятность P того, что в проведенных n опытах
дискретная случайная величина X будет равна x, определится по
формуле
Р( X  x )  С nx p x q n  x .
(6.12)
Если случайная величина X может принимать значения 0, 1, 2,
…, n, то вероятность
pn ( x ) 
n!
p x q n x ,
x! ( n  x )!
(6.13)
где q=1 - p.
При больших значениях n биноминальное распределение с
хорошим приближением может быть описано с помощью
нормального распределения (см. табл. 6.2) с тем же центром и с
той же дисперсией, что и у биноминального распределения [6].
Данное положение определено теоремой Лапласа: если n
неограниченно возрастает, то при любом z
u2
z
 Х - np

1
Р
) z 
e z du  N ( z,0,1 )  0 ,5  Ф0 ( z ) , (6.14)

 npq

2 -


т.е. вероятность того, что нормированная величина X,
распределенная по биноминальному вопросу, будет меньше
заданного числа z, стремящегося с ростом n к нормальной
функции распределения.
Отметим, что Ф0(z) - определенный интеграл с переменным
верхним пределом вида
1
z
-
v2
2
 e dv
2 0
выражающий площадь под кривой n(z; 0; 1) в промежутке от 0
до z (см. рис. 6.4), носит название нормированной функции
Ф0 ( z ) 
65
Лапласа, а   npq - среднее квадратическое отклонение
величины X и X’=X - np от центра.
n(z,01)
Ф0(z1)
z
-3
-2
-1
1
z1
2
3
Рис. 6.4
Вместо величины X - числа положительных исходов опытов
независимых испытаний - рассматривают величину X/n частость появления случайного события. Тогда формула (6.14)
примет вид
X

 -p


n
(6.15)
Р
)  z   N ( z,0,1 )  0 ,5  Ф0 ( z ) .
pq


 n

Если рассматривать случайную величину X/n=wn – частость,
то её распределение согласно (6.15) приближенно описывается
при больших n нормальным распределением N(z;p;n),
pq
n 
 0 при n. Вид распределения показан на рис. 6.5.
n
Это распределение имеет вид иглы. Основная масса вероятности
66
распределения сконцентрирована в непосредственной близости
от центра в интервале (p - , p+).
p(wn)
p-
p+
p
Рис. 6.5
Бернулли сформулировал теорему: вероятность того, что
уклонение частости X/n от вероятности p не превзойдет по
абсолютному значению сколь угодно малого , стремиться к
единице при возрастании n.
6.2.2. Доверительные
интервалы
для
неизвестной
вероятности. После выполнения независимых n опытов
определена частность wn=X/n событий X=А. Теоретическое
значение вероятности P(A)=p неизвестно, но при n можно
полагать p X/n=wn.
Так как величина wn есть одно из возможных значений
случайной величины Wn, то желательно знать вероятные пределы
погрешности приближенного равенства p X/n=wn.
67
Если n достаточно велико, то согласно (6.15) можно считать,
что случайная величина
Wn - p
Z
pq
n
приближенно следует нормальному закону. Тогда для каждого
значения вероятности P можно найти такое число tp>0, что




tp
t2
Wn - p
1


Р  t p 
) tp  
 e 2 dt  2Ф0 ( t p )  P , (6.16)
pq
2 -t p


n


Число tp приближенно определяется по таблицам функции
Ф(z) [ . ].
Доверительный интервал, отвечающий заданному уровню
доверительной вероятности P, определяется следующим
образом.
Практически достоверным будет считать событие, имеющее
вероятность P или большую, при следующем предположении.
Вероятность P задана так близко к 1, что можно пренебречь
событиями, имеющими вероятность, не большую 1 - P, т.е
считать их практически невозможными. Тогда определена
вероятность Wn нахождения частости wn в заданных пределах
p( 1  p )
p( 1  p ) ,
(6.17)
p tp
 Wn  p  t p
n
n
так как согласно выбору пределов tp практически достоверно,
что при каждом P выполнено условие
Wn  p
pq
n
tp.
Неравенство (6.17) имеет эквивалентный вид
Wn  p  t p
или
p( 1  p ) ,
n
(6.18)
68
p( 1  p )
,
n
или в виде неравенства относительно переменной p
t 2p
t 2p
(6.19)
p 2 ( 1  )  p( 2Wn  )  Wn2  0 ,
n
n
Решая квадратное уравнение в левой части неравенства (6.19),
можно получить два действительных корня
2nWn  t 2p  t n D
2nWn  t 2p  t n D
, p2 ( W , n ) 
,
p1 ( W , n ) 
2( n  t 2p )
2( n  t 2p )
( W n  p ) 2  t 2p
где D  4nWn ( 1  Wn )  t 2p , 0<p1(W,n)<p2(W,n)<1.
Если значение вероятности p появления события А находится
между p1(W,n) и p2(W,n), т.е.
p1(W,n)<p<p2(W,n),
(6.20)
то выполняются (6.19) и (6.17), т.е. с одной и той же
вероятностью случайная величина Wn входит в левую и правую
части неравенства (6.20).
Такм образом, получен интервал [p1(W,n), p2(W,n)],
покрывающий с вероятностью P неизвестное значение p,
который называется доверительным интервалом.
Рассмотрим пример [6]. При числе n=200 независимых
опытов событие А появилось M=88 раз. Определим
доверительные границы с значением вероятности P=0,95 для
вероятности P(А).
В табл. 6.3 приведены значения вероятностей при
нормальном распределении.
Таблица 6.3
Вероятности при нормальном распределении
Границы интервалов
Вероятность попадания в
относительно математического
интервал
ожидания а
0,6826968 %
а - , а + ,
0,9545095 %
а - 2, а + 2,
0,9973099,7 %
а - 3, а + 3
69
Из табл. 6.1 следует, что при P0,95 имеем значение t0,95=2.
Определим частость wn=M/n=88,200=0,44. Тогда:
D  4  200  0,44  0,56  2 2 =14,18;
p1 ( 0 ,44; 200 ) 
2  200  0 ,44  2 2  2  14 ,18
 0 ,37 ;
2( 200  2 2 )
p 2 ( 0 ,44; 200 ) 
2  200  0 ,44  2 2  2  14 ,18
 0 ,51 .
2( 200  2 2 )
Таким образом, доверительной вероятности P=0,95
соответствует интервал (0,37< p <0,51).
Особо отметим, что данный метод поиска доверительного
интервала пригоден при больших значениях n; согласно [6] при
значении
npq>9.
(6.21)
Если условие (6.21) не выполняется, то поступают
следующим образом.
Сумма начальных членов биноминального распределения
(6.12) имеет вид
S nM (p) 
mM
 p ( m )  (1 p )
m 0
n
n
 C n1 p( 1  p ) n 1 
 C p ( 1  p ) n  2  ...  C nM p M ( 1  p )n  M  ... .
2
n
2
(6.22)
После дифференцирования (6.22) по аргументу p, получим
dS nM ( p )
 n( 1  p ) n  C n1 ( n  1 ) p( 1  p ) n 2 
dp
2
 C n ( n  2 ) p 2 ( 1  p ) n 3  ...  C nM 1 ( n  M  1 ) p M 1 ( 1  p ) n  M 
 n( 1  p ) n 1  2C n2 p( 1  p ) n  2  3C n3 p 2 (( 1  p ) n 3  ... 
 MC nM p M 1 (( 1  p ) n  M 
n!

p M ( 1  p )n M 1 .
M ! ( n  M  1 )!
(6.23)
При постоянных значениях n и M производная функции SnM(p)
отрицательная при 0<p<1. Эта функция монотонно убывает от
значения 1 при p=0 к значению 0 при p=1. Следовательно,
70
функция SnM(p) примет единственный раз любое значение 
между нулем и единицей.
Обозначим значение вероятности p, соответствующее
p M , т.е. уравнение (6.22)
значению SnM(p) функции, через ~
приравняем значению 
S nM ( ~
p M )   .
(6.24)
Если в результате опытов получена частота M события А, то
утверждение о том, что верхний доверительный предел для
искомой вероятности p, гарантируемый с вероятностью 1-,
p M , будет ошибочно с вероятностью, не большей .
равен ~
Таким образом, в качестве верхнего доверительного предела с
p M  корень
вероятностью ошибки, меньшей , следует взять ~
уравнения (6.24).
Аналогичным способом определяется нижний доверительный
предел, отвечающий доверительной вероятности 1-, который
находится из решения уравнения
'
S nM
( p M ) 
n
 p (m) .
mM
n
(6.25)
Решение уравнения (6.25) обозначим через pM. Интервал
( p M  p  ~
p M ) будет доверительным интервалом для
неизвестной вероятности p, построенной по частоте M и
отвечающий доверительной вероятности, не меньшей 1-2.
6.3. Значимость оценки
6.3.1. Статистическая проверка гипотезы относительно
вероятности. На практике при имитационном моделировании
получают эмпирические результаты - статистические данных,
которые подлежат обработке.
Статистические данные при обработке аппроксимируют
известными теоретическими распределениями, т.е. выдвигают
гипотезу, данное теоретическое распределение аппроксимирует
эмпирическое распределение. Задача может состоять в
определении вероятности (вероятностей) появления события или
71
в
поиске
наиболее
«подходящего»
теоретического
распределения непрерывной случайной величины. Например,
необходимо проверить гипотезу относительно того, что при
выполнении имитационного моделирования частость р*=m/N
является оценкой вероятности р появления события.
Например, пусть проверяется настройка станка на среднюю
точку поля допуска. Проведено N=280 независимых испытаний и
интересующее нас событие появилось m=151 раз. Модель
появления
независимых
событий
биноминальное
распределение. Если гипотетическая вероятность события р=1/2,
то математическое ожидание равно Nр=280(1/2)=140, а
среднеквадратичное отклонение биноминального распределения
определится из формулы Npq  280  1  1 =8,37, где q=1 - р 2 2
вероятность не появления события. Надо получить ответ на
вопрос: можно ли считать наблюденную частоту 151 достаточно
близкой к теоретической норме 140, отвечающей гипотезе р=1/2.
Вначале следует выбрать границу допустимых при гипотезе
отклонений частот (или частостей) от математического
ожидания, как это было показано в предыдущем разделе.
Будет определено критическое отклонение, превышение
которого при выдвинутой гипотезе настолько маловероятно, что
его можно считать практически невозможным. Если превышение
критического отклонения будет наблюдаться, то это указывает
на несовместимость выдвинутой гипотезы с наблюдениями и
говорят, что наблюдаемая частость значимо отклоняется от
вероятности. Если фактическое отклонение меньше критической
границы, то опыт не противоречит выдвинутой гипотезе и
наблюдаемое отклонение можно объяснить случайностью
испытаний.
На практике задают уровень значимости , т.е. вероятность
практически невозможных отклонений. Эта вероятность обычно
не превышает значение 0,05. Область больших отклонений,
соответствующую уровню значимости , называют критической
областью, а само правило проверки - критерием значимости.
Критическую границу для отклонений от теоретической нормы
можно определить, пользуясь нормальным приближением к
72
биноминальному закону. На рис. 6.6 приведены двухсторонние
критические границы для проверки гипотезы р=1/2.
-1,96
0
+1,96
Рис. 6.6
Вероятность 0,95 соответствует при нормированном
нормальном распределении интервалу (-1,96, +1,96) около
центра распределения, так как вероятность того, что абсолютная
величина нормированного отклонения превысит значение 1,96,
равна 0,05, т.е. Р(|A|>1,96)=Р(|m - Nр|>1,96)0,05, где m практическая частота.
Уровень значимости 0,01 соответствует границе 2,58, т.е.
Р(|A|>2,58)=Р(|m - Nр|>2,58)0,01.
Для рассмотренного выше примера настройки станка на
среднюю точку поля допуска =8,37 и 5%-ной критическая
граница соответствует 1,968,37=16,41, а 1 %-ной критическая
граница соответствует 2,588,37=21,59.
Таким образом, область допустимых значений при 5 %-ной
критической границы определяется пределами
Nр1,96=14016,41,
а при области допустимых значений при 1 %-ной критической
границы определяется пределами Nр2,58=14021,6.
Если выдвинутая гипотеза, что наблюдаемая частота 151
достаточно близка к теоретической норме 140, отвечающей
вероятности р=1/2, верна, то отклонение частоты от
теоретической нормы в пяти случаях из 100 может превышать
16,4, и в одном случае из 100 может превышать 21,6. Так как в
рассмотренном примере отклонение составило 151 - 140=11, т.е.
73
оно находится в области допустимых значений, то нет оснований
считать гипотезу р=1/2 противоречащей наблюдениям.
6.3.2. Общая задача проверки гипотез. При наличии
явлений рассеивания признаков случайной величины требуется
провести сравнительную оценку, причем обоснованный вывод
может быть получен путем научно поставленного анализа
статистических данных.
Данные
рассматривают
как
некоторые
выборки,
информирующие о поведении случайных величин и
позволяющие делать определенные заключения о законах
распределения этих величин.
Существуют некоторые выборки значений случайной
величины А. Необходимо сделать заключение о законах
распределения случайной величины А. Можно сделать
предположение, что тип закона распределения известен, но
неизвестны его параметры, т.е. проверка гипотезы сводится к
сравнению статистических характеристик, оценивающих
параметры выбранных законов распределения.
Для проверки гипотезы согласно критерию выбираются
надлежащие уровни значимости (см. разд. 6.3.1) =5 %, 2 %, 1 %
и т.д., отвечающие событиям, которые при данном исследовании
считаются практически невозможными. Затем определяется
критическая область данного критерия, вероятность попадания в
которую в точности равна уровню значимости , если гипотеза
верна. Значения критерия, лежащие вне критической области,
образуют дополнительную к ней область допустимых значений
(незаштрихованная область на рис. 6.6).
Если /100 - уровень значимости, то вероятность попадания
критерия в область допустимых значений при справедливости
выдвинутой гипотезы равна 1 - /100. Если значение критерия,
вычисленное по произведенным наблюдениям (опытам),
окажется в критической области, то гипотеза отвергается. Если
значение критерия окажется в области допустимых значений,
что наблюдаемое значение критерия не противоречит гипотезе.
Чем меньше уровень значимости, тем меньше вероятность
забраковать проверяемую гипотезу, когда она верна, т.е.
совершить ошибку первого рода. С уменьшением уровня
74
значимости понижается чувствительность критерия, так как
расширяется область допустимых значений и увеличивается
вероятность совершения ошибки второго рода, т.е. принятия
проверяемой гипотезы, когда она не верна. Уровень значимости
критерия проверки контролирует лишь ошибки первого рода и
не измеряет степень риска, связанного с принятием неверной
ошибки.
При заданном уровне значимости можно по-разному
устанавливать критическую область, гарантирующую этот
уровень. Теоретическое определение критических областей было
рассмотрено выше. Например, в качестве критерия
рассматривается некоторый показатель, распределенный при
проверяемой гипотезе нормально с плотностью распределения
f(x;a;). В качестве критической области, соответствующей
уровню значимости =5 % можно принять:
- область больших положительных отклонений так, что
Р(tq)=Р(x>a+tq)=0,05,
но
P1 ( t q ) 
1

e
2
-
z2
2
dz 
tq
1
 Ф0 ( t q ) ,
2
(6.26)
тогда из таблицы значений нормированной функции Лапласа
z
v2
1
Ф0 ( z ) 
e 2 dv

2 0
определим:
- tq=1,65;
- область больших отрицательных отклонений
Р2(tq)=Р(x<a - tq)=Р(x<a - 1,65);
- область больших по абсолютной величине отклонений
Р3(tq)=Р(|x - a|>tq)=0,05,
Определим tq из соотношения
P( x  a )  t q ) 
 P1 ( t q )  1 
2

e
2
tq
-
z2
2
dz 
1
 Ф0 ( t q )
2
(6.27)
75
так что tq=1,96;
- область малых по абсолютной величине отклонений
Р4(tq)=Р(|x - a|>tq)=2Ф0(z),
так что tq0,063.
Эти области показаны на рис. 6.7.
(6.28)
f(x,a,)
Значение х критерия
проверки гипотезы
4
0
3
3
a
2
-1,96
+1,96
1
1 - область больших положительных отклонений;
2 - область больших отрицательных отклонений;
3 - область больших по абсолютной величине отклонений
(состоит из двух половин); 4 - область малых по абсолютной
величине отклонений
Рис. 6.4
6.3.3. Проверка гипотез о законе распределения. При
обработке статистических данных моделирования вид закона
распределения является гипотетическим и нуждается в
статистической проверке, т.е. задача о критерии проверки
гипотезы по данным выборки состоит в том, что случайная
величина Х подчинена закону распределения Р(х).
Критерии проверки гипотез, называемые критериями
соответствия, основаны на выборе определенной меры
76
расхождения
между
теоретическим
и
эмпирическим
распределениями. Если такая мера расхождения для
рассматриваемого случая превосходит установленный предел, то
гипотеза не подтверждается.
Рассмотрим наиболее употребительный критерий 2
(критерий Пирсона). Пусть гипотеза предполагает вид функции
распределения Р(х). Вся область изменения случайной величины
Х разбита на конечное число k множеств 1, 1, …, k. Если
случайная величина Х непрерывна, то множества 1, 1, …, k
представляют собой интервалы, а если случайная величина Х
дискретна, то множества 1, 1, …, k представляют собой
группы отдельных значений случайной величины Х.
Пусть pi - вероятность того, что значения случайной
величины Х при данном распределении Р(х) принадлежат
интервалу i.
Объем выборки N, а mi - число значений случайной величины
Х в выборке O(x1, x2, x3, …, xN), попавших в интервал i.
Очевидно, что
p1+p2+ …+pk=1,
(6.29)
m1+m2+ …+mk=N.
(6.30)
Если проверяемая гипотеза верна, то mi представляет частоту
появления события, имеющего в каждом из N произведенных
испытаний вероятность pi. В таком случае mi можно
рассматривать как случайную величину, подчиненную
биномиальному закону распределения с центром в точке Npi и
средним квадратическим  1  Np1 ( 1  pi ) .
Если N достаточно велико, то можно считать, что частота
распределена асимптотически нормально с центром в точке Npi и
средним квадратическим  1  Np1 ( 1  pi ) .
Если проверяемая гипотеза верна, то можно ожидать, что в
совокупности будут асимптотически нормально распределены
случайные величины
i 
( mi  Npi ) ,
Npi
(i=1,2,…,k),
связанные между собой соотношением
(6.31)
77
k

i 1
k
pi  
i
( mi  Npi )
N
i 1
,
(6.32)
вытекающим из условий (6.29) и (6.30).
В
качестве
меры
расхождения
данных
выборки
(эмпирических частот) m1, m2, …, mk с теоретическими частотами
Np1, Np2, …, Npk рассмотрим величину
( mi  Npi ) 2
.
Npi
i 1
k
k
 2    i2  
i 1
(6.33)
Для практических приложений можно применять подобное
равенство
mi2
 
N.
i 1 Npi
k
2
(6.34)
Согласно формуле (6.33) случайная величина 2 представляет
собой
сумму
квадратов
асимптотически
нормально
распределенных случайных величин, связанных линейной
зависимостью (6.32).
Из теории вероятностей известна теорема. Если проверяемая
гипотеза верна, то критерий 2, определяемый по формуле (6.33),
имеет распределение, стремящееся при N к распределению
2 с k - 1 степенями свободы.
При проведении проверки задают уровень значимости  (%)
для критерия. Пусть  2 обозначает  %-ный предел для закона
распределения 2 с k - 1 степенями свободы. Этот закон имеет
табличное задание и его значения приводятся в приложениях
книг с изложением теории вероятностей.
Если гипотеза верна, то при достаточно большом числе
опытов N справедливо определение вероятности
 .
(6.35)
Р(  2   2 ) 
100
После определения случайной величины 2 по данным
выборки O(x1, x2, x3, …, xN) будет выполняться одно из двух
условий:
- при  2   2 критерий попадает в критическую область и,
следовательно,
расхождение
выборочных
данных
с
78
гипотетическим допущением о законе распределения случайной
величины существенно, гипотеза отвергается;
- при  2   2 несущественно расхождение выборочных
данных с гипотетическим допущением о законе распределения,
гипотеза принимается.
Во втором случае в  % всех случаев, но неизвестно каких,
гипотеза неверна. Принято считать достаточным нормальное
приближение для практических расчетов, если Npi10 i. Если
есть группы со значениями Npi, меньшими 10, то рекомендуют
соседние группы объединять так, чтобы новые группы
удовлетворяли условию Npi10 i.
Если число степеней свободы k>30, то соответствующего
значения случайной величины 2 нельзя найти в табличном
задании закона распределения 2. В этом случае применяют
следующую приближенную формулу:
1
 2  ( 2  1  z 2 )2 ,
2
основанную на том, что
(6.36)
2  2 оказывается асимптотически
нормальным законом N ( z ; ( 2  1 ;1 ) , z2 - есть 2 %-ный
предел абсолютного уклонения нормальной переменной,
заданный в табличных приложениях книг по теории
вероятностей.
6.4. Формулы и алгоритмы для оценки результатов
моделирования
При реализации моделирующего алгоритма на ЭВМ
вырабатывается информация о состоянии моделируемых систем,
которая представляет собой исходный материал для определения
приближенных искомых величин по статистическим данным.
Желательно так организовать фиксацию и алгоритмы обработки
результатов моделирования, чтобы статистические оценки для
искомых величин формировались постепенно по ходу
79
моделирования,
без
специального
запоминания
всей
информации о состояниях системы [1].
Если при моделировании учитываются случайные факторы,
то в качестве оценок для искомых величин используются
средние значения, дисперсия и другие вероятностные
характеристики. В памяти ЭВМ для формирования оценки
желательно занимать как можно меньше ячеек. При
моделировании случайных событий оценка Р(A) вероятности
Р(A) события A определится по формуле
Р*(A)=m/N,
(6.37)
где m - число случаев (частота) наступления случайных событий
A, N - число реализаций (объем выборки). В данном случае для
подсчета частоты достаточно предусмотреть один счетчик К,
содержимое которого будет увеличиваться на единицу каждый
раз при наступлении события A. Для получения значения Р*(A)
после окончания моделирования содержимое счетчика К делится
на N.
Если событие принимает значения в некоторой области
величин, то область значений n случайной величины разбивается
на отрезки так, что n={n1, n2, …, nm},  ni  N . Оценка
i
вероятностей возможных i-х значений случайной величины
определяется
Р*i(A)=mi/N,
(6.38)
где mi - число значений случайной величины в интервале ni. Для
подсчета частоты необходимо предусмотреть m счетчиков К[I],
содержимое которых будет увеличиваться на единицу каждый
раз тогда, когда случайное событие A принимает значение из
интервала ni.
Для получения значения Р*i(A) после окончания
моделирования содержимое i-го счетчика К[I] делится на N.
Алгоритм приведен на рис. 6.5. Примером непрерывной
случайной величины A могут быть интервалы времени между
движущимися автомобилями.
Если задать границы D(J), J  I , JM , где JМ - заданное число
границ оценки этой случайной величины А, то можно
определить частоты событий А(J), состоящие в том, что значения
80
случайной величины A меньше или равны границам D(J).
Частоты А(J) записаны в счетчиках К(J), J  I , JM .
Начало
1
I=0
2
3
I=I+1
P(A)=K[I]/N
1 4
IM
0
Конец
Рис. 6.5
Величина D(JМ) является наибольшей границей оценки
случайной величины, т.е. D(1)<D(2)<…<D(JМ). Частота К(J)
события А определена тем, что значение события меньше либо
равно границе D(J).
На рис 6.6 приведен алгоритм подпрограммы STAT набора
статистических данных. Входной переменной подпрограммы
STAT является значение X непрерывной случайной величины A.
В блоках 1, 2, 5 реализован цикл по переменной J. В блоке 3
проверяется условие, что значения X случайной величины A
меньше или равны границам D(J). Если условие выполняется, то
содержимое соответствующего счетчика К(J) увеличивается на
единицу (см. блок 4).
В табл. 6.1 приведен пример частот некоторой случайной
величины А.
Обработка статистических данных, приведенных в табл. 6.1,
позволяет построить кумулятивную эмпирическую функцию
распределения.
81
Начало
1
J=0
2
J=J+1
3
XD[J]
0
1
4
1
K[J]=K[J]+1
5
JM
0
Конец
Рис. 6.6
Таблица 6.1
Статистические данные результатов моделирования
Границы D(1) D(2) D(3) D(4) D(5) D(6) D(7) D(8)
оценки
2
4
6
8
10
15
20
25
Номер
К(1) К(2) К(3) К(4) К(5) К(6) К(7) К(8)
счетчика
Частота
37
100 193 240 280 362 425 500
события
Определяются частости появления события А в соответствии
с формулами:
A( J )
Pj*  A( J ) / A( JM ),
Pj  lim
, J  1, JM ,
N   A( JM )
где Pj - теоретическое значение вероятностей.
82
Затем строится гистограмма кумулятивной эмпирической
функции распределения по значениям Pj*. Пример построения
приведен на рис. 6.7.
1,0
P(x)  теоретическая функция
0,9
0,85
0,8
0,725
0,7
0,6
0,56
0,5
0,48
0,4
0,385
0,3
0,2
0,2
0,1
0,075
2
4
6
8
10
15
20
25
Рис. 6.7
Выдвигается гипотеза, состоящая в том, что найденная
кумулятивная эмпирическая функция распределения может быть
аппроксимирована известным теоретическим распределением
P(x) (см. рис. 6.7). Проверка гипотезы осуществляется по
критерию 2.
Если определять частоты событий А(J), состоящие в том, что
значения случайной величины A принадлежит интервалу
(D(J+1) - D(J)), J  0 , JM  1 , и эти частоты записывать в
счетчики К(J), J  I , JM , то алгоритм подпрограммы STAT в
этом случае будет иметь вид, приведенный на рис. 6.8.
83
Начало
1
J=0
2
J=J+1
3
0
XD[J]
1
4
K[J]=K[J]+1
Конец
Рис. 6.8
Можно получить по статистическим данным  *j - частости
попадания случайной величины A в интервалы (D(J+1) - D(J)),
J  0 , JM  1 :
*
*
*
*
*
*
*
*
*
 *j  P1* ;  2  P2  P1 ;  3  P3  P2 ; …;  M  PM  PM 1 .
Затем определить отношение  *j к величине j-го интервала
(D(J+1) - D(J))
 
*
j
 *j
D( J  1 )  D( J )
, j  1, M , J  0, JM - 1,
j  J  1.
Если при моделировании в счетчиках К(J) будут получены
частоты событий, состоящих в том, что случайная величина А
принадлежит интервалу (D(J+1)-D(J)), то частости  *j
определятся по формуле  *j  A( J ) /
JM
 A( J ).
j 1
Для построения кумулятивной эмпирической
распределения частости Pj* определятся по формуле
j
Pj*   i* .
i 1
функции
84
Среднее значение случайной величины определяется по
формуле
1 m
(6.39)
x
x ,
N k 1 k
где хk - возможные значения случайной величины, которые она
принимает при различных реализациях процесса. На рис. 6.9
приведен алгоритм для определения среднего значения
случайной величины.
Начало
1
N=N+1
2
GEN(X)
3
1
K=K+X
4
NINZ
0
5
XS=K/N
Конец
Рис. 6.9
В этом алгоритме N - такты моделирования; NZ - заданное
число тактов моделирования; GEN(Х) - подпрограмма генерации
случайной величины Х. После генерации всей выборки
случайной величины Х в блоке 5 определяется среднее значение
XS.
Оценкой S2* дисперсии случайной величины определится
1 N
2
(6.40)
S 2* 
( x  x ) ,
N 1 k 1 k
где x - математическое ожидание случайной величины.
85
Эта формула неудобна, так как в процессе моделирования
необходимо запоминать весь массив значений х1, х2, х3, …, хN.
Известна упрощенная формула, согласно которой
S 2* 
т.е.
для
N
1 N 2
1
(  xk )2 ,
 xk 
N 1 k 1
N ( N  1 ) k `1
(6.41)
определения
S2* достаточно в двух счетчиках
m 2
m
накапливать значения
 xk и  xk . Для оценки
k 1
k 1
корреляционного момента K случайных величин  и  с
возможными значениями хk и yk применяется формула
1 N
(6.42)
K* 
 ( xk  x )( y k  y ) .
N 1
k 1
Эта формула преобразуется к виду
K* 
N
N
1 N
1
x
y

x
 k k N( N  1 )  k  yk ,
N 1
k 1
k 1 k 1
требующему подсчета и запоминания в
соответствующих величин:
N
 xk y k ,
k 1
N
 xk ,
k 1
трех
(6.43)
счетчиках
N
 yk .
k 1
Иногда искомыми величинами являются математическое
ожидание и корреляционные функции случайного процесса Х(t).
В теории случайных процессов изучаются закономерности
изменения случайной величины от изменения неслучайного
параметра, например, времени, пространственной координаты и
прочее. Основным понятием в теории вероятностей является
понятие испытания с определенным множеством  возможных
элементарных событий  - исходов испытания. Случайная
величина X представляет однозначную числовую функцию
X=f() элементарных событий, принимающую числовое
значение в зависимости от исхода  испытания.
Пусть каждому элементу  множества  соответствует не
одно определенное значение, а определенная числовая функция
86
f(t)(0,T) некоторого неслучайного параметра t. Так как для
различных  эти функции различны, то каждую такую функцию
f(t) называют возможной реализацией случайного процесса Х(t).
Совокупность всех возможных реализаций, т.е. множество
функций f(t) образуют случайный процесс Х(t).
Распределение вероятностей случайного процесса Х(t) задают
распределением вероятностей случайных величин Х(t1), Х(t2), …,
Х(ts), соответствующих любому конечному набору значений t1, t2,
…, ts параметра t (s=1,2,3,…).
На практике случайный процесс Х(t) определяют
математическим ожиданием и дисперсией, являющимися
функциями параметра t, а также корреляционной функцией.
Рассмотрим, как определяют и как вычисляют эти функции. На
рис. 6.10 показаны реализации случайного процесса Х(t).
X1(t)
X5(t)
X2(t)
XN(t)
X4(t)
Математическое ожидание MX(t)
XN-1(t)
X3(t)
t1
t2
t3
t4
t5
t6
t7
Рис. 6.10
t8
t9
t10
t11
t12
87
Математическим ожиданием случайного процесса Х(t)
называется неслучайная функция МХ(t), значение которой при
каждом значении t=ti равно математическому ожиданию МХ(ti)
той случайной величины Х(ti), которая соответствует этому
значению параметра.
Математическое ожидание МХ(t) (см. рис. 6.10) представляет
собой среднюю функцию, около которой группируются
возможные реализации случайного процесса Х(t).
Дисперсией случайного процесса Х(t) называется неслучайная
функция DХ(t), значение которой при каждом значении t=ti
параметра t равно математическому ожиданию DХ(ti) той
случайной величины Х(ti), которая соответствует значению
параметра ti. Квадратный корень из дисперсии представляет
среднее квадратичное отклонение случайного процесса Х(t) и
определяется по формуле
 X ( t )   DX ( t ) .
(6.44)
Связь между случайными величинами Х(t ) и Х(t**),
соответствующая значениям t* и t** случайного процесса Х(t),
характеризуется их ковариацией
BX(t*,t**)=cov[Х(t*), Х(t**)]=
=M{[Х(t*) - MХ(t*)][Х(t**) - MХ(t**)]}.
(6.45)
Ковариация представляет собой неслучайную функцию
BX(t*,t**) двух переменных t* и t**, которая графически может
быть представлена поверхностью, как это показано на рис. 6.11.
Функция BX(t*,t**) называется корреляционной функцией или
автокорреляционной функцией случайного процесса Х(t).
Интересующий интервал (0, T) разбивается на части с шагом
t. Накапливают значения Хk(ti) реализаций случайного
процесса Х(t) для фиксированных моментов времени ti.
Затем вычисляют оценки для математического ожидания по
формуле
*
MX ( t i ) 
1
N
N
X
k 1
k
( t i ) .
(6.46)
Оценки для корреляционной функции BX(t*,t**) вычисляются
по формуле
88
1 N
[ X k ( t* ) 

N  1 k 1
*
 X k ( t )][ X k ( t ** )  X k ( t ** )] ,
B*X ( t * ,t ** ) 
(6.47)
где t и t «пробегают» все значения t. Так при моделировании
при применении формулы (6.47) необходимо накапливать N
значений Xk(t*) и N значений Xk(t**).
*
**
BX(t*,t**)
t*
t**
Рис. 6.11
На практике для оценки корреляционной функции BX(t*,t**)
применяют формулу
B*X ( t * ,t ** ) 
1 N
X k ( t * ) X k ( t ** ) 

N  1 k 1
N
N
k 1
k 1
  X k ( t * ) X k ( t ** ) ,
(6.48)
При применении формулы (6.48) необходимо три счетчика
для подсчета сумм
89
N
X
k 1
N
N
k
( t * ) X k ( t ** ) ,
X
k 1
k
( t* ) ,
X
k 1
k
( t ** ) .
Контрольные задания
1. Какая разница между понятиями «испытания» и
«событие»?
2. Что определяют понятия «вероятность», «частота» и
«частость»?
3. Поясните смысл математического ожидания и приведите
формулы его определения для дискретных и непрерывных
случайных величин.
4. Приведите формулу для определения центральных
моментов.
5. Каков смысл понятия «дисперсия» и каким образом она
определяется?
6. Как определяется коэффициент вариации?
7. Как определяется ассиметрия распределения и показатель
ассиметрии?
8. Приведите
пример
построения
эмпирической
кумулятивной функции распределения.
9. Приведите формулу биноминального распределения и
объясните её смысл.
10. Приведите теорему Лапласа и объясните её смысл.
11. Какой интеграл носит название «нормированная функция
Лапласа» и объясните его назначение при обработке
статистических данных?
12. Приведите теорему Бернулли и объясните её смысл.
13. Каким образом определяется доверительный интервал при
больших значениях числа испытаний, отвечающий заданному
уровню доверительной вероятности P?
14. Каким образом определяется доверительный интервал при
небольших значениях числа испытаний, отвечающий заданному
уровню доверительной вероятности P?
90
15. Каков смысл понятия «значимость оценки», «уровень
значимости»?
16. Приведите иллюстрацию для объяснения понятия
«критические границы».
17. Объясните смысл общей задачи проверки гипотез.
18. Приведите пример проверки гипотез о законе
распределения с применением критерия Пирсона.
19. Приведите алгоритм определения частости случайных
событий и обработки статистических данных.
20. Приведите алгоритм для определения среднего значения
случайной величины.
21. Приведите формулы оценки дисперсии.
22. Приведите формулы оценки корреляционного момента.
23. Приведите определение дисперсии случайного процесса.
24. Что называется ковариацией случайных величин?
25. Приведите определение корреляционной функции или
автокорреляционной функции случайного процесса.
26. Приведите формулы для определения автокорреляционной функции случайного процесса.
91
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Финаев В.И. Моделиpование при проектировании
информационно-управляющих систем: Учебное поcобие. Таганpог: Изд-во ТРТУ, 2002. - 118 c.
2. Аcатуpян В.И. Теоpия планиpования экcпеpимента. М.: Pадио и cвязь, 1983.
3. Адлер Ю.П., Маркова Е.В., Грановский Ю.В.
Планирование эксперимента при поиске оптимальных
условий. - М.: Наука, 1971.
4. Хартман К. и др. Планирование эксперимента в
исследовании технологических процессов. - М.: Мир, 1977.
5. Вентцель Е.C., Овчаров Л.А. Теоpия веpоятноcтей и её
инженерные приложения. - М.: АСАDEMA, 2003.
6. Cмиpнов Б.Я., Дунин-Баpковcкий И.В. Кpаткий куpc
математичеcкой cтатиcтики для теxничеcкиx пpедложений. 
М: Физматгиз, 1969. - 512 с.
92
Финаев Валерий Иванович
ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА
И ОБРАБОТКА
ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
Учебное пособие
Ответственный за выпуск Финаев В.И.
Редактор Надточий З.И.
Корректор Селезнева Н.И.
ЛР №020565 от 23.06.97 г.
Формат 60х84 1/16
Офсетная печать
Усл.п.л. 5,7
Заказ №
Подписано к печати
Бумага офсетная
Уч.-изд.л. – 5,6
Тираж 100 экз.
«С»
Издательство Южного федерального университета
ГСП 17 А, Таганрог, Некрасовский, 44
Типография Южного федерального университета
ГСП 17 А, Таганрог, Некрасовский, 44
Download