Любимов С.В. Аппроксимация испытаний марочной прочности

advertisement
АППРОКСИМАЦИЯ ИСПЫТАНИЙ МАРОЧНОЙ ПРОЧНОСТИ
ПОРТЛАНДЦЕМЕНТА С ИСПОЛЬЗОВАНИЕМ ГЕНЕТИЧЕСКОГО
ПРОГРАММИРОВАНИЯ
Любимов С.В., аспирант
Северо-Кавказский филиал Белгородского
Государственного Университета им. В.Г Шухова
1. ПОСТАНОВКА ЗАДАЧИ
Начальной и определяющей стадией производства таких важнейших строительных материалов, как
цемент, бетон, стекло, керамика, является приготовление смесей с заданными свойствами из разнородных
по физико-химическим характеристикам исходных компонентов. Подобные технологические процессы
распространены также в химической, металлургической, горнодобывающей, пищевой и других отраслях
промышленности [3].
Важнейшей характеристикой строительных материалов и изделий на основе вяжущих
гидратационного твердения, к которым относятся, прежде всего, портландцемент, является марочная
прочность после 28 суток твердения при нормальных условиях либо физико-механические характеристики
после тепловой обработки. Однако, важно знать не только эти свойства цементных систем, но и прочность в
более ранние сроки.
2. ГЕНЕТИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Генетическое программирование представляет один из видов эволюционных алгоритмов. С помощью
методов генетического программирования решаются комбинаторные задачи, в которых необходимо
подобрать не столько значение параметров, а скорее их расположение. Например, с помощью методов
генетического программирования решаются задачи подбора расписания, подбор электрической схемы,
подбор топологии нейронной сети [1]. В генетическом программировании, эволюционирует популяция
программ. Каждая программа может быть представлена различными способами: деревом, стековым языком,
языком списков (например, Lisp).
При представлении программы в виде дерева, вершинами являются функции, а их потомкиаргументами. Например, выражение maxx + x,x + 3  y  будет иметь такое представление (Рис.1):
max
+
X
+
X
3
y
Рис. 1. Дерево арифметического выражения
Оператор кроссовера. Оператор скрещивания – предназначен для получения новых решений, на
основе тех, что находятся в данный момент в популяции. Получает на вход две или более хромосом, на
выходе выдает комбинированное решение, которое построено на основе входных решений. Как и в
генетических алгоритмах, операция кроссовера в генетическом программировании служит для получения
потомка из двух и/или более предков. Самый распространенный вид кроссовера – subtree crossover. На
вход, получаем две программы-дерева и выбираем случайно (и независимо для каждого дерева) точку
скрещивания. Затем создается потомок, в котором поддерево с корнем в точке скрещивания в качестве
корня заменено на такое же поддерево из второго дерева (рис. 2). Оператор скрещивания должен
контролировать размер получившегося потомка, что глубина дерева не превышала заранее установленную.
Оператор мутации. Предназначен для вывода популяции из локального оптимума. Он применяется с
некоторой вероятностью к каждому решению полученному в результате операции скрещивания. Самый
популярный вид мутации – subtree mutation. Алгоритм работы аналогичен алгоритму кроссовера subtree
crossover. Случайно выбирается точка мутации в дереве и заменяется на случайно сгенерированное дерево.
Чаще всего это реализуют, как операцию скрещивания мутирующего дерева, с деревом сгенерированным
оператором инициализации.
+
(x+y)+3
+
(x/2)+3
3
+
3
/
y
x
x
2
(y+1)*(x/2)
*
+
/
x
1
y
2
Рис. 2. Оператор кроссовера
Точка мутации
Точка мутации
+
+
+
3
+
*
y
x
x
y
/
y
сгенерированное дерево
2
x
*
/
y
x
2
Рис. 3. Оператор мутации
Операция вычисления. Данная операция применяется к решению для получения закодированного в
решении значения. Например, для программы, представленной деревом на рисунке 4 является 7
(max(1+2,3+4)).
max
+
1
+
2
3
4
Рис. 4. Арифметическое выражение max(1+2,3+4)
Методика тестирование. В наличии имеются два журнала испытаний [4]. В первом содержится 18
испытаний, во втором 50. Каждое испытание содержит следующие параметры:
1.
Процентное содержание C3S, C2S,C3A, C4AF.
2.
Прочность на 7-е сутки
3.
Прочность на 28 сутки
Задачей алгоритма является подбор функции, аппроксимирующей прочность на 28 сутки
Параметры алгоритма:
1.
Размер популяции – 300
2.
Вероятность мутации – 90
3.
Максимальная глубина дерева – 4
4.
Процент данных, участвующих в отборе – 75%
5.
Максимальное количество поколений – 200
Ограничение по количеству поколений введено для того, чтобы система не “заучивала” тестовые
данные.
Аппроксимация с учетом всех параметров. Результаты представлены на рис.5-10.
Рис. 5. Результат аппроксимации (среднее значение ошибки 17%)
Ре зу л ь т а т и сп ы т а н и я
Результ ат аппроксимации
375
350
325
300
275
250
225
200
175
150
125
100
75
50
25
0
Этал он ное значен ие
Под обран ное значен ие
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49
Номер испыт ание
Рез ульт ат испыт ан ия
Результ ат аппрок симации c использованием bootstrap
375
350
325
300
275
250
225
200
175
150
125
100
75
50
25
0
Эт алонное з начение
Подобранное з начение
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49
Номер испытани я
Рис. 6. Результат аппроксимации (среднее значение ошибки 6%)
Аппроксимация с учетом всех параметров и применением bootstrap. Для увеличения количества
данных можно применить такой метод, как bootstrap. Метод формирования нескольких выборок данных
того же размера, что и исходная генеральная совокупность, но с разными распределениями интересующей
величины. Бутстрэп-метод был предложен в 1977 году Б. Эфроном. Он представляет разновидность
рандомизированной обработки данных.
Предполагается, что множество данных содержит N наблюдений, образующих генеральную
совокупность, из которой извлекаются выборки с возвращением объема N с равными вероятностями (1/N)
извлечения каждого наблюдения. Всего извлекается K выборок, по каждой из них строится оценка
интересующего параметра исходной исследуемой величины, а затем полученные оценки усредняются.
Ансамбли моделей, построенные на бутсрэп-выборках, во многих случаях позволяют улучшить
точность классификации по сравнению с одиночными моделями. Кроме этого, если обучить одну и ту же
модель на нескольких бутстрэп-выборках и усреднить полученные ошибки обучения, то средняя ошибка
будет более достоверной оценкой точности модели.
Рис. 7. Результат аппроксимации (среднее значение ошибки составляет 15%)
Рис. 8. Результат аппроксимации (среднее значение ошибки составляет 5%)
Рез у льт ат аппрок сим ац ии
55
Результат испытания
50
45
40
35
30
Эта л о н н о е зн а чен и е
По д о б р а н н о е зн а че н и е
25
20
15
10
5
0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Ном ер и сп ыт ан и я
Рис. 9. Результат аппроксимации (среднее значение ошибки составляет 22%)
Рис. 10. Результат аппроксимации (среднее значение ошибки составляет 15%)
Из диаграмм видно, что существенное влияние на точность аппроксимации оказывает информация о
прочности на 7-е сутки, что подтверждается и эмпирическими формулами [4]:
Резу льт ат ап р ок си маци и с и сп ользован и ем b oot st r ap
55
50
Реул
зуьт
л ат
ь ти
асп
т ы
ис
пы
Рез
т ан
и тя а н и я
800
700
70
65
600
60
55
500
50
45
400
40
35
300
30
25
200
20
15
100
10
5
00
Резу льт ат испыт ания
Результ ат
45апрок симации без учет а прочност и на 7 сут к и
40ац и я без у чет а п р очн ос т и н а 7-е с у т к и
Ап рок с и м
35
30
Эталон н ое зн ачен и е
Подобр ан н ое зн ачен и е
25
20
Эта ло н н о е зн а че н и е
Эт алонное значение
По доб р а н н о е зн а че н и е
Подобранное значение
15
10
5
0
5 15 16617 18 19
7 20 21822 23 24
0 28 1291 30 311 232 33 1343 35 361 4
0 10 2 3 14 5 62 7 8 39 10 11412 13 14
43 44 4511
46 47 12
48 49
1
2 9 325 261 27
4
5
6
7 37 838 1395 409411 642 10
Номер и сп ы т ан и я
Номер испыт ания
Номер испыт ания
13
14
15
16


σ 28 = σ7 1,84  5  10 3  С3 S ,
где σ 28 - прочность на 28 сутки, σ 7 - прочность на 28 сутки, С3 S
- содержание алита. Преимуществом
данного метода то, что для его применения не требуются знания о процессах, происходящих в
аппроксимируемом процессе. Необходимо лишь достаточное количество данных, для подбора
аппроксимирующей функции. Так же в отличие от методов аппроксимации с помощью базы нечетких
правил [5] и метода наименьших квадратов, результатом работы данного метода является формула, которая
может использоваться в других алгоритмах.
Для улучшения качества аппроксимации данный метод может параллельно работать с базой правил,
составленных из знаний эксперта.
Литература
1.
2.
3.
4.
5.
Poli R.,William B. Langdon, Nicholas F. McPhee J., Koza R. A Field Guide to Genetic Programming.
Сайт компании BaseGroup Labs: http://www.basegroup.ru/glossary/definitions/bootstrap/
Яковис Л.М. Многокомпонентные смеси для строительства. Расчетные методы оптимизации состава – Л.:
Стрройиздат, 1988.
Акиева Е.А. Прогнозирование марочной прочности цементных систем по результатам краткосрочных испытаний и
минералогическому составу: Дисс. канд. техн. наук. спец. 05.23.05 / Е.А. Акиева. Научн. рук. Ш.М. Рахимбаев.
Белгород: БГТУ им. Шухова, 2006.
Борисов В.В., Круглов В.В., Федулов А.С. Нечеткие модели и сети. – М.: Горячая линия – Телеком, 2007.
Download