Интервальный эволюционный алгоритм поиска глобального

реклама
УДК 519.688
Н. В. Панов, С. П. Шарый
Интервальный эволюционный алгоритм
поиска глобального оптимума
(ИВТ СО РАН, КТИ ВТ СО РАН, г.Новосибирск)
Аннотация
Для поиска глобального экстремума функций непрерывного аргумента на брусе со
сторонами, параллельными координатным осям, предлагается интервальная версия
эволюционного алгоритма.
Ключевые слова: интервал, интервальное расширение, глобальная оптимизация,
стохастические алгоритмы, рандомизированные интервальные алгоритмы,
доказательные вычисления, эволюционный алгоритм.
N. V. Panov, S. P. Shary
Interval Evolutionary Algorithm
for Global Optimization
Annotation
This paper considers the problem of rigorous finding of global optima of real-valued
multidimensional function. We propose a new interval algorithm that based on adoptive
splitting of the search area and incorporates evolutionary stratagy.
Keywords: Global optimization, Interval, Interval analysis, Interval computations, Interval
genetic algorithm.
1 Постановка задачи
Предмет настоящей работы – поиск глобального оптимума вещественнозначной
целевой функции
на некотором прямоугольном брусе X
со
сторонами, параллельными координатным осям, который является подмножеством
области определения данной функции:
(1)
Чрезвычайно много задач, возникающих в различных сферах человеческой
деятельности, могут быть сведены к подобной задаче поиска глобального
оптимума. Многомерная оптимизация является неотъемлемой частью важнейших
1
этапов моделирования различных (инженерных, экономических, и т.д.) систем. В
ряде случаях именно сложность возникающей оптимизационной задачи становится
тем ограничением, которое не позволяет исследовать общую постановку проблемы.
К настоящему моменту наработан богатый инструментарий поиска глобального
оптимума [1, 2, 3, 4, 5]. Трудности численного решения оптимизационных задач во
многом связаны с видом оптимизируемой целевой функции. Особенно сложно
решение задач оптимизации в случаях, когда целевая функция невыпукла,
многоэкстремальна или недифференцируема. Далеко не все методы могут
справляться с такими задачами, особенно в случае, когда нам не известна
какая-либо априорная информация о целевой функции. Методы, о которых пойдѐт
речь в статье, работают и для таких тяжелых постановок задач. Единственное
условие, накладываемое в этом случае на целевую функцию состоит в том, что она
должна задаваться явно в виде математического выражения или компьютерной
подпрограммы, состоящих из комбинаций символов переменных, арифметических
операций и математических функций. Это необходимо для вычисления
интервальной оценки области значений функции, подробнее см. в [6].
В ряде задач, возникающих в практике оптимизации, требуется не просто
приближѐнное численное решение, но ещѐ и гарантия его близости к идеальному
математическому оптимуму, а также часто гарантия того, что найденный оптимум
действительно является глобальным, а не одним из локальных. Подобные
постановки задач обычно характеризуют термином «доказательная глобальная
оптимизация»1, и они являются чрезвычайно трудными. Традиционные подходы к
их решению основываются на привлечении той или иной априорной информации о
целевой функции (например, выпуклость, унимодальность, удовлетворение
условию Липшица). Существенное продвижение в решении задач доказательной
глобальной оптимизации связано в последние годы с привлечением методов
интервального анализа. Эти методы позволяют успешно решать задачи с
осложнѐнными целевыми функциями – нелипшицевыми, недифференцируемыми и
т.п. [6].
Традиционно такие алгоритмы основываются на детерминистской вычислительной
схеме, что в некоторых случаях приводит к их недостаточной вычислительной
эффективности [7, 8, 9, 10]. Следуя идеям, впервые сформулированным в [12, 13],
авторы надеются улучшить эффективность доказательных интервальных методов
оптимизации, введя в них вероятностные и эвристические переходы, но не потеряв
при этом гарантированности результатов. Подробнее о недостатках
детерминистских методах читатель может узнать из публикаций [11, 12, 13].
1
По терминологии, введѐнной К.И. Бабенко. См. его книгу «Основы численного анализа», Москва, Наука, 1986.
2
Главное направление наших построений – это комбинирование интервальной
техники оценивания значений целевой функции с так называемыми эволюциоными
вычислениями, эксплуатирующими бионические идеи.
Бионические алгоритмы – это эвристические алгоритмы поиска, так или иначе
использующие для решения задач оптимизации случайный подбор,
комбинирование и вариации входных параметров на основе механизмов,
напоминающих биологическую эволюцию. Идеи применить биологические
механизмы или, скорее, принципы их функционирования для создания новых
алгоритмов возникли с небольшими вариациями практически одновременно у
нескольких авторов. В 1966 году Л. Фогель, А. Оуэнс, М. Уолш предложили схему
эволюции логических автоматов, решающих задачи прогноза [14]. В 1975 году
вышла основополагающая книга Дж. Холланда «Адаптация в естественных и
искусственных системах» [15], в которой был предложен законченный вариант
генетического алгоритма. Примерно в это же время немецкие ученые И. Рехенберг
и Х.-П. Швефель начали разработку так называемой эволюционной стратегии
вычислений [16, 17]. Эти работы заложили основы прикладного эволюционного
моделирования или эволюционных алгоритмов. В нашей стране исследования по
прикладному эволюционному моделированию, идейно близкие к упомянутым
работам Л. Фогеля с сотрудниками, были разносторонне развиты, в частности, в
работах И.Л. Букатовой [18].
Уже первые работы показали, что идея использовать принципы биологической
эволюции оказалась плодотворной. В настоящее время множество разновидностей
бионических алгоритмов (главным образом, «генетические» и «поведенческие»)
используются в самых разнообразных ситуациях, в том числе и для решения задач
глобальной оптимизации [3, 19, 20]. Различные бионические алгоритмы
продемонстрировали свою практическую эффективность для решения
оптимизационных задач и снискали себе заслуженную популярность, но все они
используют точечное оценивание целевой функции. Настоящая статья посвящена
описанию нового интервального бионического алгоритма, использующего
эволюционную организацию вычислений вкупе с интервальными методами.
2 Общее описание алгоритма и основ интервального анализа
Каким-либо образом, чаще всего случайно, задается начальная «популяция» – некое
множество объектов. Они оцениваются с использованием «функции
приспособленности», в результате чего каждому объекту присваивается
определѐнное значение (приспособленность), которое определяет вероятность
выживания организма, представленного данным объектом. После этого с
3
использованием полученных значений приспособленности выбираются объекты
(производится селекция), допущенные к «размножению». Также к этим объектам
могут применяться «генетические операторы» (в большинстве случаев это так
называемое «скрещивание» – crossover и «мутация» – mutation). Особи следующего
поколения также оцениваются, затем снова производится селекция, применяются
генетические операторы и т. д. Так моделируется «эволюционный процесс»,
продолжающийся несколько жизненных циклов (поколений) до тех пор, пока не
будет выполнен критерий остановки алгоритма. На листинге 1 приведены
основные этапы эволюционного алгоритма.
Листинг 1 . Эволюционный алгоритм.
1. Создание начальной популяции.
2. Вычисление функций приспособленности для особей популяции
(оценивание).
(Начало цикла)
(a) Выбор индивидов из текущей популяции (селекция).
(b) Формирование нового поколения.
(c) Применение генетических операторов, например, мутации.
(d) Вычисление функций полезности для всех особей.
(e) Если достигнуто условие останова, то решение найдено
(конец цикла),
если нет, то цикл повторяется.
(Конец цикла)
Этап мутаций не обязателен. С одной стороны он позволяет повысить
рандомизацию метода, увеличить вариабельность популяции и избежать застоя
вблизи локальных оптимумов. Кроме того, в классических генетических
алгоритмах операции мутации и скрещивания могут порождать новые решения,
которые никогда не встречались в предыдущих поколениях. Подробнее о
генетических операторах см. [19, 20]. Интервальный алгоритм, описываемый в
настоящей статье их не использует. Тем не менее, в отличии от классических
вариантов он позволяет найти именно глобальный оптимум. Прежде чем подробнее
рассмотреть вычислительную схему алгоритма, дадим ряд необходимых понятий
из интервального анализа.
Интервал x – это замкнутый отрезок вещественной оси
, так что
а и называются, соответственно, левым (или нижним) и правым (или верхним)
концами интервала. Многомерные интервалы (также называемые брусами)
4
определяются как векторы (вектор-столбцы или вектор-строки) с интервальными
компонентами. Интервальные величины мы будем обозначать жирным шрифтом.
Задача об определении области значений функции на том или ином подмножестве
области еѐ определения эквивалентна двум задачам оптимизации: для непрерывной
функции
где через
обозначена область значений функции
на
брусе . В интервальном анализе задача определения области значений сводится к
задаче о вычислении так называемого интервального расширения функции.
Обозначим через
множество всех интервальных векторов-брусов,
содержащихся во множестве
. Напомним
Определение 1.1 . Пусть
Интервальная функция f
вещественной функции
– непустое подмножество пространства
.
называется интервальным продолжением
, если f
для всех
.
Определение 1.2 [5, 6, 7, 21, 22, 23]. Пусть
непустое подмножество
пространства
. Интервальная функция f
называется
интервальным расширением вещественной функции
, если
1) f
– интервальное продолжение
на ,
2) f
монотонна по включению, т.е.
f
f
на
.
Таким образом, если f
– интервальное расширение функции
, то для
области значений
на брусе
мы получаем следующую внешнюю (с
помощью объемлющего множества) оценку:
В частности, если f – интервальное расширение целевой функции
то для еѐ решения справедлива оценка
из задачи (1),
Развитие эффективных методов построения интервальных расширений функций –
это важнейшая задача интервального анализа и его приложений. Поиски еѐ
различных решений продолжаются и в настоящее время. Приведѐм в рамках
нашего беглого обзора некоторые общезначимые результаты на эту тему. Первый
из них часто называют «основной теоремой интервальной арифметики»:
5
Теорема [1, 4, 5, 7, 21, 22]. Если для рациональной функции
на интервале
определѐн результат
подстановки вместо еѐ
аргументов
интервалов их изменения и выполнения всех
действий над ними по правилам интервальной арифметики, то
т.е.
содержит множество значений функции
на .
Нетрудно понять, что по отношению к рациональной функции
интервальная
функция
, о которой идѐт речь в Теореме, является интервальным
расширением. Оно называется естественным интервальным расширением и
вычисляется совершенно элементарно.
Важной особенностью интервальных оценок области значений функции является
свойство их асимптотической точности (доказательство заинтересованный
читатель может найти, к примеру, в [4, 5, 6]): если
– какое-либо интервальное
расширение функции
на брусе , то, как правило,
(2)
где
– расстояние между интервалами, определяемое как
.
Это свойство означает, что при уменьшении размеров области определения
точность интервального расширения функции увеличивается. При этом не следует
ожидать, что уменьшение размеров конкретного бруса области определения в
какое-то число раз приведѐт к пропорциональному улучшению реальной точности
конкретной интервальной оценки. Приведѐнное соотношение является, во-первых,
всего лишь оценкой сверху, и, во-вторых, носит асимптотической характер. Тем не
менее, отмеченный факт может быть положен в основу процедуры уточнения
интервальной оценки области значений функции.
В самом деле, если разбить исходный брус
объединении весь , то есть такие, что
на два подбруса
, то
и
, дающие в
Соответственно, можно вычислить интервальные расширения по каждому
подбрусу, и в качестве новой оценки минимума целевой функции на взять
m
6
Она будет, вообще говоря, более точна, чем исходная оценка f , так как у брусов
и
размеры меньше, чем у исходного . Брусы-потомки
и
можно, в
свою очередь, опять разбить на более мелкие части, найти для них интервальные
расширения и далее уточнить оценку для минимума, потом снова повторить
процедуру и так далее. По такой схеме, фактически, действуют все интервальные
методы глобальной оптимизации, основанные на адаптивном дроблении исходной
области определения в соответствии со стратегией «метода ветвей и границ».
3 Интервальный эволюционный алгоритм
В интервальном эволюционном алгоритме исходная область поиска по-прежнему
разбивается на непересекающиеся подобласти – брусы. Каждый такой брус в
описываемой здесь разновидности эволюционного алгоритма выступает в качестве
«особи». При этом, как и в классическом случае, при запуске работы алгоритма
каким-либо способом требуется задать начальную популяцию. Сделать это можно
совершенно произвольным образом, т.к. выбор начальной популяции практически
никак не сказывается на дальнейшей работе алгоритма. При желании этот шаг
вообще можно пропустить, приняв брус исходной области поиска за единственную
существующую особь.
В качестве меры приспособленности особи можно выбрать нижнюю границу (для
определѐнности рассматриваем поиск минимума) интервальной оценки целевой
функции на соответствующем брусе. Чем лучше мера приспособленности (чем
меньше нижняя граница в привычных терминах), тем больше шансов у данной
особи размножиться (данному брусу быть раздробленным) и тем многочисленнее
будет потомство (брус может быть раздроблен на большее количество подбрусов).
Для сохранения доказательности вычислений (которая является характерной
чертой интервальных методов), мы не исключаем из рассмотрения никакие
подобласти исходной области поиска до тех пор, пока не будет доказано что они
гарантированно не содержат оптимум. Подробнее о различных подходах к
выявлению бесперспективности брусов (их называют ещѐ «критериями
отбраковки»), можно прочитать, например, в [11]. Таким образом, в алгоритме
особи либо рождаются нежизнеспособными (не выдерживают критериев
отбраковки, применяемых сразу после дробления), либо погибают в результате
«эпидемий» – срабатывания уточненных критериев отбраковки при дальнейшем
исполнении алгоритма.
Листинг 2. Схема интервального генетического алгоритма.
Задаѐтся начальная популяция и передаѐтся в основной цикл
7
Основной цикл
{
1. Вычислить
значения
функции
приспособленности
новорожденных особей (этот шаг включает вычисление
интервального расширения целевой функции по новым
подбрусам,
как
необходимое
для
определения
приспособленности).
2.
из наиболее приспособленных брусов с вероятностью
порождают от
до
потомков.
3.
из неприспособленных брусов с вероятностью
порождают от
до
потомков.
4. Потомки проверяются на жизнеспособность
(применяются интервальные критерии отбраковки).
5. Если критерий отбраковки был уточнѐн, возможно
случается эпидемия (улучшенные критерии применяются ко
всем особям).
}
В этой схеме имеется несколько параметров, существенным образом влияющих на
работу алгоритма:
• вероятности
и
;
• максимальные количества потомков
и
;
• минимальное количество потомков
и
;
• величина , определяющая количество объектов, начиная с самого
приспособленного, которые могут оставить потомство;
• брусы дробятся на равные части, или разбиение происходит в случайной
пропорции, «разновесные» дети;
• количество «особей» в начальной популяции.
Заметим, что если скорректировать условия работы алгоритма таким образом,
чтобы потомки были равноправны и их было обязательно двое, но оставить
потомство мог лишь «вожак» (т.е. самый приспособленный), то в более привычных
терминах это будет звучать как «на каждой итерации дробится брус с наименьшей
нижней оценкой». В этом случае реализуется детерминистская вычислительная
схема классического интервального адаптивного дробления, в основе которой
лежит «метод ветвей и границ».
В качестве меры приспособленности мы использовали в алгоритме нижнюю
границу интервальной оценки функции на подбрусе (оценку оптимума на подбрусе
снизу). С тем же успехом можно опираться и на ширину интервальной оценки или
8
же на размер бруса. Несмотря на то, что все три метода очень похожи и критерии,
которыми они руководствуются, направлены на достижение одной и той же цели,
работают они по-разному. Таким образом, следующим логичным шагом является
объединение этих методов в один, использующий преимущества каждого.
Рис. 1: Блок-схема интервального генетического алгоритма
9
Блок-схема объединѐнного алгоритма показана на рис. 1. Функция
приспособленности бруса (при поиске минимума) приобретает следующий вид:
(3)
Здесь
f b – интервальная оценка области значений целевой функции на брусе b;
– нижняя граница интервальной оценки (оценка минимума снизу);
– ширина (точность) интервальной оценки области значений;
– ширина i-ой компоненты бруса области определения;
, ...,
– соответствующие весовые коэффициенты.
Необходимо заметить, что поведение алгоритма очень сильно зависит от величин
коэффициентов и авторам представляется перспективным реализация подобного
алгоритма с использованием интервальных параметров, равно как и разработка
мета-алгоритма, адаптивно оптимизирующего параметры эволюционного
алгоритма в процессе решения конкретных задач.
Библиографический список
[1]
[2]
[2]
[4]
[5]
[6]
[7]
[8]
[9]
Сергеев Я.Д., Квасов Д.Е. Диагональные методы глобальной
оптимизации.– М.: Физматлит, 2008.
Diwekar U. Introduction to Applied Optimization – Springer, 2008.
Zhigljavsky A., Zilinskas A. Stochastic Global Optimization – Springer, 2008.
Hansen E., Walster G. Global Optimization Using Interval Analysis. – New
York: Marcel Dekker, 2004.
Moore R.E., Kearfott R., Cloud M.J. Introduction to Interval Analysis – SIAM,
2009.
Шарый С.П. Конечномерный интервальный анализ. – Новосибирск: XYZ,
2011. – Электронная книга, доступная на
http://www.nsc.ru/interval/index.php?j=Library/InteBooks/index.
Калмыков С.А., Шокин Ю.И., Юлдашев З.Х. Методы интервального
анализа. – Новосибирск: Наука, 1986.
Панов Н.В. Гибкость и гарантированность. Интервальные стохастические
методы поиска оптимума // IX Всероссийская конференция молодых ученых
по математическому моделированию и информационным технологиям,
Кемерово, 28–30 октября 2008 г. Программа и тезисы докладов. –
Кемерово: КемГУ, 2008. – С.101–102.
Панов Н.В. Объединение стохастических и интервальных подходов для
решения задач глобальной оптимизации функций // Вычислительные
технологии. – 2009. – Т. 14, № 5. – С. 49–65.
10
[10] Панов Н.В., Шарый С.П. Развитие стохастических подходов в
интервальной глобальной оптимизации // VIII Всероссийская конференция
молодых учѐных по математическому моделированию и информационным
технологиям, Новосибирск, 27–29 ноября 2007 г. Программа и тезисы
докладов. – Новосибирск, 2007. – С. 22.
[11] Панов Н.В., Шарый С.П. Стохастические подходы в интервальных методах
глобальной оптимизации // Всероссийское (с международным участием)
совещание по интервальному анализу и его приложениям ИНТЕРВАЛ-06,
1–4 июля 2006 года, Петергоф, Россия. Расширенные тезисы докладов. –
Санкт-Петербург: ВВМ, 2006. – С. 101–105.
[12] Шарый C.П. Стохастические подходы в интервальной глобальной
оптимизации // Труды XIII Байкальской международной школы-семинара
«Методы оптимизации и их приложения», Иркутск–Северобайкальск, 2–8
июля 2005 года. Том 4 «Интервальный анализ». – Иркутск, ИСЭМ СО РАН,
2005. – С. 85–105.
[13] Шарый C.П. Рандомизированные алгоритмы в интервальной глобальной
оптимизации // Сиб. Журнал Вычисл. Матем. – 2008. – Том 11, № 4. – С.
457–474.
[14] Фогель Л., Оуэнс А., Уолш М. Искусственный интеллект и эволюционное
моделирование. – М.: Мир, 1969.
[15] Holland J. Adaptation in Natural and Artificial Systems. – University of
Michigan Press. 1975.
[16] Rechenberg I. Evolutionstrategie: Optimierung technischer Systeme nach
Prinzipien der biologischen Evolution. – Stuttgart: Fromman-Holzboog, 1973
(1993 –
edition).
[17] Schwefel H.-P. Numerische Optimierung von Computer-Modellen mittels der
Evolutionsstrategie. – Basel: Birkhaeuser, 1977.
[18] Букатова И.Л. Эволюционное моделирование и его приложения. – Москва:
Наука, 1979.
[19] Гладков Л. А., Курейчик В. В, Курейчик В. М. и др. Биоинспирированные
методы в оптимизации. – Москва: Физматлит, 2009.
[20] Fogel D.B. Evolutionary Computation: Toward a New Philosophy of Machine
Intelligence. – IEEE Press, Piscataway, NJ. Third Edition, 2006.
[21] Kearfott R.B. Rigorous Global Search: Continuous Problems. – Dordrecht:
Kluwer, 1996.
[22] Neumaier A. Interval Methods for Systems of Equations. – Cambridge:
Cambridge University Press, 1990.
[23] Ratschek H., Rokne J. New Computer Methods for Global Optimization. –
Chichester, New York: Ellis Horwood, Halsted Press, 1988.i
Статья опубликована в журнале «Известия Алтайского государственного университета», 2011 год, № 1(69),
том 2, стр. 108-113.
11
Скачать