Казаков О.Л., Царькова Н.И.

Реклама
Казаков О.Л., Царькова Н.И.
ТЕОРИЯ
ОПТИМАЛЬНОГО
УПРАВЛЕНИЯ
В
ЭКОНОМИКЕ: Учебно-методическое пособие. М.: МГИУ,
2009, (Аннотация)
В пособии изложены основные положения курса «Теория оптимального управления (в промышленном менеджменте, экономических систем)».
Собраны теоретические сведения о наиболее распространенных современных методах оптимального управления в экономике, а также материалы по методике их практического освоения. Пособие включает вопросы
для самопроверки усвоения теоретических положений, примеры решения
задач и задания для самостоятельной работы.
Содержание
Введение………………………………………………………………….. 4
1. Модели оптимизации в экономике…………………………………..10
1.1. Задача об использовании ресурсов (оптимального планирования
производства)………………………………………………………………….10
1.2. Задача определения объема выпуска валовой продукции…….11
1.3. Задача оптимального распределения валовых капитальных
вложений………………………………………………………………………13
1.4. Задачи условной оптимизации…………………………………..15
1.5. Метод множителей Лагранжа…………………………………..16
Вопросы для самопроверки…………………………………………….17
Примеры решения задач……………………………………………….18
Задания для самостоятельной работы…………………………………24
2. Экономика как объект математического моделирования…………38
2.1. Схема производства и распределения продукции, накопления и
потребления………………………………………………………………….38
2.2. Классификация моделей экономических систем…………….40
2.3. Разновидности структурных схем управления экономическими
системами……………………………………………………………………42
2.4. Формализованная производственно-технологическая модель
экономики…………………………………………………………………..44
2.5. Задачи оптимизации и оптимального управления в экономике…………………………………………………………………………….47
Вопросы для самопроверки………………………………………….51
3. Модели оптимального управления в экономике………………..53
3.1. Задача оптимального управления развитием экономики….53
3.2. Модель развития экономики: магистральная теория………55
3.3. Задача оптимального управления распределением
валовых капитальных вложений……………………………………56
3.4. Общий вид задачи оптимального управления………………58
3.5. Метод решения задачи оптимального управления…………59
3.6. Принцип максимума Понтрягина……………………………60
3.7. Синтез оптимального управления……………………………61
Вопросы для самопроверки………………………………………….62
Примеры решения задач……………………………………………..63
Задания для самостоятельной работы………………………………70
Заключение……………………………………………………………72
Приложения……………………………………………………………74
2
Приложение 1. Решение задач линейного программирования в
OpenOffice.org Calc…………………………………………………………75
Приложение 2. Планирование центром оптимального распределения
капитальных вложений между предприятиями методом динамического
программирования………………………………………………………….80
Приложение 3. Применение метода ДП для поиска оптимального
управления предприятием…………………………………………………87
Приложение 4. Учет начальных условий. Траектория выхода на магистраль……………………………………………………………………….93
Приложение 5. Постановка задачи и критерии оптимального управления в динамических системах…………………………………………….99
Приложение 6. Построение траекторий управляемых процессов…114
Приложение 7. Поиск оптимального управления непрерывными детерминированными процессами методами Лагранжа-Понтрягина……..125
Приложение 8. Принцип максимума для дискретных систем……133
Приложение 9. Постановка и решение задачи оптимального управления непрерывными процессами методом ДП в общем виде………….143
Список литературы…………………………………………………….146
3
ВВЕДЕНИЕ
Экономика служит для удовлетворения потребностей общества в
предметах потребления. Внешняя среда существования национальной
экономики включает природу, мировую экономику и общество.
Элементами экономики являются хозяйственные единицы (предприятия,
фирмы, банки и т.п.). Они объединяются в две основные подсистемы
экономики - производственную и финансово-кредитную.
Эффективность экономики зависит от продуктивности хозяйственных
единиц, взаимоотношений между ними и влияния внешней среды. Эта
зависимость
выражается
устойчивыми
количественными
закономерностями, следовательно, может
быть представлена
математическими моделями.
Под управлением экономикой понимается организация процессов для
достижения установленной цели. Оптимальное управление представляет
выработку непрерывной во времени функции управления, позволяющей
поддерживать экономику в таком состоянии, которое выражается
непрерывной во времени функцией и соответствует установленному
критерию оптимальности.
В настоящее время весьма важным и актуальным является вопрос о
практической значимости математических методов для решения
различных экономических задач. Подобные вопросы, обостряемые
господствующей в настоящее время прагматичностью и утилитарностью
мышления,
закономерно
возникают
у
студентов,
изучающих
соответствующий материал. Ответ на поставленный вопрос является
актуальным и для различного ранга руководителей и специалистов,
находящихся в условиях постоянного поиска путей повышения
эффективности функционирования руководимых ими экономических
структур. Остановимся кратко на данной проблеме, поскольку ее
сложность и многоплановость приводят к существованию различных точек
зрения.
Прежде всего, подчеркнем, что удивительно высокая эффективность
математики в естественных и технических науках постоянно подтверждается всей практической деятельностью человека; подчас даже выдающиеся ученые нашего времени пишут эмоциональные статьи о «непостижимой эффективности математики в естественных науках». Наиболее
грандиозные технические проекты XX века — развитие авиации, освоение
атомной энергии, выход в космос — без использования мощного
математического инструментария не могли бы быть осуществлены в современном виде и качестве при минимальном количестве катастрофических ошибок. Для экономических наук и экономики вообще дело обстоит
сложнее, однако даже самый общий взгляд на проблему приводит к осознанию того, что тезис о возможной высокой эффективности математики в
экономике является вполне естественным и логичным. Действительно, вся
4
математика изначально и многие ее разделы впоследствии своим
происхождением и развитием обязаны именно практической,
хозяйственной, экономической жизни общества. Выйдя из самих ее основ
и неоднократно пройдя классический цикл «от живого созерцания к
абстрактному мышлению и от него к практике», развив в себе мощные
количественные методы анализа, математика не может не найти
эффективные приложения в самых различных сферах человеческой
деятельности. Данное обстоятельство подчеркивает, в частности,
неправомерность острого противопоставления математики и реального
мира, равно как теории и практики вообще.
В то же время, справедливость общих положений еще не означает их
безусловного приоритета в каждом конкретном случае, а любой метод в
любой области знания имеет свою сферу применения, подчас весьма
ограниченную. По этим причинам не следует преувеличивать и тем более
абсолютизировать роль и возможности математических методов и
математики вообще — возникающие «натяжки» легко выявляются и
вызывают у обучающихся негативное отношение к предмету. Как
показывает практика, существует широкий класс экономических структур,
управление которыми осуществляется на интуитивном уровне без какоголибо использования математических моделей и методов и дает вполне
приемлемые результаты. К таким структурам относятся, как правило,
организации, работа которых трудно поддается формализации и не может
быть описана четкими количественными показателями и критериями, либо
отдельные предприятия мелкого масштаба. Применение математики в
организациях и на предприятиях такого типа сводится к элементарным
арифметическим расчетам в рамках задач бухгалтерского учета. Данные
обстоятельства создают и укрепляют иллюзию возможности успешного
управления любыми экономическими системами без использования какойлибо серьезной математики вообще.
Однако такая точка зрения является излишне упрощенной: имеющиеся примеры не умаляют прикладных возможностей математики, а
лишь свидетельствуют о возможности и функционирования некоторых
экономических структур без должного математического обеспечения,
оставляя при этом открытым вопрос об эффективности самого функционирования. Ситуация кардинально меняется при управлении экономическими и техническими системами, характеризующимися сложной
организационной структурой, высоким уровнем технической оснащенности, широким диапазоном возможных производственных ситуаций,
быстрым изменением условий функционирования. В таких условиях интуиция, догадка, «чутье» как основа принятия управленческих решений —
несмотря на отдельные достоинства интуитивного подхода — зачастую
оказываются малопродуктивными! Действительно, интуиция формируется
лишь на основе ранее приобретенного опыта и накопленных знаний в той
или иной сфере деятельности, что требует значительных временных
5
затрат, сопряжено с неизбежными ошибками в управлении и
сопровождается устойчивым снижением экономической эффективности. В
жестких экономических условиях данный путь может «слишком дорого
стоить» и оказаться непозволительной роскошью. Более того, для
целесообразного управления сложными экономическими системами
недостаточно ведущихся на каждом предприятии бухгалтерских расчетов,
которые лишь отражают сложившееся положение вещей и не ориентированы на поиск оптимальных управленческих решений (хотя исходные данные и результаты таких расчетов могут служить материалом
для реализации оптимизационных задач управления).
Ошибки в управлении сложными дорогостоящими или даже уникальными экономическими системами имеют чрезвычайно высокую цену.
Для исключения или, по меньшей мере, снижения риска возникновения
таких ошибок неизбежно приходится прибегать к использованию
математических моделей, уматывающих и выражающих в математической
форме весь спектр существенных соотношений между различными
количественными характеристиками и параметрами управляемых систем и
окружающего их реального мира. Иными словами, математическая модель
представляет собой математическое описание исследуемых систем,
процессов или явлений (конечно, не абсолютно точное, а приближенное).
Задачи
управления,
опирающиеся
на
грамотно
построенные
математические модели, приводят к достоверным, приемлемым для
практического применения результатам, однако являются весьма
сложными, и для их решения, как правило, не существует простых
рецептов и явных формул. Тем самым объективно возникает потребность в
разработке специальных математических методов решения поставленных
задач.
Как показывает история науки последнего времени, рациональное
применение математических методов может дать исключительно весомый
дополнительный экономический эффект, многократно окупающий затраты
на постановку и исследование задачи управления, разработку или
адаптацию метода ее решения и реализацию его на ЭВМ. Не случайно
современный развитый мир является свидетелем нарастающего процесса
математизации широкого спектра наук: экономических, социальных и
даже чисто гуманитарных, не говоря уже о естественных и технических.
При этом проявляется следующая общая закономерность: чем крупнее
масштаб управляемых систем, тем более весомый экономический эффект
дает применение математических методов не только в абсолютном, но и в
относительном исчислении.
Ускоренному проникновению математики в различные сферы деятельности человека в значительной степени способствует бурное развитие
компьютерных технологий. Само появление ЭВМ с их большой
вычислительной мощностью позволило ставить и решать столь сложные
задачи, подступиться к которым без помощи ЭВМ было совершенно
6
немыслимо. Обрела практический смысл разработка сложных математических методов и алгоритмов управления, значительная часть которых
без привязки к ЭВМ превращается в отвлеченное формализованное
построение. Как признают многие ведущие ученые мира, целенаправленное использование вычислительной мощности ЭВМ является принципиально новым методом познания реального мира: огромный количественный рост производительности вычислений привел к качественным
сдвигам в науке в целом и в математике в частности. В современных
условиях математические методы реализуются, как правило, в виде
специального программного обеспечения для ЭВМ и их наиболее
широкого класса — персональных компьютеров. Важно заметить, что при
этом многие сложности и специфика реализуемых математических
методов скрываются за фасадом простого и удобного пользовательского
программного интерфейса; часто складывается обманчивое впечатление,
что математика не играет здесь никакой существенной роли, хотя дело
обстоит совершенно наоборот!
Математическим методам свойственно различаться глубиной логического анализа. В связи с этим подчеркнем, что любую задачу управления
с достаточной для практических целей точностью можно решить путем
последовательного рассмотрения всех допустимых вариантов управления,
или методом перебора (если множество допустимых вариантов
бесконечно, то перебор проводится с некоторым малым приращением
значений управляющих параметров). Логика метода перебора является
наиболее простой и, тем самым, весьма привлекательной для реализации.
Однако за внешней простотой данного метода скрывается следующая
серьезная проблема: объем вычислительных работ, связанных с простым
перебором, для сложных реальных задач может оказаться столь велик, что
с его проведением в разумные приемлемые сроки не смогут справиться
даже самые мощные ЭВМ. В то же время практическую значимость
представляет не столько потенциальная, сколько актуальная разрешимость
задачи: решение задачи управления, являясь оптимальным или близким к
таковому, должно быть получено оперативно, в режиме «реального
времени», иначе оно устареет и потеряет свою значимость еще до окончания поиска решения. В соответствии с данным обстоятельством возникает объективная необходимость в разработке иных более эффективных
методов решения, пусть логически более сложных, но позволяющих
снизить трудоемкость вычислений.
Отметим, что методологическая проблема выбора наиболее адекватной формы изложения сложных математических дисциплин для студентов
экономических специальностей не является окончательно решенной.
Ограниченность часов на изучение темы, сильно варьирующийся уровень
математической подготовки студентов, да и сами цели обучения
студентов-экономистов требуют специального подхода к преподаванию. В
этих условиях особую важность приобретают вопросы соблюдения
7
баланса между строгостью и доступностью изложения, а неизбежный
отказ от излишней формализации и строгих доказательств не должен
сопровождаться потерей логики и стройности изложения.
Высокая потенциальная эффективность математизации не реализуется
самопроизвольно, а требует подготовки математически грамотных
специалистов. Подчас даже неглубокой математической подготовки
достаточно, чтобы понять, на каком направлении деятельности
предприятия или организации могут быть полезны математические
оценки, прогнозы и оптимизация. Напротив, недостаточный уровень
подготовки и понимания возможностей математики может служить
причиной отказа от применения математических методов даже в тех
случаях, когда они заведомо позволят выявить скрытые резервы и дать
значительный дополнительный экономический эффект.
Не подлежит сомнению, что изучение математики формирует системность и аналитичность мышления, исключительно важные для специалистов любых направлений. При этом важно показать, что математика
не есть «абстрактное искусство», демонстрирующее излишнее усложнение
действительности, — ее изучение позволяет овладеть мощными методами
количественного анализа, имеющими широкие практические приложения.
Данное положение во многом определяет отношение студентовэкономистов ко всему циклу математических дисциплин.
Экономика служит для удовлетворения потребностей общества в
предметах потребления. Внешняя среда существования национальной
экономики включает природу, мировую экономику и общество.
Элементами экономики являются хозяйственные единицы (предприятия,
фирмы, банки и т.п.). Они объединяются в две основные подсистемы
экономики - производственную и финансово-кредитную.
Эффективность экономики зависит от продуктивности хозяйственных
единиц, взаимоотношений между ними и влияния внешней среды. Эта
зависимость
выражается
устойчивыми
количественными
закономерностями, следовательно, может
быть представлена
математическими моделями.
Под управлением экономикой понимается организация процессов для
достижения установленной цели. Оптимальное управление представляет
выработку непрерывной во времени функции управления, позволяющей
поддерживать экономику в таком состоянии, которое выражается
непрерывной во времени функцией и соответствует установленному
критерию оптимальности.
Для изложения теории оптимального управления используется
следующая схема. В первой части курса лекций приводятся характерные
модели оптимизации в экономике, служащие базой для постановки задач
оптимального управления и их решения. Во второй части экономика
рассматривается как объект математического моделирования. Даются
основные понятия и обозначения. Определяются задачи оптимизации и
8
оптимального управления в экономике. В заключительной третьей части
строятся
модели
оптимального
управления
в
экономике
и
рассматриваются принципы их решения.
Для изложения теории оптимального управления используется
следующая схема. В первой части курса лекций приводятся характерные
модели оптимизации в экономике, служащие базой для постановки задач
оптимального управления и их решения. Во второй части экономика
рассматривается как объект математического моделирования. Даются
основные понятия и обозначения. Определяются задачи оптимизации и
оптимального управления в экономике. В заключительной третьей части
строятся
модели
оптимального
управления
в
экономике
и
рассматриваются принципы их решения.
9
1. МОДЕЛИ ОПТИМИЗАЦИИ В ЭКОНОМИКЕ
1.1. Задача об использовании ресурсов (оптимального
планирования производства)
Будем рассматривать статическую задачу планирования, в которой
параметры остаются неизменными на всем плановом периоде.
Пусть конечный продукт Y как часть валового продукта X состоит
из n видов продукции (номенклатура продукции). Целью увеличения
объема конечного продукта, а следовательно, и валового продукта
выберем максимизацию дохода (выручки) от реализации этой продукции.
c
Если j - доход (выручка, цена) от реализации единицы продукции j -
x
ого вида ( j  1, 2,..., n  11n  1, n ). Тогда, если планируется выпустить j
единиц продукции j -ого вида, то суммарный доход по всем видам
продукции будет выражаться величиной:
n
cj  xj
j 1
.
Отсюда целевая функция примет вид:
n
Z   c j  x j  max
j 1
.
Объем выпускаемой продукции зависит от используемых ресурсов и
основных производственных фондов (ОПФ). Поэтому, если для
производства используются m видов ресурсов и их затраты для выпуска
единицы продукции определяются ОПФ, то можно ввести следующие
обозначения:
bi - имеющийся запас (резерв) i -ого вида ресурсов;
a ij
- количества единиц, или объем i -ого вида ресурсов,
затрачиваемой, или расходуемый на выпуск одной единицы j -ого вида
продукции.
Тогда объем выпускаемой продукции зависит от следующих
ограничений:
n
 aij  x j  bi
i  1, m .
,
Доход от реализации выпускаемой продукции зависит от спроса на
нее. Обозначим объем спроса на продукцию j -ого вида через число
d
единиц продукции этого вида j . Тогда ограничения по спросу примут
вид:
xj  dj
j  1, n .
,
j 1
10
Следует оговориться, что данные о спросе на продукцию
прогнозируются или определяются полученными заказами. Если спрос
превышает предложение, то соответствующие ограничения могут
отсутствовать.
Наконец, введем стандартные ограничения на неотрицательность
переменных, имеющие ясный прикладной смысл:
xj  0
j  1, n .
,
Таким образом, задача об использовании ресурсов сформулирована
полностью и имеет общий вид:
n
Z   c j  x j  max
j 1
при ограничениях
n
 aij  x j  bi
j 1
,
xj  dj
xj  0
,
i  1, m ;
j  1, n ;
j  1, n .
,
Эта задача относится к задачам линейного программирования и
решается
универсальным
симплекс-методом
(Приложение
1).
Оптимальное решение задачи позволяет провести анализ его на
чувствительность к изменениям исходных условий, т.е. выявить
недефицитные ограничения, что может позволить уменьшить запас
имеющихся ресурсов, а следовательно, снизить расходы на их
приобретение и хранение.
Однако некоторые непредвиденные изменения исходных данных
такой статической задачи в ходе планового периода могут привести к
тому, что полученное оптимальное решение - оптимальный план окажется
нереализуемым и потребуется его корректировка.
1.2. Задача определения объема выпуска валовой
продукции
Будем рассматривать валовый продукт X как единое целое без
разделения его на виды продукции. Вместе с тем будем учитывать, какая
отрасль (предприятие, цех) выпускает этот продукт. Тогда весь валовый
продукт может быть представлен вектором в матричном виде:
 X1 
X 
X n , 1    2 
 ... 
 Xn ,
11
где X i - стоимость валового продукта, выпускаемого i -ой отраслью,
i  1, n .
Для выпуска i -ой отраслью валового продукта X i ей нужно
воспользоваться в качестве производственного потребления частью
X
валового продукта j , выпущенного как ей самой ( i  j ), так и другими
x
отраслями ( i  j , j  1, n ). Размер такой части ij определяется с помощью
a
коэффициента прямых затрат ij (коэффициент прямых материальных
производственных затрат):
x ij  a ij  X j
,
a
где ij показывает стоимость части продукции j -ой отрасли,
непосредственно затрачиваемой в качестве предметов труда не выпуск
единицы стоимости продукции i -ой отрасли.
Коэффициенты прямых затрат могут быть сведены в матрицу:
 a 11 a 12 ... a 1 j ... a 1 n 


 a 21 a 22 ... a 21 ... a 2 n 
An ,n   a ij    . . . . . . 
 a i 1 a i 2 ... a ij ... a in 
 . . . . . . 
 a a ... a ... a 
nj
nn 
 n1 n 2
.
Тогда балансовое соотношение может записано в следующем
матричном виде:
X  A X  Y .
Можно считать, что объем конечного продукта Y определяется
заказами. Требуется найти, какой объем валового продукта X обеспечит
выполнение этих заказов.
Преобразования приведенного балансового соотношения приводят к
выражению валового продукта X через конечный продукт Y :
X  A X Y ,
E  A  X  Y ,
X  E  A  Y ,
 1 0 ... 0 


En ,n    0 1 ... 0 
. . . .
 0 0 ... 1 

 - единичная матрица.
где
Получена новая матрица коэффициентов в виде обратной матрицы:
1
Bn,n   bij   E  A
.
1
12
Эта матрица B называется матрицей коэффициентов полных затрат,
или обратной матрицей Леонтьева. Коэффициент полных материальных
b
затрат ij показывает потребность в валовом выпуске продукции i - ой
отрасли для производства единицы конечной продукции j -ой отрасли.
1.3. Задача оптимального распределения валовых
капитальных вложений
Валовые капитальные вложения I (инвестиции) идут на поддержание
и развитие основных производственных фондов (ОПФ) K . Это
способствует увеличению выпуска валового продукта X , т.к. одним из
основных аргументов производственной функции F является ОПФ K .
Следовательно, от того, как будут распределяться валовые капитальные
вложения I , будет зависеть увеличение валового продукта X со всеми
вытекающими из этого последствиями, в частности, объема
W,
Y,
производственного
потребления
конечного
продукта
непроизводственного потребления C и самих валовых капитальных
вложений I .
Рассмотрим задачу распределения валовых капитальных вложений
как статическую задачу, т.е. без учета времени, необходимого для
освоения выделяемых инвестиций I , а следовательно, и необходимого для
увеличения X .
Сформулируем эту задачу следующим образом.
Для реконструкции n заводов выделено y 0 капиталовложений. Если
i -ому заводу выделяется x i капиталовложений, то на нем увеличивается
выпуск продукции до величины z i  x i  . Требуется найти вариант
распределения капиталовложений, при котором суммарное увеличение
выпуска продукции всеми n заводами максимально.
Обозначим:
z 1...n  y0  - суммарное увеличение выпуска продукции всеми n
заводами при распределении между ними y 0 капиталовложений,
x n   x 1 , x 2 ,..., x k ,..., x n 
n
распределение
по
заводам
капиталовложений.
Тогда задачу можно представить в виде задачи математического
программирования:
z1...n  y0   max  z i  x i 
n
x
n
i 1
при ограничениях
13
n
 x i  y0
i 1
,
x i  0 , i  1, n .
При любом представлении функций z i  x i  , i  1, n , решение этой
задачи сопряжено со значительными трудностями. Поэтому представим ее
моделью динамического программирования.
Методы динамического программирования применяются для
повышения
эффективности
вычислений
при
решении
задач
математического программирования путем их разложения (декомпозиции)
на менее сложные подзадачи. Как правило, решение общей задачи
математического программирования представляется последовательностью
его этапов. Каждому такому этапу ставится в соответствие частная
подзадача. Решение частной подзадачи осуществляется с учетом
рекуррентного соотношения, отражающего принцип оптимальности
Беллмана: каковы бы ни были предыдущее состояние и принятое
предыдущее решение, последующие решения должны составлять
оптимальную стратегию относительно состояния, возникшего в результате
предыдущего решения. Это позволяет совокупность оптимальных решений
частных подзадач представить как оптимальное решение общей задачи
(Приложение 2).
Построим рекуррентное соотношение для рассматриваемой задачи.
Этап 1.
Если количество заводов n  1 , то
z1  y   max z1  x1 
0  x1  y
.
Этап 2.
Если количество заводов n  2 , то максимальное увеличение выпуска
продукции всеми ими соответствует максимальному варианту суммарного
увеличения выпуска продукции вторым заводом и остальными заводами
(первым заводом) при различном распределении y капиталовложений:
z12  y   max z 2  x 2   z1  y  x 2 
0  x2  y
.
Этап k .
Продолжая аналогичные рассуждения, получим общее рекуррентное
соотношение:
z1...k  y   max z k  xk   z1...(k 1)  y  xk 
0  xk  y
.
Полученное рекуррентное соотношение называется уравнением
Беллмана и позволяет заменить исходную задачу на максимум функции n
переменных задачей на условный максимум функции одной переменной
на n этапах.
14
В рассматриваемой выше задаче распределения капиталовложений
оптимальная
стратегия
представляет
собой
последовательность



 y
z
оптимальных значений z 1...n  y0  , 1...(n1) . .... z 1  y  , которая определяет
x n  x1 , x 2 ,..., x n 
оптимальное решение
.
Поэтому сначала (прямой прогон) отыскивают последовательно
z
( y ) z 1...n ( y0 )
функции Беллмана z 1 ( y ) , z 12 ( y ) , …, 1...(n-1)
,
как функции
y
различных параметров соответственно.

Затем (обратный прогон) определяется оптимальное значение z 1...n  y0 

и соответствующее ему оптимальное значение x n . Затем оптимальное
 y  xn  и соответствующее ему оптимальное значение
z
значение 1...(n1) 0
x n 1 . Продолжая этот процесс, получим оптимальные значения




z1...(n2 )  y0  xn  xn1 
, ... , z1  y0  xn  xn1  ...  x 2  и соответствующие


им оптимальные значения x n 2 ,..., x1 , т.е. оптимальный план.
1.4. Задачи условной оптимизации
Задачи условной оптимизации состоят из целевой функции и ограничений. В общем виде они представляются следующим образом:
z   x n  max min 
 
при ограничениях
g  x n  0 i  1, m
,
;
x n 0
.
Целевая функция отражает цель оптимизации. Максимальное
(минимальное) ее численное значение соответствует наилучшему
x
варианту, определяемому значениями ее аргументов n .
Оптимальное решение рассматриваемой задачи - это оптимальные
x n
значения этих аргументов (обозначается
), при которых целевая
функция принимает экстремальное значение (максимальное или
минимальное) и для которых выполняются все ограничения задачи.
Другими словами, ограничения задачи условной оптимизации
определяют область допустимых решений этой задачи, а с помощью
целевой функции среди этих допустимых решений выбирается
оптимальное решение.
Заметим, что аргументы целевой функции и аргументы ограничений
должны совпадать.
 
15
Задачи условной оптимизации называют задачами математического
программирования. Их можно классифицировать по различным признакам.
По признаку зависимостей, описывающих целевую функцию и
ограничения, эти задачи делятся на задачи линейного и нелинейного
программирования.
По признаку искомых аргументов различают непрерывные и
дискретные задачи.
По признаку исходных данных делят задачи на детерминированные,
стохастические (случайные) и неопределенные.
Приведем примеры целевых функций, отражающих цель
оптимизации. Для этого введем следующие обозначения:
sj
- прибыль от реализации единицы изделия j - ого вида;
xj
- количество выпущенных изделий j - ого вида;
cj
- цена единицы изделия j -ого вида;
rj
- себестоимость производства единицы изделия j -ого вида.
Используя эти обозначения, сформулируем целевые функции
известных задач.
Задача рентабельности затрат на производство изделий:
n
Pз   s j x J
j 1
n
 rj x j  max
j 1
.
Задача рентабельности продаж:
n
Pn   s j x J
j 1
n
 c j x j  max
j 1
.
Задача определения затрат в расчете на рубль товарной продукции:
n
З p   rj xJ
j 1
n
 c j x j  min
j 1
.
1.5. Метод множителей Лагранжа
Рассматривая задачи условной оптимизации, пришли к выводу, что их
оптимальные решения могут отличаться от экстремальных решений,
найденных при поиске экстремума целевой функции без учета ограничений. Поэтому требуется свести задачу условной оптимизации к такой задаче безусловной оптимизации, т.е. к задаче без ограничений, чтобы оптимальные решения этих задач совпадали, или, другими словами, чтобы экстремальное решение задачи безусловной оптимизации совпадало с оптимальным решением задачи условной оптимизации. Тогда для поиска оптимального решения задачи условной оптимизации можно будет воспользоваться необходимым условием экстремума целевой функции соответствующей задачи безусловной оптимизации.
16
Сведение задачи условной оптимизации к эквивалентной, т.е. с
совпадающим решением, задаче безусловной оптимизации осуществляется
методом множителей Лагранжа, суть которого сводится к следующему.
Вернемся к общему виду задачи условной оптимизации:
z   x n  max
 
при ограничениях
g i x n  0 i  1, m
,
;
x n 0
.
  1 ,  2 ,...,m 
Введем вектор m
множителей Лагранжа и составим
 xn
g x
из целевой функции
и функций ограничений i n , i  1, m ,
функцию Лагранжа:
 
 

  
m
 
 
L x n ,  m   x n   i g i x n
i 1
.
Таким приемом исходная задача на условный экстремум функции
 xn
L x n , m
сводится к задаче на безусловный экстремум функции
.
Тогда необходимыми условиями экстремума служат:
m
g i
 L 



 0,
j  1, n,

i
 x
x j i  1 x j
j
 L

 g i x n  0 , i  1, m .
 i
Таким образом, образуется система n  m  алгебраических
уравнений с n  m  переменными.
 


 
Решение этой системы уравнений позволяет найти экстремальную
точку функции Лагранжа, которая соответствует оптимальному решению
исходной задачи условной оптимизации. Последнее определяется
теоремой Куна-Таккера. Ее смысл сводится к следующему. Точка
L x n , m
x n , m
является седловой точкой функции
, если для всех
x n 0  m 0
и
выполняется условие:

L x n , m  L x n , m  L x n , m
, т.е. в седловой точке функцией
L x n , m
x
достигается одновременно минимум по n и максимум по
m
.






 
 


Вопросы для самопроверки
Как называется универсальный метод решения задач линейного программирования и в чем его суть?
17
Что позволяет выявление недефицитных ограничений в задаче об использовании ресурсов?
К чему приводят изменения исходных данных статической задачи
планирования производства?
Что определяют коэффициенты прямых материальных производственных затрат?
Что показывают коэффициенты полных материальных затрат?
Как из матрицы коэффициентов прямых материальных производственных затрат можно получить матрицу коэффициентов полных материальных затрат и наоборот?
Когда для решения задач математического программирования применяется метод динамического программирования?
Чем отличаются задачи условной оптимизации от задач безусловной
оптимизации?
Что отражает целевая функция в задаче об использовании ресурсов
(оптимального планирования производства)?
Что отражает целевая функция в задаче оптимального распределения
валовых капитальных вложений?
Что представляет собой оптимальное решение задачи условной оптимизации и экстремальное решение задачи безусловной оптимизации?
Что определяют ограничения задачи условной оптимизации?
Каким методом можно свести задачу условной оптимизации к такой
задаче безусловной оптимизации, чтобы оптимальные решения этих задач
совпадали?
Примеры решения задач
1. Найти экстремум функции
 (x 1 , x 2 )  2 x 12  3 x 22  x 1 x 2  2 x 1  x 2 .
Решение.
Необходимые условия экстремума:

 4 x1  x2  2  0 ,
x 1

 6 x2  x1  1  0 .
x2
Из системы уравнений
4x1  x 2  2 ,
 x  6 x  1
 1
2
2 
 11
находим x 2  ( x 1 , x 2 )   ;  .
 23 23 
Достаточные условия экстремума:
18
  
 2  2
 2

2
,
x 1 x 2
x 12 x 22
 2
 2
 2
 4,
 6,
 1 ,
x 1 x 2
x 12
x 22
   4  6  2  1  8  0 .
2 
 11
Следовательно, в точке  ;  функция имеет минимум:
 23 23 
2
2
11  2 
11  2 
 11 
 2 
( x , x )  2     3     
    2 
  .
23  23 
23  23 
 23 
 23 

1

2
2. Для изготовления 2-х видов продукции используются 3 типа
ресурсов.
Запасы ресурсов и их расход на изготовление продукции, а также
прибыль, получаемая от реализации одной единицы продукции, приведены
в таблице:
Число единиц ресурсов,
затрачиваемых на изготовление одной
Тип
Запас
единицы продукции
ресурса
ресурса
1-й вид продукции 2-й вид продукции
1-й тип
2
0,04
1
2-й тип
4
0,5
2
3-й тип
6
1
3
Прибыль от реализации единицы
35
16
продукции
Требуется построить математическую модель задачи линейного
программирования для составления такого плана производства продукции,
при котором прибыль от ее реализации будет максимальной.
Решение.
35 x1  16 x 2  max
при
0,04 x1  x 2  2
0 ,5 x 1  2 x 2  4
x1  3 x 2  6
x1  0
x2  0
3. По данным отчетного периода получен следующий баланс
трехотраслевой экономической системы:
Потребители
№
Конечная
Валовая
отраслей
продукция
продукция
1
2
3
1
20
40
30
110
200
19
2
3
30
10
16
24
60
16
54
150
160
200
Определить валовый выпуск отраслей, обеспечивающий новый
конечный продукт Y 3  130 , 60 , 160  .
Решение.
Расчет коэффициентов прямых затрат: a i j 
a1 1 
a1 2 
a1 3 
a2 1 
a2 2 
a2 3 
a3 1 
a3 2 
x1 1
X1
x1 2
X2
x1 3
X3
x2 1
X1
x2 2
X2
x2 3
X3
x3 1
X1
x3 2
X2
x3 3

20
 0,1;
200

40
 0,25;
160

30
 0,15;
200

30
 0,15;
200

16
 0,1;
160

60
 0,3;
200

10
 0,05;
200

24
 0,15;
160
16
 0,08.
X 3 200
 0 ,1 0 , 25 0 ,15 
A3 , 3    0 ,15 0 ,1 0 , 3 


 0 ,05 0 ,15 0 ,08 
a3 3 

Расчет коэффициентов полных затрат:
B3, 3  E3, 3  A3, 3  
1
  1 0 0   0,1 0,25 0,15  


   0 1 0    0,15 0,1 0,3  
  0 0 1   0,05 0,15 0,08  
 


20
1

xi j
Xj
,
 0,9  0,25  0,15 
   0,15 0,9
 0,3 



0
,
05

0
,
15
0
,
92


1

21
 1,19 0,38 0,32 
  0,23 1,25 0,45  1


 0,1 0,22 1,18 
1
Обратная матрица рассчитана на ПК с помощью Excel
22
Определение валового выпуска отраслей:
X 3 , 1  E3, 3  A3, 3   Y3 , 1 
1
 1,19 0,38 0,32   130
  0,23 1,25 0,45    60  

 

 0,1 0,22 1,18   160
 229,37 
  176,62 


 215,18 
4. Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x ) и зададим в таблице:
z1 ( x )
z2 ( x )
z3 ( x )
x
1
5
7
6
2
12
10
13
3
16
14
18
4
21
20
21
5
23
25
22


Необходимо найти вариант распределения капиталовложений, при котором суммарное увеличение выпуска продукции на трех заводах максимально.
Решение.
Сначала (прямой прогон) рассчитаем функции, показывающие суммарное увеличение выпуска продукции на k заводах, по рекуррентному
соотношению:
z 1...k ( y )  max z k ( x k )  z 1...( k 1 ) ( y  x k ).
0  xk  y
Для k  1 , т.е. при выделении объема капиталовложений y одному заводу (например, первому) функция совпадает с z 1 ( x ) .
Рассчитаем функцию z 12 :
z ( 0 )  z ( 1 ) при x  0 
0 5
z 12 ( 1 )  max
 z 2 ( 1 )  z 1 ( 0 ) при x 2  1  max 7  0  7 ,
 2

1
2


 z 2 ( 0 )  z 1 ( 2 ) при x 2  0 

 0  12 

z 12 ( 2 )  max z 2 ( 1 )  z 1 ( 1 ) при x 2  1   max 7  5   12 ,


10  0 

 z 2 ( 2 )  z 1 ( 0 ) при x 2  2 

 0  1 6
 z 2 ( 0 )  z 1 ( 3 ) при x 2  0 
 7  1 2
 z 2 ( 1 )  z 1 ( 2 ) при x 2  1 
z 12 ( 3 )  max
 max
 19 ,

z 2 ( 2 )  z 1 ( 1 ) при x 2  2
1 0  5
 z ( 3 )  z ( 0 ) при x  3


 2

1
2
1 4  0 

23

 0  2 1
 z 2 ( 0 )  z 1 ( 4 ) при x 2  0 
 7  1 6
 z 2 ( 1 )  z 1 ( 3 ) при x 2  1 


z 12 ( 4 )  max z 2 ( 2 )  z 1 ( 2 ) при x 2  2   max 1 0  1 2   23 ,
 z 2 ( 3 )  z 1 ( 1 ) при x 2  3 
1 4  5 
 z 2 ( 4 )  z 1 ( 0 ) при x 2  4 
2 0  0 
 z 2 ( 0 )  z 1 ( 5 ) при x 2  0 
 0  2 3
 z 2 ( 1 )  z 1 ( 4 ) при x 2  1 
 7  2 1
 z 2 ( 2 )  z 1 ( 3 ) при x 2  2 




z 12 ( 5 )  max z 2 ( 3 )  z 1 ( 2 ) при x 2  3   max 1 0  1 6   2 8 .
1412
 z 2 ( 4 )  z 1 ( 1 ) при x 2  4 
2 0  5 
 z 2 ( 5 )  z 1 ( 0 ) при x 2  5 


2
5

0




Рассчитаем функцию z 123 ( y0 )  z 123 ( 5 ) , т.к. только при полном выделении капиталовложений всем заводам достигается максимальное суммарное увеличение выпуска ими продукции:
 0  2 8
 z 3 ( 0 )  z 12 ( 5 ) при x 3  0 
 6  2 3
 z 3 ( 1 )  z 12 ( 4 ) при x 3  1 


 z 3 ( 2 )  z 12 ( 3 ) при x 3  2 
z 123 ( 5 )  max
 max 1 3  1 9   3 2 .

z ( 3 )  z ( 2 ) при x  3
1812
 z 3 ( 4 )  z 12 ( 1 ) при x 3  4 
2 1  7 
12
3
 3



 z 3 ( 5 )  z 12 ( 0 ) при x 3  5 
2 2  0 
Затем (обратный прогон) находим, что максимальное суммарное увеличение выпуска продукции не трех заводах z 123 ( 5 )  32 млн. руб. При
этом третьему заводу выделяется 2 млн. руб. капиталовложений, а остальным двум – 3 млн. руб.
При выделении двум оставшимся заводам 3 млн. руб. капиталовложений максимальное суммарное увеличение выпуска продукции на них
z 12 ( 3 )  19 млн. руб. При этом второму заводу выделяется 1 млн. руб. Тогда первому заводу выделяется оставшиеся 2 млн. руб. капиталовложений.
Итак, максимальное суммарное увеличение выпуска продукции на трех
заводах 32 млн. руб. при оптимальном распределении капиталовложений
x 3  ( x 1 , x 2 , x 3 )  ( 2 ; 1 ; 2 ) млн. руб.
5. Найти условный экстремум функции
 (x 1 , x 2 )  4 x 12  3 x 22  2 x 1 x 2  x 1  x 2
при условии (ограничении)
x1  3 x2  5 .
Решение.
Составим функцию Лангранжа:
L  4 x 12  3 x 22  2 x 1 x 2  x 1  x 2   ( x 1  3 x 2  5 ) .
Необходимые условия экстремума:
24
L
 8 x1  2 x2  1    0 ,
x 1
L
 6 x 2  2 x 1  1  3   0 ,
x 2
L
 x1  3 x2  5  0 .

Из системы уравнений
 8 x 1  2 x 2    1 ,
  2 x 1  6 x 2  3   1 ,
 x 1  3 x 2
 5
находим
x 1  1, x 2  2 ,   5 .
Достаточные условия экстремума:
  2 
 2  2
  8  ( 6 )  2( 2 )  8  6  4  2  0.
   2  2  2

x

x
x 1
x 2
 1 2
Следовательно, в точке x 2  ( x 1 , x 2 )  ( 1;2 ) целевая функция
 (x 1 , x 2 ) имеет максимум:
 ( x 1 , x 2 )  4  ( 1 ) 2  3  ( 2 ) 2  2( 1 )( 2 )  ( 1 )  ( 2 ) 
 4  12  4  1  2  13.
Задания для самостоятельной работы
1. Найти экстремум функции
 ( x1 , x 2 )  N  x12  N  x 22  N  x1 x 2  N  x1  N  x 2 .
2. Для изготовления 2-х видов продукции используются 3 типа
ресурсов.
Запасы ресурсов и их расход на изготовление продукции, а также
прибыль, получаемая от реализации одной единицы продукции, приведены
в таблице:
Число единиц ресурсов,
затрачиваемых на изготовление одной
Тип
Запас
единицы продукции
ресурса
ресурса
1-й вид продукции 2-й вид продукции
1-й тип
N
0,01N
1
2-й тип
2N
0,1N
2
3-й тип
3N
N
3
25
Прибыль от реализации единицы
5N
2N
продукции
Требуется построить математическую модель задачи линейного
программирования для составления такого плана производства продукции,
при котором прибыль от ее реализации будет максимальной.
3. Оптимальное распределение валовых капитальных вложений
Вариант № 1
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

z1 ( x )
6
13
17
22
24
x
1
2
3
4
5

z2 ( x )
7
10
14
20
26
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 2
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
6
13
17
22
25
z2 ( x )
8
11
15
21
27

z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 3
26
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
7
14
18
23
26

z2 ( x )
8
11
15
21
28
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 4
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
7
14
18
23
27

z2 ( x )
9
12
16
22
29
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 5
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
z1 ( x )
8
15
19
z2 ( x )
9
12
16
27

z3 ( x )
6
13
18
4
5
24
28
22
30
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 6
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
8
15
19
24
29

z2 ( x )
10
13
17
23
31
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 7
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
9
16
20
25
30
z2 ( x )
10
13
17
23
32

z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 8
Для реконструкции трех заводов выделено 5 млн. руб. капиталовло28
жений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
9
16
20
25
31

z2 ( x )
11
14
18
24
33
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 9
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
10
17
21
26
32

z2 ( x )
11
14
18
24
34
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 10
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
z1 ( x )
10
17
21
26
z2 ( x )
12
15
19
25
29

z3 ( x )
6
13
18
21
5
33
35
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 11
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
11
18
22
27
34

z2 ( x )
12
15
19
25
36
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 12
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
11
18
22
27
35
z2 ( x )
13
16
20
26
37

z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 13
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
30


в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:
x
1
2
3
4
5
z1 ( x )
12
19
23
28
36
z2 ( x )
13
16
20
26
38
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 14
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
12
19
23
28
37

z2 ( x )
14
17
21
27
39
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 15
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
13
20
24
29
38
z2 ( x )
14
17
21
27
40
31

z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 16
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
13
20
24
29
39

z2 ( x )
15
18
22
29
41
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 17
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
14
21
25
30
40
z2 ( x )
15
18
22
29
42

z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 18
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
32


в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:
x
1
2
3
4
5
z1 ( x )
14
21
25
30
41
z2 ( x )
16
19
23
30
43
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 19
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
15
22
26
31
42

z2 ( x )
16
19
23
30
44
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 20
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
15
22
26
31
43
z2 ( x )
17
20
24
31
45
33

z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 21
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
16
23
27
32
44

z2 ( x )
17
20
24
31
46
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 22
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
16
23
27
32
45
z2 ( x )
18
21
25
32
47

z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 23
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
34


в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:
x
1
2
3
4
5
z1 ( x )
17
24
28
33
46
z2 ( x )
18
21
25
32
48
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 24
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
17
24
28
33
46

z2 ( x )
19
22
26
33
49
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 25
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
18
25
29
34
47
z2 ( x )
19
22
26
33
50
35

z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 26
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
18
25
29
34
48

z2 ( x )
20
23
27
34
51
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 27
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
19
26
30
35
49
z2 ( x )
20
23
27
34
52

z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 28
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
36


в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:
x
1
2
3
4
5
z1 ( x )
19
26
30
35
50
z2 ( x )
21
24
28
35
53
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 29
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
20
27
31
36
51

z2 ( x )
21
24
28
35
54
z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
Вариант № 30
Для реконструкции трех заводов выделено 5 млн. руб. капиталовложений. Увеличение выпуска продукции (в млн. руб.) после реконструкции
в зависимости от выделенного i -ому заводу i  1,3 объема капиталовложений x обозначим z i ( x j ) и зададим в таблице:

x
1
2
3
4
5
z1 ( x )
20
27
31
36
52
z2 ( x )
22
25
29
36
55
37

z3 ( x )
6
13
18
21
22
Необходимо найти вариант распределения капиталовложений z *123 (5 ) ,
при котором суммарное увеличение выпуска продукции на трех заводах
максимально.
38
2. ЭКОНОМИКА КАК ОБЪЕКТ МАТЕМАТИЧЕСКОГО
МОДЕЛИРОВАНИЯ
2.1. Схема производства и распределения продукции,
накопления и потребления
Основная цель экономики состоит в обеспечении общества предметами потребления, т.е. в удовлетворении социальных, оборонных, экономических и других потребностей. Для удовлетворения этих потребностей
экономика включает подсистемы, две главные из которых - производственная и финансово-кредитная. В каждой подсистеме имеются элементы
- хозяйственные единицы (предприятия, фирмы, банки и т.п.).
При выполнении своей основной функции экономическая система
реализует следующие действия [7]: размещает ресурсы, производит
продукцию, распределяет предметы потребления и осуществляет
накопление (рис. 2.1). В производстве используются природные W  и
трудовые L ресурсы, а также инвестиции  I  - валовые капитальные
вложения, или валовые инвестиции. Результатом производства является
валовый внутренний продукт (ВВП), или конечный продукт Y  . В
натурально-вещественной форме ВВП Y  распадается на средства труда
(за счет I ) и предметы потребления C  , в стоимостной форме - на фонд
возмещения выбытия основных фондов (амортизационный фонд) и вновь
созданную стоимость (национальный доход).
Рис. 2.1. Экономика как подсистема природы и общества
Средства (орудия) труда и предметы труда составляют средства
производства. Средства труда участвуют в нескольких производственных
циклах вплоть до их замены вследствие морального или физического
износа. Предметы труда участвуют в одном производственном цикле.
39
Таким образом, в предложенной схеме, являющейся концептуальной
моделью экономической системы, целевое предназначение экономики в
удовлетворении потребностей за счет обеспечения необходимого
потребления заключается в определении требуемого конечного продукта
Y . Для определения искомой величины Y возможно или проведение
прямых экспериментов с экономикой, или построение математической
модели. Первое нецелесообразно из-за непредсказуемости последствий
этих экспериментов. Остается математическое моделирование на основе
концептуальной модели.
Математической моделью по предложенной схеме является
оптимизационная задача с целевой функцией - максимизировать Y
W (природные
(конечный продукт) при заданных ограничениях на
ресурсы), L (трудовые ресурсы) и C (потребление). Ограничения на I
(инвестиции) будут в этом случае определяться по умолчанию
(излишними), т.к. Y  I  C .
Построение такой модели требует математического представления
зависимости величины конечного продукта Y от величин природных
ресурсов W , трудовых ресурсов L , потребления C и инвестиции I . Для
определения таких зависимостей рассмотрим более подробно схему
взаимодействия производственных факторов (потоков продуктов и
ресурсов).
Нужно отметить, что рассматривается один пример оптимизационной
задачи в качестве математической модели с параметрами конечный
продукт Y , природные ресурсы W , трудовые ресурсы L , потребление C
и инвестиции I . Но таких примеров задач может быть много. Например,
если в качестве цели задать минимизацию природных ресурсов W , а на
остальные параметры наложить ограничения, то получим новую
оптимизационную задачу. Аналогично можно минимизировать трудовые
ресурсы L , максимизировать потребление C и т.п., ограничивая
оставшиеся при этом параметры. Наконец, возможны многоцелевые (т.н.
многокритериальные) оптимизационные задачи, когда в качестве цели
задается максимизация (минимизация) не одного параметра модели, а
нескольких одновременно. При этом оставшиеся параметры, не попавшие
в целевые, так же ограничиваются.
Сделанное замечание придает большую свободу рассмотрению схемы
взаимодействия производственных факторов как параметров математической модели.
Теория оптимального управления первоначально развивалась
применительно к объектам технического характера как более простым с
точки зрения их математического описания. Затем положения и результаты
теории оптимального управления стали применяться и для объектов
экономического характера. Однако в силу того, что объекты
экономического характера в реальных условиях имеют множество
40
случайных факторов, поиск оптимального управления этими объектами
(системами) существенно усложняется. Тем не менее и в стохастических
моделях можно отыскать оптимальное управление с определенными
допущениями на риск, что поставленная цель может быть не достигнута.
Задача оптимального управления - это получение в определенном
смысле наилучшего результата управления.
Критерий оптимального управления - это словесная и (или)
математическая формулировка наилучшего результата. Последнюю
называют также критерием качества или целевой функцией.
Целевая функция - это математическая зависимость результата от
состояния системы, от внешних возмущений и от управления.
Экономическая система - это система производства и (или)
реализации продукции или услуг на рынке по установленным законами и
внешними факторами правилам.
Хозяйствующий субъект - юридическое лицо (предприятие,
акционерное общество, товарищество, кооператив, банк, фирма, компания,
биржа, ассоциация и т.д.) имеющее свое имущество (собственность) и
права владеть, пользоваться и распоряжаться своей собственностью,
независимость существования от входящих в него физических лиц,
действующее на рынке и несущее ответственность за свои действия.
Математическая модель системы - это совокупность математических
формул, таблиц, графиков, устанавливающих зависимость между
состоянием системы, внешними воздействиями, управлением системой и
временем. Иными словами математическая модель описывает эволюцию
системы в зависимости от перечисленных факторов.
Конкуренция - это состязательность (соперничество) хозяйствующих
субъектов в условиях, когда их самостоятельные действия ограничивают
возможности других субъектов воздействовать на условия обращения
товаров на рынке.
Товар - предмет, который благодаря его свойствам удовлетворяет
каким-либо человеческим потребностям.
Услуга - действие, которое благодаря ее свойствам вызывает спрос на
рынке услуг.
Емкость рынка - возможный объем продажи (обычно за месяц или
год) определенного товара или услуги на рынке при сложившихся
условиях реализации.
2.2. Классификация моделей экономических систем
Экономическая система по своим экономическим показателям
изменяется во времени как под действием внешних факторов, так и под
действием управляющих этой системой людей с учетом внутреннего
состояния
этой
системы. Эволюцию (изменение) состояния
экономической системы можно описать с помощью математических
41
формул и зависимостей, совокупность которых образует математическую
модель системы. При этом второстепенными факторами можно
пренебречь, а какие-то воздействия и факторы можно считать
неизменными на определенном отрезке времени. Естественно при этих
допущениях математические зависимости упрощаются. В зависимости от
степени упрощения математических моделей их можно классифицировать
по определенным признакам. На рис. 2.2 приведена структурная схема,
отражающая классификацию моделей экономических систем.
Модели
экономических систем
Статические
Динамические
Непрерывные
Дискретные
Детерминированные
Стохастическиее
Рис. 2.2. Структурная схема классификации моделей
экономических систем
Первый признак - это наличие или отсутствие зависимости модели от
времени. Модель, которая не зависит от времени, называется статической,
а модель, которая зависит от времени, называется динамической. Все
реальные экономические системы динамические, однако существует ряд
задач, когда фактором времени можно пренебречь. Это либо
одномоментные задачи, которые нужно решить один раз, либо задачи,
когда решение ищется для небольшого по продолжительности интервала
времени, когда состояние системы от времени почти не изменяется.
Очевидно, что поиск оптимального решения для статических моделей
проще, поэтому их используют на практике, когда они адекватны
(соответствуют) реальной ситуации.
Для динамических моделей вводится второй признак - это
непрерывность или дискретность изменения времени в этих моделях.
Модели, в которых время изменяется непрерывно, называются
непрерывными, а модели, в которых время изменяется дискретно, через
определенный временной интервал (цикл), называются дискретными. Это
формальное определение непрерывных и дискретных моделей. Более
точное определение, подчеркивающее сущность в различии этих моделей,
можно сформулировать так: непрерывные модели изменяют свое
состояние во времени за сколь угодно малое приращение времени, а
дискретные модели изменяют свое состояние во времени дискретно, через
определенный временной интервал. Реальные экономические системы
42
дискретные, их состояние изменяется через конечный временной интервал,
который называют тактом, циклом, периодом и т.д. Этот интервал для
разных систем различный и может измеряться в часах, днях (сутках),
неделях, месяцах, кварталах, годах и т.д.
Возникает вопрос - зачем же вводить непрерывные модели, если
реальным экономическим системам адекватны дискретные модели? Ответ
таков - непрерывные модели проще в описании, для них легче найти
оптимальное управление. Реальные экономические системы можно
считать адекватными непрерывным моделям в случаях, когда временной
интервал управления гораздо больше цикла. Для таких случаев
используются непрерывные модели экономических систем.
Третий признак классификации для непрерывных и дискретных
моделей - это наличие или отсутствие в них случайных факторов. Модели,
в которых все воздействия и факторы известны на всем интервале
управления моделью, называются детерминированными. Модели, в
которых хотя бы один из факторов случайный, называются
стохастическими.
Реальные
экономические
системы
являются
стохастическими. Почему же тогда рассматриваются детерминированные
модели? Опять таки из-за того, что для детерминированных моделей
проще найти оптимальное управление, да и реальные системы на
сравнительно небольшом временном интервале времени могут быть
адекватны детерминированным моделям, когда с большой достоверностью
можно предположить, что воздействия и факторы на этом интервале
времени заданы однозначно. В противном случае следует использовать
стохастические модели, поиск оптимального управления для которых
гораздо сложнее и может быть найден с определенными оговорками на
риск и т.д.
Реальные экономические системы являются динамическими,
дискретными и стохастическими. Модели этих систем самые сложные,
поиск оптимального управления для них наиболее трудный и порой
неоднозначный, поэтому при разумных ограничениях в ряде случаев
можно воспользоваться более простыми моделями, найти для них
оптимальное управление и затем творчески применить этот результат для
реальных экономических систем.
2.3. Разновидности структурных схем управления
экономическими системами
Для наглядности представления об управлении экономическими
системами различные варианты управления можно представить в виде
структурных схем управления. На рис. 2.3 приведена схема примитивного
разомкнутого управления экономической системой (ЭС).
43

Z

U
ЭС

X
Рис. 2.3. Структурная схема примитивного разомкнутого
управления ЭС

На этой схеме вектор Z характеризует внешние воздействия на

экономическую систему (ЭС), вектор U - вектор управления,

X - вектор,
воздействующий на ЭС (управляющий вектор), вектор
характеризующий состояние ЭС. Все эти векторы имеют определенную
размерность и изменяются во времени (непрерывно или дискретно),



причем вектор X зависит так же от векторов Z и U . В этой схеме вектор



U никак не зависит от векторов Z и X , поэтому управление по этой
схеме называется примитивным и разомкнутым.
На рис. 2.4 приведена схема разомкнутого управления ЭС с учетом
внешних воздействий.

Z

U0

U
F

X
ЭС
Рис. 2.4. Структурная схема разомкнутого управления ЭС
с учетом внешних воздействий
В этой схеме по сравнению со схемой на рис. 2.3 дополнительно
введен блок F, выполняющий некоторое функциональное преобразование


вектора Z и вектора исходного управления U 0 и формирующий в

результате вектор управления U . Эта схема за счет учета внешних
воздействий на ЭС позволяет в принципе улучшить процесс управления
для достижения определенной цели.
На рис. 2.5 приведена схема замкнутого управления ЭС.

Z

U0

U
F
ЭС

X
Рис. 2.5. Структурная схема замкнутого управления ЭС
44
В этой схеме блок F формирует вектор управления как из вектора


исходного управления U 0 , так и из вектора X , характеризующего
состояние и поведение ЭС в процессе управления. Эту схему называют
также схемой управления с обратной связью, так как воздействие на ЭС
здесь осуществляется с учетом ее состояния и изменения. При такой схеме
управления может быть достигнуто еще более высокое качество
управления по сравнению со схемой на рис. 2.4.
На рис. 2.6 приведена схема замкнутого управления с учетом внешних
воздействий.

Z

U

U0

X
ЭС
F
Рис. 2.6. Структурная схема замкнутого управления
с учетом внешних воздействий

В этой схеме вектор управления U формируется с учетом вектора


исходного управления U 0 , вектора X , состояния ЭС и вектор внешних

воздействий Z . Эта схема является суперпозиций двух предыдущих схем и
позволяет получить наилучший результат управления ЭС с точки зрения
достижения поставленной цели управления.
2.4. Формализованная производственно-технологическая
модель экономики
Производственно-технологическая схема экономики (рис. 2.7) устанавливает связь между факторами производства [10].
45
Рис. 2.7. Производственно-технологическая схема экономики
Само производство определим производственной функцией F с арS
гументами: природные ресурсы W , производственное потребление W ,
основные производственные фонды K и трудовые ресурсы L . Значением
этой функции будет валовый продукт X .
S
Обратим внимание на то, что природные ресурсы W , где s - это
среда, в которой функционирует экономика (см. рис. 2), и производственное потребление W имеют схожие обозначения. Это объясняется тем, что
между ними нет четкой грани. Например, после предварительной обработки на предприятии (обогащения) ископаемые превращаются в руду, которую можно считать и природным ресурсом, и производственным потреблением.
Понятие валового продукта X также рассматривается как искусственно введенное для обобщения некоторого этапа производственного
цикла. Поэтому валовый продукт X разделяется ( P X на рис. 2.7) на конечный продукт Y и производственное потребление W :
X W Y .
Производственное потребление W является той частью валового
продукта X , которая возвращается в производство для выпуска валового
продукта X . Например, часть произведенных инжекторов поступает для
выпуска двигателей автомобилей.
Долю валового продукта X , поступающего в производство в качество
W,
производственного
потребления
определяют
с
помощью
46
коэффициента прямых материальных производственных затрат a (обычно
используют название - коэффициент прямых затрат):
W  aX .
Конечный продукт Y - это та часть валового продукта, которая
используется вне сферы производства, т.е. не как предметы труда, а для
реализации в непроизводственной сфере или как средства труда и т.п.
Разделяется ( PY на рис. 2.7) конечный продукт Y на валовые
капитальные вложения I (инвестиции) и на непроизводственное
потребление C :
Y  I C.
Доля конечного продукта Y , определяющая объем валовых
капитальных вложений I , устанавливается нормой накопления  :
I   Y .
Валовые капитальные вложения I разделяются ( PI на рис. 2.7) на
амортизационные отчисления A и на чистые капитальные вложения V :
I  A V .
Амортизационные отчисления A используются для поддержания
работоспособного состояния основных производственных фондов K (ОПФ
на рис. 2.7). Величина этих отчислений определяется как доля ОПФ с
помощью коэффициента амортизации  :
A   K .
Чистые капитальные вложения V служат для развития ОПФ.
Естественно, что ввод в действие V производится постепенно (см. рис.
2.7). (Например, сначала строится производственное здание, а потом в нем
устанавливают технику.) Поэтому ввод в действие ОПФ осуществляется
наращиванием K (см. рис. 2.7). Тогда чистые капитальные вложения V
пропорциональны приросту ОПФ:
dK
V q
dt .
Наращивание ОПФ приводит к приросту валового продукта,
следовательно, валовые капитальные вложения пропорциональны этому
приросту:
dX
I b
dt ,
где b - коэффициент приростной фондоемкости.
Таким образом, установлены взаимоотношения между факторами
производства в производственно-технологической схеме экономики.
47
2.5. Задачи оптимизации и оптимального управления в
экономике
Рассмотрим один их центральных блоков в производственнотехнологической схеме экономики (см. рис. 2.7) - производство. Его можно
представить производственной функцией F , значение которой определяет
S
валовый продукт X , а аргументами являются природные ресурсы W ,
производственное потребление W , трудовые ресурсы L и основные
производственные фонды (ОПФ) K :
X  F (W S ,W , L, K ) .
Объединяя природные ресурсы и производственное потребление в
один аргумент - ресурсы W и считая трудовые ресурсы и ОПФ
постоянными величинами, можно сформулировать следующую задачу
оптимизации:
X  max F (W )
W
.
В этой задаче максимизируется значение валового продукта X путем
выбора значения ресурсов W как аргумента производственной функции
F . Причем никаких ограничений на значение W не накладывается,
поэтому такую задачу называют задачей безусловной оптимизации.

Оптимальное значение функции X достигается при оптимальном

решении W , для которого в данной задаче максимизации одновременно
выполняются два условия:
F (W )  F (W  )
и
W W .
Если на выбираемые значения W накладываются некоторые
ограничения, то рассматриваемая задача приобретает вид:
X  maxогр F (W )
W W
.
Такую задачу называют задачей условной оптимизации и обычно
записывают в виде:
X  F (W )  max
при ограничениях
G(W )  B .
В приведенной записи функция G и действительное значение B
представляют ограничения на значения W , а функция F называется
целевой функцией.
48

Здесь оптимальное значение целевой функции X достигается при

оптимальном решении W , для которого в данной задаче максимизации
одновременно выполняются четыре условия:
F (W )  F (W  ) ,
W W 
и
G(W )  B ,
G(W  )  B .
Как правило, в реальных задачах ограничения меняются во времени.
Т.е. в рассматриваемой задаче действительное значение B , определяющее
запасы ресурсов W , будет зависеть от времени. В этом случае и значение
производственной функции X также будет зависеть от времени.
Обозначим:
X t  - состояние производства,
Bt  - управление производством.
Тогда необходимо выбрать такое управление производством, при
котором его состояние будет соответствовать требуемому.
Так формулируется задача оптимального управления, в которой

нужно определить оптимальную траекторию управления B t  ,

приводящую к оптимальной траектории состояния X t  . Это требование
выражается целевым функционалом (когда аргументы функции сами
являются функциями):
t1
J   Ф X t , Bt , t dt  T  X t 1 , t 1   max
t0
,
где t 0 - начальный, а t 1 - конечный момент времени периода
управления t 0 , t 1  , а T  - терминальный член. Необходимо также
уравнение движения, связывающее между собой функции состояния X t 
и управления Bt  :
dX t 
   X t , Bt , t 
dt
.
Таким образом, в приведенной задаче оптимального управления
требуется выбрать в качестве решения такую функцию Bt  ,
определяющую запасы ресурсов в любой момент времени периода
управления, которая бы позволила максимизировать функцию валового
продукта X t  также в любой момент времени периода управления.
Приведенная выше задача оптимизации является статической, т.е. ее
решение отражает состояние в определенный момент времени, а задача
49
оптимального управления - динамической, т.е. ее решение соответствует
процессу в определенный период времени. Вот почему и вид решений у
них разный: решение задачи оптимизации - численные значения, решение
задачи оптимального управления - функции от времени.
Рассмотренная выше (1.3) межотраслевая (межпродуктовая)
балансовая модель является статической, т.е. такой, в которой все
зависимости отнесены к одному моменту времени. Эта модель может
разрабатываться лишь для отдельно взятых периодов, причем в ее рамках
на устанавливается связь с предыдущими и последующими периодами.
Следовательно, в статических межотраслевых (межпродуктовых) моделях
не могут анализироваться распределение, накопление и эффективное
потребление капитальных вложений. Капиталовложения вынесены из
сферы производства в сферу конечного использования вместе с
предметами потребления и непроизводственными затратами, т.е.
включены в конечный продукт.
В отличие от статических динамические модели призваны отразить не
состояние, а процесс развития экономики, установить непосредственную
взаимосвязь между предыдущими и последующими этапами развития и
тем самым приблизить анализ к реальным условиям развития
экономической системы.
Рассмотрим динамическую модель, являющуюся развитием
статической межотраслевой (межпродуктовой) модели, в которой
производственные капитальные вложения выделяются из состава конечной
продукции, исследуются их структура и влияние на рост объема
производства [17].
Вернемся к балансовому соотношению распределения продукции (1.3)
модели межотраслевого баланса - межпродуктовому балансу:
X  AX  Y ,
или
n
X i   a i j X j  Yi
, i  1, n .
В этом статистическом балансе потоки капиталовложений не
дифференцируются по отраслям-потребителям и отражаются общей
величиной в составе конечной продукции Y i каждой i -ой отрасли. В
j 1
динамической схеме распределим конечный продукт Y i на валовые
капитальные вложения I i и непроизводственное потребление C i (2.4):
Yi  I i  C i .
Валовые капитальные вложения i -ой отрасли
межотраслевыми потоками капитальных вложений:
n
Yi   I i j  C i
j 1
,
50
Ii
представим
где
I i j
- количество продукции i -ой отрасли, направленное в
текущем периоде в j -ую отрасль в качестве производственных
капитальных вложений в ее основные фонды. Материально это выражается
в приросте в потребляющих отраслях производственного оборудования,
сооружений, производственных площадей, транспортных средств и др.
x  ai j X j
В отличие от потоков текущих затрат ( i j
) межотраслевые
потоки капитальных вложений связаны не со всей величиной выпуска
X
X j
продукции j в j -ой отрасли, а обусловливают прирост продукции
.
Причем допущений о том, что в рассматриваемой модели прирост
продукции текущего периода обусловлен вложениями, произведенными в
этом же периоде. Если текущий период обозначить через t , то прирост
X j
продукции
равен разности абсолютных уровней производства в
t
период и в предыдущий ( t  1 )-ый период:
X j  X jt   X jt 1
.
Полагая, что прирост продукции пропорционален приросту
производственных фондов, можно записать:
I i j  bi j X j i , j  1, n
;
.
Здесь пропорциональность выражают коэффициенты:
I i j
bi j 
X j i , j  1, n
;
.
Экономический смысл этих коэффициентов заключается в том, что
они показывают, какое количество продукции i -ой отрасли должно быть
вложено в j -ую отрасль для увеличения производственной мощности этой
отрасли на единицу продукции. Предполагается, что производственные
мощности используются полностью и прирост продукции равен приросту
b
мощности. Коэффициенты i j называются коэффициентами вложений
(приростной фондоемкости).
Используя полученные зависимости, преобразуем систему уравнений
распределения
продукции
модели
межотраслевого
баланса
–
межпродуктовый баланс:
n
X i   ai j X j  Yi
j 1
, i  1, n ;
n
n
j 1
j 1
n
n
j 1
j 1
X i   ai j X j  i  I i j  C i
, i  1, n ;
X i   a i j X j  i  bi j X j  C i
, i  1, n .
51
Полученная система представляет собой систему линейных
разностных уравнений первого порядка. Ее можно привести к обычной
системе линейных уравнений, если учесть, что все объемы валовой и
конечной продукций относятся к некоторому периоду t , а прирост
валовой продукции определен в сравнении с ( t  1 )-ым периодом:
X it    ai j X j t    bi j X j t   X j t 1   C it 
n
n
, i  1, n .
Отсюда, можно записать следующие соотношения:
j 1
j 1
X it    ai j  bi j X j t    bi j X jt 1  C it 
n
n
j 1
j 1
, i  1, n .
Пусть нам известны уровни валовой продукции X jt 1 , j  1, n , всех
отраслей в предыдущем ( t  1 )-ом периоде и непроизводственное
t 
потребление C i , i  1, n , в t -ом периоде. Тогда очевидно, что
полученные соотношения представляют собой систему n линейных
t  X t 
X
n
i
уравнений с
неизвестными уровнями производства
( j ) в t -ом
периоде. Таким образом, решение такой системы линейных уравнений
позволяет определить выпуск продукции в последующем периоде в
зависимости от уровня, достигнутого в предыдущем периоде. Связь между
bi j
периодами устанавливается через коэффициенты вложений
,
характеризующие фондоемкость единицы прироста продукции.
Переходя от дискретного анализа к непрерывному, будем иметь в
пределе:
n
n
dX j t 
X i t    a i j X j t   i  bi j
 C i t 
dt
j 1
j 1
, i  1, n .
Полученные соотношения представляют собой систему n линейных
дифференциальных уравнений первого порядка с постоянными
коэффициентами. Для ее решения помимо коэффициентов прямых затрат
ai j
b
и коэффициентов вложений (капитальных затрат) i j необходимо
знать уровни валового выпуска X i  0 ( X j  0  ) в начальный момент времени
t  0 и закон изменения величины непроизводственного потребления, т.е.
вида функции C i t  . На основе этих данных путем решения получившейся
задачи Коши для приведенной системы дифференциальных уравнений
можно найти уровни валового выпуска X i  t  теоретически для любого
момента времени.
Вопросы для самопроверки
Какие две главные подсистемы включает экономика?
52
Какие действия реализует экономическая система при выполнении
своей основной функции?
Что составляют средства производства?
Как
называется
совокупность
конечного
продукта
и
производственного потребления?
С помощью какого коэффициента определяют производственное
потребление?
Что представляют собой в совокупности валовые капитальные
вложения и непроизводственное потребление?
Чем устанавливается доля конечного продукта, определяющая объем
валовых капитальных вложений?
На какие составные части разделяются валовые капитальные
вложения?
Как определяется величина амортизационных отчислений?
Какой зависимостью описываются чистые капитальные вложения и
прирост основных производственных фондов?
Как описывается прирост валового продукта через валовые
капитальные вложения?
Чем отличается задача оптимального управления от задачи
оптимизации?
Как называется уравнение, связывающее между собой функции
состояния и управления?
Какой зависимостью определяются коэффициенты вложений
(приростной фондоемкости)?
53
3. МОДЕЛИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ В
ЭКОНОМИКЕ
3.1. Задача оптимального управления развитием
экономики
Предлагается оценивать развитие экономики объемом валового
продукта X .
Чем больше будет валового продукта X , судя по производственнотехнологической схеме экономики (см. рис. 2.7), тем больше его пойдет на
производственное потребление W , тем больше будет конечного продукта
Y , а следовательно, увеличатся и непроизводственное потребление С , и
валовые капитальные вложения I . Последнее будет способствовать через
чистые капитальные вложения V росту ОПФ и, в итоге, опять-таки
валового продукта X .
Воспользуемся
приведенными
(2.4)
соотношениями
для
представления зависимостей валового продукта X .
Валовый продукт X разделяется на производственное потребление
W и конечный продукт Y :
X W  Y .
Производственное потребление W выражается через валовый
продукт X с помощью коэффициента прямых материальных затрат a :
W a X .
Тогда
X  a X Y .
Конечный продукт Y разделяется на валовые капитальные вложения
I и непроизводственное потребление С :
Y  I C.
Подставляя это выражение, получаем:
X a X  I C.
Для упрощения будем рассматривать так называемую открытую
модель Леонтьева, в которой не учитываются амортизационные
отчисления A , составляющие совместно с чистыми капитальными
вложениями V валовые капитальные вложения I :
I  A V .
Тогда валовые капитальные вложения I пропорциональны приросту
валового продукта X с коэффициентом приростной фондоемкости b :
X
.
I  b
t
Подставляя эту зависимость, получаем:
54
X
C.
t
После элементарных преобразований итоговое выражение примет вид
дифференциального уравнения:
X 1  a
1

 X  C .
t
b
b
В этом уравнении устанавливается связь во времени t между валовым
продуктом как функцией времени X t 
и непроизводственным
потреблением также как функцией времени C t  .
Если функция валового продукта X t  устанавливает состояние
развития экономики, то тогда функция непроизводственного потребления
C t  может служить управлением развития экономики.
Исходя из этого, может быть сформулирована постановка задачи
оптимального управления развитием экономики.
Суть этой задачи сводится к тому, что необходимо выбрать вид
функции непроизводственного потребления C t  , устанавливающей его
объем в каждый момент времени, которая бы определяла вид функции
валового продукта X t  , характеризующей развитие экономики.
Указанный выбор должен соответствовать критерию оптимальности
управления развитием экономики.
Установим промежуток времени (период) управления от начального
момента времени t 0 по конечный момент времени t 1 :
X  a X  b
t0  t  t1 .
Будем характеризовать состояние функцией валового продукта X t  ,
а управление - функцией непроизводственного потребления C t  .
Зададим начальное состояние валового продукта X t 0  и пределы
возможного управления непроизводственным потреблением:
C min  C t   C max .
Используя результаты предыдущих рассуждений, опишем связь
состояния и управления так называемым уравнением движений:
X t  1  a
1

 X t    C t  .
t
b
b
В качестве критерия оптимальности состояния за счет использования
оптимального управления выберем следующий максимизируемый показатель:
t1
J    e t  C t dt  X t 1   max
t0
.
55
По существу это целевая функция задачи оптимизации, аргументами
которой служат функции состояния - валового продукта X t  и
управления - непроизводственного потребления C t  . Поэтому она
называется целевым функционалом.
Целевой функционал включает два слагаемых. Первое слагаемое
состоит
из
суммарного
(интеграл)
дисконтированного
непроизводственного потребления за весь период управления:
t1
e
t
 C t dt
t0
.
 t
В этом слагаемом e - взвешиваемая функция дисконтирования с
коэффициентом дисконтирования  .
Второе слагаемое, называемое терминальным членом целевого
функционала, состоит из величины объема выпуска валового продукта
X t 1  в конечный момент времени t 1 периода управления.
Весовые коэффициенты 
и 
определяют приоритеты
непроизводственного потребления и валового продукта:
    1.
Целевой функционал выражается числовым значением, которое
максимизируется за счет выбора соответствующего вида функции
управления - непроизводственного потребления C t  и получаемого при
этом с помощью уравнения движения вида функции состояния - валового
продукта X t  .
Таким образом, постановка задачи оптимального управления
развитием экономики сводится к установлению периода управления
(начального и конечного моментов времени), к определению, что будет
являться
состоянием
(валовый
продукт)
и
управлением
(непроизводственное потребление), к заданию начального состояния
(объема валового продукта в начальный момент времени периода
управления) и пределов изменения управления (минимального и
максимального
объемов
непроизводственного
потребления),
к
аналитическому описанию связи (уравнения движения) состояния
(валового продукта) и управления (непроизводственного потребления), и
наконец, к выбору показателя оптимальности (целевого функционала).
Поставленная задача оптимального управления развитием экономики
является математической моделью развития экономики.
3.2. Модель развития экономики: магистральная теория
Исходя из соотношений поставленной выше задачи оптимального
управления
развитием
экономики,
уменьшение
значения
56
непроизводственного
потребления
C t 
способствует
увеличению
X t  . Однако низкий уровень
значения валового продукта
непроизводственного потребления C t  приводит к снижению прироста
валового продукта X t  . Это объясняется, например, недостаточностью
подготовки трудовых ресурсов L , которая способствует увеличению
коэффициента приростной фондоемкости
b , и в итоге,
неудовлетворительной эффективности валовых капитальных вложений I .
Таким образом, на определенном уровне развития экономики
существует некоторая постоянная величина непроизводственного
потребления C t   Const , обеспечивающая приемлемый прирост валового
продукта X t  , и такое управление развитием экономики в этом периоде
времени близко к оптимальному. Полученные соотношения на данном
периоде времени называются магистралью.
Магистрали предшествует период времени и заканчивается она
периодом времени, в которых величина непроизводственного потребления
C t  находится на низком уровне, что соответствует оптимальному
управлению в эти периоды.
Сошлемся на образное представление сути магистрали и
магистрального функционирования экономики [10], поясняющее это
название. Допустим, что мы находимся в начальном пункте и нам нужно
на автомобиле переехать в конечный пункт. Неподалеку от начального и
конечного пунктов проходит автотрасса - аналог в данном случае
магистрали. Мы оптимальным образом от начального пункта по местной
дороге доезжаем до автотрассы, далее въезжаем на магистраль и едем по
ней до местной дороги, ближайшей к конечному пункту, после чего
съезжаем с магистрали и по местной дороге добираемся до конечного
пункта. Эта интерпретация дает интуитивное представление об
оптимальном развитии экономики.
3.3. Задача оптимального управления распределением
валовых капитальных вложений
Вернемся к рассмотрению производственно-технологической схемы
экономики (см. рис. 2.7). По этой схеме рост ОПФ K t  происходит за счет
валовых капитальных вложений I t  (инвестиций). Причем часть этих
инвестиций представляет собой амортизационные отчисления At  :
I t   At   V t  ,
 - коэффициент амортизации.
где At     K t  ,
57
А чистые капитальные вложения V t  пропорциональны приросту
ОПФ K t  :
dK t 
dt .
Последнее соотношение учитывает естественную постепенность
ввода в действие инвестиций. В совокупности все эти соотношения
представляют следующую зависимость:
dK t 
I t     K t  
dt ,
или
V t   q 
dK t 
    K t   I t 
dt
.
Полученное дифференциальное уравнение описывает связь между
ОПФ K t  и инвестициями (валовыми капитальными вложениями) I t  .
Если теперь считать ОПФ K t  состоянием, а валовые капитальные
вложения I t  - управлением, то можно сформулировать постановку
задачи оптимального управления распределением валовых капитальных
вложений.
t0  t  t1
Пусть
интервал
времени
управления
будет
продолжительностью от начального момента времени t 0 по конечный
момент времени t 1 .
Состояние описывается функцией ОПФ
функцией валовых капитальных вложений I t  .
K t  , а управление -
Тогда начальное состояние представляет собой величину K t 0  , а
Imin и
допустимое управление ограничивается минимальной
I m ax величинами возможных валовых капитальных
максимальной
вложений I t  :
I min  I t   I max .
В качестве уравнения движения (связь состояния - ОПФ K t  и
управления - валовых капитальных вложений I t  ) будем использовать
выведенное выше соотношение:
dK t 
    K t   I t 
dt
.
Целевой функционал (целевая функция от функции управления и от
функции состояния) представим в виде:
58
t1
J    I t dt  K t 1   min
t0
,
где  и  - весовые коэффициенты,     1 , устанавливающие
приоритеты требований, составляющих цель управления.
Экономический смысл представленного целевого функционала
раскрывается при рассмотрении следующих крайних случаев:
- при   1 и   0 целевой функционал отражает минимизацию
суммарного (интеграл) расходования инвестиций, т.е. максимально
экономного распределения валовых капитальных вложений;
- при   0 и   1 целевой функционал (его терминальный член)
выражает стремление максимизировать величину ОПФ к концу периода
управления.
Таким образом, в целевом функционале заложены два
противоположных требования, служащих одной и той же цели оптимальному управлению распределением валовых капитальных
вложений I t  для достижения оптимального состояния ОПФ K t  .
3.4. Общий вид задачи оптимального управления
Рассмотрев две классические задачи оптимального управления - задачу оптимального управления развитием экономики и задачу оптимального
управления распределением валовых капитальных вложений, представим
общий вид задачи оптимального управления в экономике. Для этого введем обозначения:
x t  - состояние экономической системы в момент времени t ,
ut  - управление экономической системой в момент времени t .
Тогда в общем виде задача оптимального управления примет вид:
- период управления
t0  t  t1 ,
- состояние
x t  ,
- управление
ut  ,
- начальное состояние
x t 0  ,
- допустимое управление
um in  ut   um ax ,
- уравнение движения
59
dxt 
 g  x t , ut , t 
dt
,
- целевой функционал
t1
J   p x t , ut , t   f  x t 1 , t 1   maxmin 
t0
.
Напомним, что в целевом функционале (функции от функций)
элемент f  x t 1 , t 1  называется терминальным членом.
Решением такой задачи оптимального управления является
выбранный вид функции управления ut  , для которого на всем периоде
управления t 0  t  t 1 выполняется условие допустимого управления
um in  ut   um ax и по уравнению движения определяется вид функции
состояния x t  . Тогда оптимальным решением этой задачи будут такие


функции управления u t  и состояния x t  , которые являются решением
и обеспечивают заданное экстремальное ( max или min ) значение
целевого функционала.
3.5. Метод решения задачи оптимального управления
Определив выше, что является решением задачи оптимального

управления, укажем способ нахождения оптимальной траектории u t 

(оптимального управления), приводящей к оптимальной траектории x t 
(оптимальному состоянию). Для этого воспользуемся методом множителей
Лагранжа, а затем ниже рассмотрим принцип максимума Понтрягина как
необходимое условие, позволяющее выявить неоптимальные траектории.
В совокупности комплексным методом решения задачи оптимального
управления является так называемый метод Лагранжа-Понтрягина.
Рассматривая общий вид задачи оптимального управления,
представим уравнение движения в однородном виде:
dxt 
g  x t , ut , t  
0
dt
.
Тогда задачу оптимального управления, являющуюся задачей
условной оптимизации, можно с помощью метода множителей Лагранжа
представить задачей безусловной оптимизации. Для чего введем функцию
множителя Лагранжа  t  и составим функцию Лагранжа из целевого
функционала задачи
уравнения движения:
оптимального
управления
t1
Lut ,  t    p x t , иt , t   f  x t 1 , t 1  
t0
60
и
ее
однородного
dxt  

   t  g  x t , ut , t  
dt
dt 

t0
.
t1
Оптимальным решением уже такой задачи, кстати, совпадающим с
оптимальным решением исходной задачи оптимального управления,


является седловая точка u t ,  t , для которой выполняется
неравенство:
Lut ,   t   Lu t ,   t   Lu t ,  t  .
Нахождение оптимального управления u t  гарантирует нахождение

оптимального состояния x t  по уравнению движения. Поэтому ниже

рассмотрим условие нахождения оптимального управления u t  .

3.6. Принцип максимума Понтрягина
Необходимые условия для решения задачи оптимального управления
(3.5) дает принцип максимума Понтрягина [7]. Согласно этому принципу


седловая точка, точнее, траектория, u t , t  определяется как решение
неравенства:
Lut ,  t   Lu t ,  t   Lu t , t  .



Если u t , t  - седловая точка, то u t  - оптимальное управление,
т.е. решение рассматриваемой задачи оптимального управления. Это
подтверждается рассмотрением неравенств правого и левого.
Правое неравенство:
Lu t ,  t   Lu t , t 
или
Lu t ,  t   Lu t , t   0
Оно всегда выполняется, т.е. выполняется при любом множителе

Лагранжа  t  и  t  , т.к. на оптимальной траектории выполняется
уравнение движения:
dx* t 
g x t , u t , t  
0
dt
.
Следовательно:
*
*
Lu t , t   Lu t , t    px * t , и* t , t   f x * t 1 , t 1   J u* t 



t1
t0
.
Рассмотрим левое неравенство:
Lut ,  t   Lu t ,  t .
Из него следует:
61
dxt  

*
J ut     * t  g  x t , ut , t  
dt  J u t 
dt 

t0
.
t1
Поэтому для всех управлений ut  , для которых выполняется
уравнение движения, выполняется также:
J ut   J u t ,
*
т.е. действительно u t  - оптимальное управление (решение) задачи
оптимального управления.


*
Таким образом, если u t ,  t  - седловая точка, то u t  оптимальное решение задачи оптимального управления. Поэтому
необходимые условия существования седловой точки являются
одновременно и необходимыми условиями максимума задачи
оптимального управления.
Принцип максимума дает лишь необходимые условия оптимальности.
Действительно, оптимальная траектория состоит из некоторых участков
управляющих траекторий, определенных по этому принципу [7].
3.7. Синтез оптимального управления
Решение поставленной задачи оптимального управления рассматривалось при заданных начальных условиях, в частности, для определенного
периода управления:
t0  t  t1 .
Однако можно потребовать решить задачу оптимального управления
для любых начальных условий - в общем случае. Такое общее решение
можно будет конкретизировать для любого заданного периода управления.
Таким образом, указываются два вида управления:
- управление по разомкнутому контуру;
- управление по замкнутому контуру (с обратной связью).

Оптимальное управление u t  по разомкнутому контуру полностью
определяется в начальный момент времени t 0 , а фазовая траектория

оптимального состояния x t  отыскивается по уравнению движения при
фиксированных начальных условиях.

Оптимальное управление u  xt , t  по замкнутому контуру (с
обратной связью) определяется как функция текущих фазовых координат
состояния x t  и времени t , т.е. решение принимается не заранее, а по
мере получения информации о текущих фазовых координатах.
Задача определения оптимального управления по замкнутому контуру
(с обратной связью) называется задачей синтеза.
62
Очевидно,
поиск
синтеза
оптимального
управления
u  xt , t 

значительно более трудоемкая процедура по сравнению с решением u t 
обычной задачи оптимального управления. С математической точки
зрения отыскание синтеза оптимального управления сводится к решению
нелинейного дифференциального уравнения с частными производными,
называемого уравнением Гамильтона-Якоби-Беллмана.
Вопросы для самопроверки
Какой функцией выражается состояние экономики в задаче оптимального управления развитием экономики?
Какой функцией выражается управление в задаче оптимального
управления развитием экономики?
Что описывает уравнение движения в задаче оптимального управления развитием экономики?
Что выражают слагаемые целевого функционала задачи оптимального
управления развитием экономики?
Приоритеты чего устанавливают весовые коэффициенты в целевом
функционале задачи оптимального управления развитием экономики?
Какие соотношения величины непроизводственного потребления и
валового продукта в задаче оптимального управления развитием экономики называются магистралью?
Чем характеризуется оптимальное управление в периоды времени,
предшествующие и последующие магистрали в задаче оптимального
управления развитием экономики?
Какой функцией выражается состояние в задаче оптимального управления распределением валовых капитальных вложений?
Какой функцией выражается управление в задаче оптимального
управления распределением валовых капитальных вложений?
Что описывает уравнение движения в задаче оптимального управления распределением валовых капитальных вложений?
Что выражают слагаемые целевого функционала задачи оптимального
управления распределением валовых капитальных вложений?
Из каких параметров, уравнения и функционала состоит задача оптимального управления в общем виде?
Какой элемент целевого функционала задачи оптимального управления развитием экономики, задачи оптимального управления распределением валовых капитальных вложений и задачи оптимального управления в
общем виде называется терминальным членом?
Что является решением задачи оптимального управления развитием
экономики, задачи оптимального управления распределением валовых капитальных вложений и задачи оптимального управления в общем виде?
63
Что является оптимальным решением задачи оптимального управления развитием экономики, задачи оптимального управления распределением валовых капитальных вложений и задачи оптимального управления в
общем виде?
В чем состоит суть комплексного метода Лагранжа-Понтрягина решения задачи оптимального управления?
Необходимые или достаточные условия оптимальности устанавливает
принцип максимума Понтрягина?
Чем различаются управления по разомкнутому и по замкнутому контурам?
Какая задача определения оптимального управления называется задачей синтеза?
К решению какого уравнения сводится отыскание синтеза оптимального управления?
Примеры решения задач
1. Какое должно быть непроизводственное потребление С t  на
интервале времени 0  t  1 для того, чтобы рост валового продукта
t
N
определялся зависимостью X t   e ?
Решение.
Используем уравнение движения:
dX t  1  a
1

X t   C t .
dt
b
b
Производная функции валового продукта:
 Nt
d  e
dX t 
 
dt
dt


  t
  eN



t

1 N
  e .

N

Подставим в уравнение движения:
1 N 1 a N 1
e 
e  C t  .
N
b
b
t
t
Выразим функцию непроизводственного потребления:
1
1 a N 1 N
C t  
e  e ,
b
b
N
t
t
t
b N 
b N
N
C t   1  a e  e   1  a  e .
N
N

t
b N

Ответ: C t    1  a  e .
N

t
t
64
2. Во сколько раз увеличится непроизводственное потребление C (t ) в
конечный момент времени t  1 по сравнению с начальным моментом
времени t  0 , если рост валового продукта определяется зависимостью
t
N
X t   e ?
Решение.
Функция непроизводственного потребления при
b

C 1   1  a  e N .
N

t  1:
1
Функция непроизводственного потребления при
b

C 0   1  a  e
N

0
N
 1 a 
t  0:
b
.
N
Тогда:
b

 1  a  e N
1
C 1 
N
N

e .
b
C 0
1 a 
N
1
1
N
Ответ: e .
3. Какие нужны капитальные вложения I t  на интервале времени
0  t  1 для того, чтобы воспроизводство основных производственных
t
N
фондов (ОПФ) определялось зависимостью K t   e ?
Решение.
Используем уравнение движения:
dK t 
  K t   I t  .
dt
Производная функции ОПФ:
 Nt
d  e
dK t 
 
dt
dt


  t
  eN



t

1 N
  e .

N

Подставим в уравнение движения:
t
t
1 N
e   e N  I t  .
N
Выразим функцию валовых капитальных вложений:
65
1
1

I t   e  e N     e N .
N
N

t
1 N

e .
Ответ: I t     
N

t
N
t
t
4. Рассчитайте значение целевого функционала, определяющего
качество изменения ОПФ на интервале времени 0  t  1 , при найденной
в задаче 3 функции
Решение.
I (t ) .
1
 1

J    I t dt   K 1      e N dt   e N 

0
0 N
t
1
1
0
 1
1 N
 1
  N
N
N
       e dt  e      N  e  e
N
0
N
 
1
t
1
1
1

N
  e 


1
 N1

N
  1  N  e  1   e .


1
 N1

N
Ответ: J   1  N  e  1    e .


I (t )
5. Во сколько раз нужно увеличить капитальные вложения
в ко-
нечный момент времени t  1 по сравнению с начальным моментом
времени t  0 для того, чтобы воспроизводство основных производt
N
ственных фондов (ОПФ) определялось зависимостью K t   e ?
Решение.
Функция валовых капитальных вложений (см. задачу 3) при t
1  N1

I 1     e .
N

Функция валовых капитальных вложений (см. задачу 3) при
1

I 0     e
N

0
N

1
.
N
Тогда:
66
 1:
t  0:
1

   e N
1
I 1 
N
N

e .
1
I 0

N
1
1
N
Ответ: e .
6. Рассчитать значение целевого функционала в задаче оптимального
управления развитием экономики на интервале управления 0  t  1 при
X t   e
t
bN
.
Решение.
Используем уравнение движения:
dX t  1  a
1

X t   C t .
dt
b
b
Производная функции валового продукта:
 bNt 
d  e 

t
t


dX t 
1



  e bN  
e bN .
dt
dt

 bN
Подставим в уравнение движения:
1 bN 1  a bN 1
e 
e  C t .
bN
b
b
t
t
Выразим функцию непроизводственного потребления:
1
1  a bN
1 bN
C t  
e 
e ,
b
b
bN
t
t
t
1 bN 
1  bN
bN
C t   1  a e  e   1  a  e .
N
N

t
t
Расчет значения целевого функционала:
1
J   e
 t
1
C t dt   X 1   e
0
 t
0
 1

  t

 bN

1
1

 1  a  e bN dt   e bN 
N

1 1

   1  a   e
dt   e bN 
N 0

1

  1  a     1  1  1   0 
1
N    bN 

 bN
 
bN

e
e
 e 


1



bN
1
67
t
1


1

1
1

N   bN 
bN
 1    e .
e
1



bN
1  a 


Ответ: J  
1
 1
1

N   bN 
bN
 1    e .
e
1



bN
1  a 
7. Рассчитать значение целевого функционала в задаче оптимального
управления распределением капитальных вложений на интервале управле
ния 0  t  1 при K t   e .
Решение.
Используем уравнение движения:
N
t
dK t 
  K t   I t  .
dt
Производная функции основных производственных фондов (ОПФ):
 N t 
d  e 


t 

dK t 
 N t


N

  e   e .
dt
dt
N


Подставим в уравнение движения:

N

e
N
t
  e

N
t
 I t  .
Выразим функцию валовых капитальных вложений:

I t  
N

e
N
t
 e

N
t



 t
 1
 t
    e N     1 e N .
N

N

Расчет значения целевого функционала:


1
 1
 t
J    I t dt   K 1      1 e N dt   e N 
N

0
0


 1
1 N t
N
   1   e dt   e 
N
0



0
 1
 N  N 1
N 
N
   1   e  e    e 
N


1
1
68

 N

  1  N  e  1    e N .



 N

N
Ответ: J   1  N  e  1    e .


8. Для роста валового продукта, определяемого зависимостью
t
N
X t   e , рассчитано, что непроизводственное потребление, т.е. управление в задаче оптимального управления развитием экономики, должно
b

быть C t    1  a  e N . Требуется определить, во сколько раз нужно
N

t
увеличить непроизводственное потребление, т.е. изменить управление в
задаче оптимального управления развитием экономики, для того, чтобы
рост валового продукта увеличился в
Решение.
При росте валового продукта в
будет иметь вид:
t
N
X Б t   e  e
1
N
e
t 1
N
e
e
1
N
1
N
раз.
раз функция валового продукта
.
Используем уравнение движения:
dX Б t  1  a
1

X Б t   C Б t  .
dt
b
b
Производная функции валового продукта:
 tN1 
d  e 
t 1 
t 1


dX Б t 
1 N


N

  e   e .
dt
dt
N


Подставим в уравнение движения:
t 1
t 1
1 N 1 a N 1
e 
e  C Б t  .
N
b
b
Выразим функцию непроизводственного потребления:
t 1
t 1
1
1 a N
1
C Б t  
e  eN,
b
b
N
t 1
t 1
t 1
b N 
b N
N
C Б t   1  a e  e   1  a  e .
N
N

69
Нужно увеличить
количество раз:
непроизводственное
потребление
в
такое
t 1
b

 1  a  e N
1
C Б t  
N

 eN .
t
C t 
b

 1  a  e N
N

1
N
Ответ: e .
9. Во сколько раз нужно уменьшить валовые капитальные вложения
(инвестиции) I t для того, чтобы основные производственные фонды

t
N

 1

   t
N

уменьшились с K t   e до K t  e
в задаче оптимального
управления распределением капитальных вложений?
Решение.
При K t   e
t
N
функция валовых капитальных вложений (см. задачу
1 N

e .
3) I t     
N

t
При
K М t   e
 1

   t
N

функция валовых капитальных вложений
определяется следующим образом.
Используем уравнение движения:
dK М t 
  K М t   I М t  .
dt
Производная функции ОПФ:
  N1    t 
 
d  e

 1

 1







t


  t
dK М t 
1




N
 
N



 e
    e
.


dt
dt
N


 
Подставим в уравнение движения:
 1

 1

  t
 1
  N    t
  e  N   I М t  .
   e 
N

Выразим функцию валовых капитальных вложений:
70
 1

 1

 1

  t
1   t
 1
   t
I М t      e  N   e  N   e  N  .
N
N

Нужно уменьшить валовые капитальные вложения в такое количество
раз:
 1

 1  1
   e N

      t
I t   N


N N

 1  N e
 1  N e  t .
 1

I М t 
1  N    t
e
N
Ответ: 1  N e  t .
t
Задания для самостоятельной работы
1. Какое должно быть непроизводственное потребление С t  на
интервале времени 0  t  1 для того, чтобы рост валового продукта
Nt
определялся зависимостью X t   e ?
2. Во сколько раз увеличится непроизводственное потребление C (t ) в
конечный момент времени t  1 по сравнению с начальным моментом
времени t  0 , если рост валового продукта определяется зависимостью
X (t )  e Nt ?
3. Какие нужны капитальные вложения I t  на интервале времени
0  t  1 для того, чтобы воспроизводство основных производственных
фондов (ОПФ) определялось зависимостью K t   e ?
Nt
4. Рассчитайте значение целевого функционала, определяющего
качество изменения основных производственных фондов (ОПФ).
5. Во сколько раз нужно увеличить капитальные вложения
I (t )
в ко-
нечный момент времени t  1 по сравнению с начальным моментом
времени t  0 для того, чтобы воспроизводство основных производственных фондов (ОПФ) определялось зависимостью K ( t )  e
71
Nt
?
6. Рассчитать значение целевого функционала в задаче оптимального
управления развитием экономики на интервале управления 0  t  1 при
X t   e
N
t
b
.
7. Рассчитать значение целевого функционала в задаче оптимального
управления распределением капитальных вложений на интервале управлеNt
ния 0  t  1 при K t   e .
8. Для роста валового продукта, определяемого зависимостью
X t   e Nt , рассчитано, что непроизводственное потребление, т.е. управление в задаче оптимального управления развитием экономики, должно
быть C t   1  a  bN e Nt . Требуется определить, во сколько раз нужно
увеличить непроизводственное потребление, т.е. изменить управление в
задаче оптимального управления развитием экономики, для того, чтобы
рост валового продукта увеличился в
eN
раз.
9. Во сколько раз нужно уменьшить валовые капитальные вложения
(инвестиции) I t для того, чтобы основные производственные фонды
 N   t
Nt
уменьшились с K t   e
до K t  e
в задаче оптимального
управления распределением капитальных вложений?


72
Заключение
В представленном учебном пособии рассмотрены
теоретические
основы теории оптимального управления, разобран ряд примеров
экономических задач данного типа. Рассмотренные в пособии задачи
иллюстрируют логику теории оптимального управления, не представляют
вычислительных сложностей и допускают ручной счет. В то же время
большинство реальных производственных задач являются объемными, что
не могут быть решены в разумные сроки без применения вычислительных
средств типа ЭВМ. Обозначенный «разрыв» между уровнями требуемых
средств
не
должен
создавать
впечатление
недостаточной
«приспособленности» изученного метода для решения реальных задач;
напротив, именно на объемных трудоемких задачах достоинства и
преимущества передовых математических методов проявляются наиболее
отчетливо.
В этой связи представляется целесообразным обучение студентов
программным средствам, позволяющим решать подобные объемные
задачи и в тоже время не требующие глубокого знания программирования
и нюансов математических методов. Среди таких программных средств
можно отметить табличный процессор Excel пакета Microsoft Office с
настройкой «Поиск решения» или OpenOffice.org Calc. Такой подход в
полной
мере отвечает современным тенденциям математизации наук
через посредство компьютерных технологий и позволяет эффективно
сочетать устоявшиеся традиционные методы преподавания математики «с
мелом у доски» с использованием современных программно-технических
средств.
Высокая
потенциальная
эффективность
математизации
не
реализуется самопроизвольно, а требует подготовки математически
грамотных специалистов. Подчас даже неглубокой математической
73
подготовки достаточно, чтобы понять, на каком направлении деятельности
предприятия или организации могут быть полезны математические
оценки, прогнозы и оптимизации. Напротив, недостаточный уровень
подготовки и понимания возможностей математики может служить
причиной отказа от применения математических методов даже в тех
случаях, когда они заведомо позволят выявить скрытые резервы и дать
значительный дополнительный экономический эффект.
Не подлежит сомнению, что изучение математики формирует
системность и аналитичность мышления, исключительно важные для
специалистов любых направлений. При этом важно показать, что
математика не есть «абстрактное искусство», демонстрирующее излишнее
усложнение действительности, - ее изучение позволяет овладеть мощными
методами количественного анализа, имеющими широкие практические
приложения. Данное положение во многом определяет отношение
студентов-экономистов ко всему циклу математических дисциплин, одним
из изящных разделов которого и является теория оптимально управления в
экономике.
74
Приложения
75
Приложение 1.
РЕШЕНИЕ ЗАДАЧ
OpenOffice.org Calc
ЛИНЕЙНОГО
ПРОГРАММИРОВАНИЯ
В
В данном пункте мы изучим возможности пакета OpenOffice.org Calc
при решении задач линейного программирования.
ПРИМЕР. Решить задачу линейного программирования:
L  5 x1  2 x3  min
 5 x1  x 2  2 x3  2
 x1  x3  x 4  5
 3x1  5 x 4  7
Для решения подобных задач в OpenOffice.org Calc предназначена
команда Поиск решения из меню Сервис.
В случае если этот пункт подменю отсутствует, необходимо просто
установить
расширение
scsolver.uno.oxt
(http://kohei.us/ooo/solver).
Последняя версия Solver (от 28 ноября 2007 года) позволяет решать задачи
как линейного, так и нелинейного программирования. Эта версия стала
более стабильной, кроме того появилась поддержка русского языка. Для
этого выполните команду в окне OpenOffice.org Calc Сервис→
Управление расширениями..., затем щелкните на кнопку Добавить (рис.
П.1.1), и отыщите в вашей файловой системе файл scsolver.uno.oxt (рис.
П.1.2). Нажатие на кнопку Открыть приведет к автоматической установке
расширения. Однако для того, чтоб начать его использовать, нужно
закрыть и снова запустить OpenOffice.org Calc.
76
Рис. П.1.1.
Пусть значения x1 , x2 , x3 , x4 хранятся в ячейках A1:A4. А значение
функции L в ячейке С1. Введем ограничения:
С2 =-5*A1-A2+2*A3
С3=-А1+А3+А4
С4=-3*А1+5*А4.
Рис. П.1.2.
Таким образом, мы задали условие исходной задачи линейного
программирования.
77
Выполним команду из главного меню Сервис→Поиск решения,
появится окно Оптимальное решение, представленное на рис. П.1.3.
Рис. П.1.3.
Устремим целевую функцию в ячейке C1 к минимуму. Для этого
введем в поле Целевая функция введем ячейку С1 и установим опцию
Минимум. В поле Параметры функции необходимо указать адреса
ячеек, в которых хранятся изменяемые значения. В нашем случае это
ячейки А1:А4.
Для добавления ограничений необходимо щелкнуть по кнопке
Добавить, появится диалоговое окно Ограничение (рис. П.1.4). В поле
ввода Ячейка необходимо ввести адрес ячейки, где хранится ограничение,
затем, щелкнув по стрелке, выбрать знак и ввести конкретное значение
ограничения в поле Ограничение. Щелчок по кнопке OK означает ввод
очередного ограничения и возврат к диалоговому окну Оптимальное
решение.
78
Рис. П.1.4.
В нашем случае окно будет иметь вид, изображенный на рис. П.1.5.
Щелчок по кнопке Решить начнет процесс решения задачи, который
завершится появлением системного диалогового окна, сообщающего, что
решение найдено.
Рис. П.1.5.
Щелчок по кнопке OK приведет к появлению в ячейке С1 значения
целевой функции L, а в ячейках A1:A4 - значений переменных x1  x4 , при
которых целевая функция достигает минимального значения.
Итак, назначение основных кнопок и окон диалогового окна
Оптимальное решение:
Поле Целевая функция - определяет целевую ячейку, значение
которой необходимо максимизировать или минимизировать, или сделать
равным конкретному значению.
Опции Максимум и Минимум определяют, что необходимо сделать
со значением целевой ячейки - максимизировать, минимизировать или
сделать равным конкретному значению.
Поле Параметры функции определяет изменяемые ячейки.
Изменяемая ячейка - это ячейка, которая может быть изменена в процессе
поиска решения для достижения нужного результата.
79
Окно Ограничения значений параметров перечисляет текущие
ограничения в данной задаче. Ограничение есть условие, которое должно
удовлетворяться решением; ограничения перечисляются в виде ячеек или
интервалов ячеек, обычно содержащих формулу, которая зависит от одной
или нескольких изменяемых ячеек, чье значение должно попадать внутрь
определенных границ или удовлетворять равенству.
Кнопки Добавить, Изменить, Удалить позволяют добавить,
изменить или удалить ограничение.
Кнопка Решить запускает процесс решения определенной задачи.
Кнопка Закрыть закрывает окно диалога Оптимальное решение, не
решая проблемы.
Кнопка Сброс очищает все текущие установки задачи и возвращает
все параметры к их значениям по умолчанию.
Кнопка Настройки выводит окно диалога, в котором можно
контролировать различные аспекты процесса отыскания решения (рис.
П.1.6).
Рис. П.1.6.
С помощью решающего блока можно решить множество различный
оптимизационных задач (задач на максимум и минимум) с ограничениями
любого типа. При решении задачи целочисленного программирования
необходимо добавить ограничение, показывающее, что переменные
целочисленные. При решении других оптимизационных задач вводят
целевую функцию и ограничения.
80
Приложение 2.
Планирование центром оптимального распределения
капитальных вложений между предприятиями методом динамического программирования
Метод ДП может быть использован как для динамических,
так и для статических систем. Здесь приведен пример использования метода ДП для оптимального распределения ресурсов, то
есть для решения статической оптимизационной задачи. Смысл
этой задачи состоит в следующем: центр должен так распределить имеющиеся у него капитальные вложения между своими
предприятиями, чтобы суммарная отдача от этих вложений для
центра была максимальной.
Целевая функция центра при этом имеет следующий вид:
N
J   f 0i (ui )  max
i 1
(П.2.1)
где функция f0i характеризует эффективность (отдачу) капитальных вложений ui в i-ое предприятие для центра, N - число
предприятий.
Типичная зависимость функций f0i(ui) приведена на рис
П.2.1.
f0i(ui)
ui
0
Рис. П.2.1. Типичная зависимость эффективности
капитальных вложений
Зависимости f0i(ui), приведенные на рис. П.2.1, можно аппроксимировать экспонентой или параболой. Возьмем последнюю как более простую функцию вида:
f 0i (ui )  Bi ui  Ai ui2 ,
81
где Ai, Bi - известные центру коэффициенты аппроксимирующих функций, Ai > 0, Bi > 0. Известен также суммарный объем
N
U   ui ,
i 1
капитальных вложений
подлежащий распределению
между предприятиями, ui - доля капитальных вложений в i - ое
предприятие.
Для постановки задачи в классическом виде введем новую
целевую функцию:
J1   J 
N 1
 f оп (un )  F ( x( N ))  min,
n 0
(П.2.2)
где n = i - 1 – новая нумерация предприятий от нуля до N - 1,
f оп (un )   f 0i (ui )  An un2  Bn un
n = 0  N - 1.
Для описания процесса распределения ресурсов между
предприятиями введем разностное уравнение вида:
x(n + 1) = x(n) + u(n), n = 0  N - 1,
(П.2.3)
где x - сумма распределенного капитала,
u - доля капитала, выделенная n-ому предприятию.
Задано ограничение на долю капитала в виде u(n)  0,
начальное условие x(0) = 0.
N
U   ui
i 1
При этом ограничение
примет следующий вид x(N)
= U. Это означает, что в процессе распределения
надо так раздавать капиталы (ресурсы), чтобы после их раздачи у центра ничего не осталось. В противном случае, если все
значения u(n) = 0, то весь капитал останется у центра, что противоречит условиям задачи. Эта ситуация должна быть наказана.
Для этого терминальную функцию F(x(N)) зададим в виде:
F ( x ( N ))  M x ( N ))  U 2 ,
(П.2.4)
где M - коэффициент штрафа центру, зададим его очень
большим числом.
Тогда с учетом (П.2.2) и (П.2.4) получим:
J1 
N 1

n 0
f оп (u( n ))  M x ( N )  U 2  min
.
82
(П.2.5)
Эта целевая функция совместно с разностным уравнением
(П.2.3) и заданными ограничениями ставит оптимизационную задачу планирования центру.
Решение. Для сформулированной задачи запишем уравнение Беллмана с краевым условием:
(n, x )  max (n  1, x  u)  f оп (n, u)
u 0
( N , x )   M ( x  U ) 2 .
uоп (n, x )  arg max (n, x )
u 0
тогда
,
где uоп(n, x) - оптимальное распределение ресурсов центра
для n-ого предприятия.
Пусть число предприятий N = 3, суммарный ресурс капитальных вложений центра U = 10(млн. руб.), а функции f0i заданы в виде:
f01 = 16u - 0,4u2
f02 = 18u - 0,6u2
(П.2.6)
2
f03 = 25u - 0,7u
При новой нумерации предприятий от нуля до N - 1 = 2 с
учетом (П.2.2) имеем:
f00 = - f01 = 0,4u2 – 16u
f01 = - f02 = 0,6u2 – 18u
f02 = - f03 = 0,7u2 – 25u
Оптимальное решение задачи планирования будем искать
методом ДП от второго предприятия к нулевому.
При n = 2 уравнение Беллмана:
(2, x )  max n  1, f ( x, u )   f 02 (u)
u 0
(3,x) = - M(x - u)2 оно при-
а с учетом краевого условия
мет вид:

( 2, x )  max  M ( x  u  10) 2  0,7u 2  25u
u 0

так как U = 10 , a f02(u) = 0,7u2 – 25u.
Поскольку число М  0, то для максимизации  оптимальное значение uоп(2) должно обратить в нуль значение в круглых
скобках, то есть (x + uоп-10) =0, откуда uоп(2) = 10 – x. При этом
( 2, x )  25(10  x )  0,7(10  x ) 2 .
При n = 1 получим следующее уравнение Беллмана:
83
(1, x )  max 2, f ( x, u )   f 01 (u ) 

u0

 max 25(10  x  u )  0,7(10  x  u ) 2  0,6u 2  18u 
u 0
 max (180  11x  7u  0,7 x 2  1,4 xu  1,3u 2 )
u 0
Возьмем от выражения в скобках производную по u и приравняем ее к нулю. В результате получим:
7 - 1,4x 2,6uоп = 0
или
b - 2,6uon = 0, где b = 7 - 1,4x.
На рис. П.2.2 построены прямые вида y = b – 2,6uоп при различных значениях коэффициента b = 7 – 1,4x.
y
b=0
b>0
b<0
uоп
0
Рис. П.2.2. Прямые вида y = b – 2,6uоп при
разных значениях коэффициента b
Так как по условиям задачи u   , то оптимальное значение
uоп(1) будет определяться по выражению:
 b
 2,69  0,54 x при b  0 ( x  5)

uоп (1)   2,6
 0
при b  0 ( x  5)
Подставим это значение uоп(1) в выражение для (1, x) и
получим:
 0,32 x 2  14,7 x  189,4 при x  5
(1, x )  
2
при x  5
  0,7 x  11x  180
84
При n = 0 уравнение Беллмана примет вид:
(0, x )  max 1, f ( x, n )   f 00 (u ) 
n 0
  0,32( x  u ) 2  14,7( x  u )  189,4  0,4u 2  16u при x  u  5
 max 
2
2
при x  u  5
 0,7( x  u )  11( x  u )  180  0,4u  16u
После раскрытия скобок и приведения подобных членов получим:
  0,72u 2  1,34u  0,66 xu  ... при x  u  5
(0, x )  max 
2
при x  u  5
 1,1u  5u  1,4 xu  ...
Здесь многоточие означает слагаемые, не зависящие от u.
Так как по условиям задачи u > 0, то неравенства x + u  5
и x + u > 5 приводят к условию 0  x  5.
d
du
Возьмем производную
при x + u  5 и приравняем ее
нулю. В результате получим: -1,44u + 1,34 - 0,66x = 0 или 1,44x + b = 0, где b = 1,34 - 0,66x.
По аналогии при n = 1 здесь получим значение оптимального управления
 b  0,92  0,46 x при b  0 (0  x  2)
uоп (0)  1,44
при b  0 (2  x  5)
 0
d
du
Теперь возьмем производную
при x + u > 5 и приравняем
ее нулю:
- 2,2u + 5 – 1,4x = 0 или - 2,2u + b = 0
где b = 5 – 1,4x, откуда
 b  2,27  0,64 x при b  0 (0  x  3,57)
uоп (0)   2,2
при b  0 (3,57  x  5)
 0
Так как мы получили два разных результата для uоп(0), следовательно, эта задача имеет два оптимальных решения.
Приведем одно из этих решений для первого выражения
85
0,92  0,46 x при 0  x  2
uоп (0)  
0 при 2  x  5

Так как x(0) = 0, то по этому выражению получим uоп(0) =
0,92 (млн. руб.)
Тогда x(1) = x(0) + uоп(0) = 0 + 0,92 = 0,92.
Для этого значения x определим uоп(1) по соотношению,
полученному при n = 1.
uоп (1) = 2,69 – 0,54  0,92 = 2,19 (млн. руб.)
Тогда x(2) = x(1) + uоп(1) = 0,92 + 2,19 = 3,11.
Для этого значения x определим uоп(2) по соотношению,
полученному при n = 2
uоп(2) = 10 – 3,11 = 6,89 (млн. руб.).
Убедимся, что uоп(0) + uоп(1) + uоп(2) = 0,92 + 2,19 + 6,89 = 10
(млн. руб.) = U.
В таблице П.2.1 приведены результаты расчетов функций f0i
и целевой функции центра J по приведенным выше формулам
(П.2.6) и (П.2.2) при оптимальном планировании.
Таблица П.2.1
i
1
2
3
uоп(i)
0,92
2,19
6,89
f0i
14,38
36,54
138,86
J =
189,78
В таблице П.2.2 приведены результаты расчетов функций f0i
и целевой функции центра J  по формулам (13) и (8) при неоптимальном планировании, когда все получили поровну, то есть
при
u(1)  u( 2)  u(3)  U3  10
 3,333
3
(млн. руб.).
Таблица П.2.2
i
u(i)
f0i
1
3,333
48,84
2
3,333
53,28
3
3,333
75,48
J =
177,6
Из этой таблицы видно, что при неоптимальном планировании получили J  = 177,6 < 189,78.
86
Второе оптимальное решение поставленной задачи найдем
при использовании второго выражения
2,27  0,64 x при 0  x  3,57
uоп (0)  
0 при 3,57  x  5

Так как x(0) = 0, то из этого выражения получим uоп(0) =
2,27 (млн. руб.).
Тогда x(1) = x(0) + uоп(0) = 2,27. Для этого значения x(1)
получим uоп(1) = = 2,69 – 0,54  2,27 = 1,464 (млн. руб.). Тогда
x(2) = x(1) + uоп(1) = 3,734.
Для этого значения x(2) получим:
uоп(2) = 10 - 3,734 = 6,266 (млн. руб.).
Проверка: uоп(0) + uоп(1) + uоп(2) = 10 (млн. руб.) = U.
Для этого варианта планирования значения функций f0i и целевой функции центра J по формулам (П.2.6) и (П.2.1) приведены в таблице П.2.3. Из нее следует, что этот максимум меньше
первого.
Таблица П.2.3
i
1
2
3
uоп(i)
2,27
1,464
6,266
f0i
34,26
25,066
129,166
J =
188,5
Если отдать весь капитал третьему предприятию, то есть u(1)
= 0, u(2) = 0, а u(3) = 10 (млн. руб.), то целевая функция центра
составит:
J  = f03 = 25u(3) – 0,7u2(3) = 250 – 0,7  100 = 180 < 189,78.
Таким образом приведенные расчеты показывают, что только
при оптимальном распределении капиталовложений между предприятиями целевая функция центра достигает своего максимального значения.
87
Приложение 3.
Применение метода ДП для поиска оптимального управления предприятием
Экономическая модель предприятия в непрерывном времени
описывается уравнением движения капитала:
dK
 I  K (t )
dt
,
(П.3.1)
где K - стоимость основных производственных фондов, I инвестиции на обновление ОПФ,  - коэффициент амортизации
ОПФ.
Из однопродуктовой модели имеем:
I = Y – C , где Y = X – W = X – aX = (1 – a) X, X - произведенный продукт, Y - конечный продукт, 0 < а < 1 - доля продукта, идущая в производство, C - непроизводственное потребление.
u
C
Y
Введем управление
, показывающее, какая доля конечного продукта (в денежных единицах) направляется на непроизводственное потребление в виде зарплаты, премий и т.д. для людей, работающих на предприятии, причем 0 < u <1.
Тогда
I = (1 – u) Y = (1 – a) (1- u) X .
(П.3.2)
Подставим это выражение в (П.3.1) и получим дифференциальное уравнение, описывающее движение ОПФ предприятия
dK
 (1  a )(1  u ) X  K (t )
dt
.
(П.3.3)
Заданы начальное условие K(0), ограничение на управление
0  u  1 и интервал управления t = 0  T. В качестве целевой
функции выберем интегральное среднедушевое непроизводственное потребление каждого сотрудника предприятия на продолжительном интервале управления t = 0  T, выражаемое формулой:
T
C
dt  max
L
0
J
,
(П.3.4)
где L - количество работающих на предприятии.
Известно, что при большом интервале управления T происходит дисконтирование (обесценивание) с годами заработанных
88
средств. Для учета этого процесса введем в целевую функцию
фактор дисконтирования, тогда она примет вид:
T
C  t
e dt  max
L
0
J
,
(П.3.5)
где  - коэффициент дисконтирования.
Введем в исходное уравнение (П.3.3), описывающее модель
предприятия, относительные переменные
женность,
x
c  CL
k
K
L
- фондовоору-
- среднедушевое непроизводственное потребле-
X
L - производительность труда на предприятии. Тогда с
ние,
учетом новых (относительных) переменных получим из (П.3.3)
d (kL )
 (1  a )(1  u ) xL  kL.
dt
d (kL ) dk
dL

Lk
dt
dt
dt , где
Так как
dL
 nL
dt
прирост трудовых
ресурсов, n - коэффициент, характеризующий прирост или спад
d (kL )  dk

   kn  L.
 dt

трудовых ресурсов. Тогда dt
Подставим это выражение в исходное уравнение, разделим
левую и правую части на L и получим
dk
 (1  a )(1  u ) x  (  n )k
dt
(П.3.6)
Для описания нормированной модели введем также нормированную производственную функцию Кобба-Дугласа
1
F ( K , L, t ),
L
где X  F ( K , L, t ) - функция Кобба-Дугласа.
x  f (k , t ) 
Начальные условия на стоимость ОПФ заменим на начальное
k (0) 
K ( 0)
L
условие фондовооруженности
. Для нормированных
переменных целевая функция примет вид:
T
T
C
J   e  t dt   (1  a )u x e  t dt
L
0
0
т. к.
(1  a ) u x  (1  a )
C
Y
,

(П.3.7)
X
L

89
C
(1  a ) YX
L
 CL (1  a ) (1Xa ) X  CL .
Из выражений (П.3.6) и (П.3.7) следует, что в нормированной оптимизационной задаче состоянием системы являются фондовооруженность k , а управлением являются нормированная
функция производства x  f (k , t ) и доля непроизводственного
среднедушевого потребления u, то есть произведение x u.
Решение поставленной задачи будем искать методом ДП.
Для приведения ее к классическому виду, когда ищется минимум
целевой функции, вместо функции
(П.3.7) введем новую целевую функцию:
T
J 1   J    (1  a ) u x e  t dt  min
.
(П.3.8)
Функция R с учетом (П.3.6) и (П.3.8) примет вид:
0
R ( k , x , u, t ) 
 
 (1  a )(1  u ) x  (  n )k   (1  a ) u x e  t
t k
.
Чтобы функция  не зависела от управления x u, выделим в
функции R слагаемые, зависящие от x u, и приравняем сумму коэффициентов при них нулю. В результате, получим уравнение:

 e  t (1  a )  0,
k

 e  t
 t
откуда k
или d  e dk . Решение этого уравнения
 t
имеет вид (k , t )  ke  c(t ). Положим для простоты c(t )  0 и
 (1  a )
 t
получим (k , t )  ke .



 ke  t .
t
При полученных выражениях t и k
Тогда
функция R не будет зависеть от управления u и примет вид:
R( k , x, t )  e  t (1  a ) x  (  n )k   ke  t  e  t (1  a ) x  (  n  )k 
(П.3.9)
Оптимальные процессы k оп (t ) и xоп (t ) найдем из условия:
kon (t ), xon (t )  arg
max
0 x  f (k ,t )
R(k , x, t ).
Так как a < 1, то (1 – a) > 0, следовательно максимум R по x
достигается при xоп  f (k , t ). Теперь проведем максимизацию R
по k при x  xоп  f (k , t ).
90
 t
Так как e  0 не зависит от k, то вместо R введем более
простую функцию r(k , t ) вида:
r(k , t ) 
R( k , x, t )
e
 t
 (1  a ) f (k , t )  (  n  )k
(П.3.10)
и будем искать оптимальную фондовооруженность из условия kоп (t )  arg max r (k , t ). Вначале исследуем функцию r(k , t ) графически.
На рис. П.3.1 приведена зависимость r(k , t ) от k при f (k , t )
вида (П.3.11).
r(k,t)
(1-a)f(k,t)
rmax
r(k,t)
0
k
kоп
(+n+)k
Рис. П.3.1. Зависимость функции r(k , t ) от k
Из этого рисунка видно, что функция r(k , t ) имеет максимум
rmax при k оп .
Найдем это значение k оп .
Для этого введем нормированную производственную функцию Кобба-Дугласа вида:
x  f ( k , t )  be t k  ,
(П.3.11)
где b - параметр нормированной функции Кобба-Дугласа,
 - коэффициент, характеризующий темпы роста научнотехнического прогресса,
 - коэффициент эластичности по фондам.
91
Необходимым условием максимизации r  (k , t ) по k явля-
r
:

k
ется (см. рис. П.3.1) равенство нулю производной
r
 0,
k
t
 1
т. е. (1  a)be   kоп  (  n  )  0.
Так как 0 <  < 1, то из этого уравнения получим:
1
 (1  a )b  1 1t
kоп (t )  
 e
n 
.
(П.3.12)
Это уравнение оптимальной фондовооруженности предприятия по критерию (П.3.5) называется магистралью. График зависимости магистрали от времени t приведен на рис. П.3.2.
kоп(t)
kоп(0)
t
0
T
Рис. П.3.2. График зависимости оптимальной фондовооруженности предприятия от времени
Для определения оптимального управления uоп (t ) предприятием возьмем производную
(П.3.12) и получим:
dkоп ( t )
dt
от уравнения магистрали
dkоп (t )


 k оп (t ).
dt
1 
(П.3.13)
Подставим это выражение в дифференциальное уравнение
(П.3.6), описывающее нормированную модель предприятия и с
учетом (П.3.11) получим:

uоп (t )  1 
  n  1 
(1  a )bet kоп (t ) 1 .
(П.3.14)
92
kоп (t )
 1
 (1  a )b 


n 
1
e  t ,
Так как
то после подставки этого выражения в (П.3.14) окончательно
получим:

uоп  1  
  n  1 
n
(П.3.15)
Из этого выражения видно, что оптимальное управление uоп

1 

в данной модели не зависит от времени и при условии
определяется как uоп  1    , где   коэффициент эластичности
по труду.
93
Приложение 4.
Учет начальных условий. Траектория выхода на магистраль
Если заданное начальное условие фондовооруженности
предприятия k (0) совпадает с начальным значением уравнения
k (0)  k (t )
оп
t  0 , тогда полученное уравнемагистрали k оп , то есть
ние магистрали (П.3.12) есть уравнение оптимального развития
экономической модели предприятия.
Однако часто условие k (0)  kоп (0) не выполняется, обычно
k (0)  k оп (0), то есть начальное условие фондовооруженности не
лежит на магистрали, а находится ниже точки kоп (0).
В этом случае для выхода на магистраль (П.3.12), на которой обеспечивается максимум интегрального среднедушевого
непроизводственного потребления, приходится сначала ограничивать среднедушевое потребление необходимым минимумом
u1  uоп , чтобы увеличить инвестиции, нарастить фондовооруженность и выйти на магистраль.
kоп, 
kоп(0)
k(0)
0
(t)
t
t1
T
Рис. П.4.1. Траектория выхода на магистраль (t )
На рис. П.4.1 эта траектория выхода на магистраль показана
зависимостью  на участке времени t = 0  t1, где t1 – время выхода на магистраль, после которого следует установить u = uon.
На участке выхода на магистраль t = 0  t1 управление u = u1 < uon
Функция  является решением дифференциального уравнения нормированной однопродуктовой модели предприятия при
фиксированном значении управления u1
94
dk
 (1  a )(1  u1 )bet  k   (  n )k
dt
и соответствующим заданным краевым условием k (0) .
Перепишем это уравнение в виде:
dk
 k  a0 (1  n1 )et k  ,
dt
где a0  b(1  a ),     n.

Введем новую переменную z  k , где   1   - коэффициент эластичности по труду.
dz
dk
dk
  k  1 
 k    ,
dt
dt
dt откуда
dk 1  dz
 k
.
dt 
dt
Тогда
Подставим это выражение в исходное уравнение и получим:
1  dz
k
 k  a0 (1  u1 )et k 

dt
.

Разделив левую и правую части на k , получим:
1 dz
 z  a0 (1  u1 )et .
 dt
Это неоднородное линейное дифференциальное уравнение
первого порядка. Общее решение его равно сумме
z  z00  zчн ,
где z 00 - общее решение однородного дифференциального
уравнения (при нулевой правой части) вида
1 dz
 z  0,
 dt
где zчн - частотное решение неоднородного дифференциаль-
ного уравнения.
Общее решение однородного дифференциального уравнения имеет вид:
z00  c0 e p1t ,
где c0 - константа, подлежащая определению,
p1 - корень характеристического уравнения
куда p1  .
 t
z00  c0 e
.
Тогда
Частотное решение имеет вид:
95
1

p    0,
от-
zчн  Bet ,
где B – коэффициент, который определим из исходного дифференциального уравнения. Для этого найдем производную
dzчн
dt
 B e t
и подставим ее в исходное дифференциальное уравнение, в результате получим
B t
e  Bet  a0 (1  u1 )et .

t
Разделим обе части на e и определим коэффициент
B
a0 (1  u1 )



.
1


Так как z  k , то k  z , тогда уравнение траектории выхо-
да на магистраль (t ) будет определяться из соотношения
1
 (t )  ( z00  zчн )   (c0 e  t 
a0 (1  u1 )



1
et )  .
(П.4.1)
Константу c0 найдем из граничного условия
1



a0 (1  u1 ) 
 (0)  k (0)   c0  
 ,







откуда
c0  k  (0) 
a0 (1  u1 )



.
(П.4.2)
Время выхода на магистраль t1 определяется из уравнения
k оп (t1 )   (t1 ), где k оп (t1 ) определяется при t = t , а  (t1 ) - из по1
лученного соотношения (П.4.1) при t = t1. После подстановки
получим:
1
1


 a0 

 e
 

t
 1



a
(
1

u
)
1 t1 
  c0 e  t1  0 
e  .







Возведем левую и правую части в степень  и получим:
96
a0  t1
a (1  u1 ) t1
e  c0 e  t1  0 
e



 t
Помножим левую и правую части на e 1 и получим:
a0 
a (1  u1 )
 c0 e  (   )t1  0 
,



откуда
e
 (   )t1


1  a 0  a 0 (1  u1 ) 
 
 
.
c0    






Возьмем от левой и правой части логарифм ln и окончательно получим формулу для расчета времени выхода на магистраль
t1
 


a

a
(
1

u
)
1
1
1 
t1  
ln   0  0 

    c0    



 

 ,
(П.4.3)
где константа c0 определяются по выражению (П.4.2).
Если при заданном u1 окажется, что t1 < T , то задача выхода
на магистраль может быть решена. В противном случае при t1 >
T выход на магистраль за отведенное время управления T невозможен. В этом случае нужно либо уменьшить величину u1, либо
отказаться от мечты выйти на магистраль в течении времени T.
Если время выхода на магистраль t1 < T , то управление предприятием осуществляется по графику, приведенному на рис.
П.4.2.
u(t)
uоп
u1
t
t1
T
Рис. П.4.2. График управления предприятием при
97
выходе на магистраль и на магистрали
Приведем пример расчета управления предприятием, выпускающим продукцию на интервале времени t = 0  21 год.
Начальное состояние предприятия: начальный капитал K(0) =
204,2 (млн. руб.), среднее число работающих на предприятии за
год L(0) = 109 (чел.).
Тогда фондовооруженность на нулевой год составит:
k (0) 
K (0) 204,2

 1,868
L(0)
109
(млн. руб. на 1 чел.)
Руководство предприятия хочет обеспечить максимум слеJ
21
C
Le
0
дующей целевой функции
водственное потребление за год.
Параметры нормированной
dt  max,
где C – непроиз-
производственной
x  a0 et k 
Кобба-Дугласа
a0  2,189;
 t
  0,0239;   0,249.
функции
следующие:
Параметры, входящие в уравнение магистрали
1
1

 
t
 a0 
1
kоп (t )  
 e 
  n  
следующие:   0,0769; n  0,0053;   0,1.
Подставим приведенные значения в уравнение магистрали и
получим
kоп (t )  4,306e 0,0318 t
Проверим, совпадает ли эта магистраль с начальным значением фондовооруженности предприятия k(0) = 1,868 (млн. руб.
на 1 чел.). Для этого подставим в уравнение магистрали t = 0 и
получим kоп(0) = 4,306. Оказалось, что k(0) < kоп(0), следовательно уравнение магистрали не согласуется с начальным значением
фондовооруженности предприятия.
Формула для расчета оптимальной доли средств, идущих на
непроизводственное потребление, имеет вид:

uоп
  n  1 
C
  1 
.
Y
n
Подставим в нее численные значения параметров и получим:
98
0,0239
1  0,249
 0,844 .
0,0769  0,053  0,1
0,0769  0,0053 
uоп  1  0,249
Так как магистраль не совпадает с начальным условием по
фондовооруженности, причем k(0) > kоп(0), то доля непроизводственного потребления не может быть установлена на всем интервале управления t = 0  21 год.
Определим время выхода на магистраль t1 при установленной доле непроизводственного потребления
формуле
u1  YC  0,5  uоп
 

1
1  a0  a0 (1  u1 ) 

t1  
ln

,
 
    C0    



 
 
    n  0,0822;   1    0,751; C0  k  (0) 
где
a0 1  u1 


по
.
При указанных выше параметрах результат вычисления по
этой формуле дает следующий результат: t1 = 2,2477  2,25 года.
Тогда на интервале времени
t = 0  t1 управление u = u1 = 0,5,
а на интервале времени t = 2,25  21 год
u = uon =
0,844.
99
Приложение 5. Постановка задачи и критерии оптимального управления в динамических системах
Разнообразные реальные процессы, происходящие в окружающем мире, зачастую являются управляемыми, т.е. протекают
различным образом в зависимости от конкретного воздействия на
них управляющей стороны. При этом естественным является
стремление выбрать в некотором смысле оптимальное управляющее воздействие, т.е. наилучшее по сравнению со всеми другими возможными способами управления. Исторически задачи оптимизации встречались еще в древние века, однако интерес к ним
особенно вырос в последнее время, что связано, в частности, с
ограниченностью природных ресурсов, развитием техники и ростом возможностей ЭВМ, благодаря которым стали осуществимы
расчет и реализация сложных законов управления.
Результаты первоначального развития теории оптимизации
объединяются в рамках классического математического анализа и
вариационного исчисления, основным предметом изучения которого является исследование гладких функций и функционалов,
определенных во всем пространстве или на гладком многообразии. При этом необходимые условия экстремума записываются в
виде условий стационарности (обращение в нуль производной
или градиента функции, уравнение Эйлера и т.д.).
Однако в процессе эволюции общества возникли новые задачи управления, в которых управляющие параметры могут принадлежать некоторому замкнутому множеству.
Необходимость управлять процессом оптимально, т.е.
наилучшим в определенном смысле образом, возникает в системах, характеристики которых меняются во времени под влиянием
управлений. К такому классу систем относятся и экономические
системы. Для того чтобы сформулировать на математическом
языке задачу управления в таких системах, необходимо ввести
некоторые понятия и построить соответствующую математическую модель.
Важнейшими понятиями в теории оптимального управления
являются понятия состояния системы и управления. Будем рассматривать системы, состояние которых может быть в любой

X
момент времени определено вектором
m-мерного
векторного


пространства с координатами X  ( x1 , x2 , , xm ), X  X . Простран-
ство X будем называть пространством состояния системы, а
элементы x1 , x 2 , , x m - переменными состояния системы.
Так как система изменяется во времени, то ее поведение
можно описать последовательностью
 состояний. Такую последо-
вательность состояний системы X (t )  x1 (t ), x2 (t ), , xm (t )  называют траекторией системы.
Переменную t, которая является независимой, назовем аргументом процесса. Аргументом процесса может быть любая величина, но чаще всего – время. Переменная t может пробегать
некоторый отрезок числовой прямой, если t  t0 ,t1  или отрезок
натурального ряда t = t0 , t0 + 1,  , T. В первом случае процесс,
происходящий в системе, называется непрерывным, во втором
случае – дискретным или многошаговым. Системы в этих случаях называются соответственно непрерывными и дискретными
(многошаговыми).
Изменение состояния системы, т.е. процесс в ней, может
происходить под воздействием управляющих воздействий. Будем
рассматривать системы, управляющие воздействия в которых
моделируются с помощью элементов r–мерного векторного пространства U:


U  (u1 , u2 , , ur ). U U  Rr .
Управляющие воздействия могут задаваться в виде функций
от t. Тем самым реализуется определенный способ управления
системой. В этом случае будем говорить о задании программы
управления U (t )  u1 (t ), u2 (t ), , ur (t ).
На возможные
(допустимые) состояния системы


X (t ) и
управления U (t ) могут быть наложены ограничения. Ограничения на состояние системы и управление могут быть записаны в
виде

X  X  Rm ,

U U  Rr ,
где X , Rm ,U , Rr - пространства с размерностями m и r соответственно.
101

V
Вектор , образованный парой функций


X (t),U (t), назовем
процессом с допустимым

 пространством V размерности m+r.
X (t ),U (t ) имеется связь: как только задано
Между функциями

управление U (t ) системой,
то последовательность ее состояний

X (t ) определяется однозначно. Связь меж(траектория

системы)
ду X (t ) и U (t ) моделируется по-разному в зависимости от того,
является система непрерывной или дискретной. Для непрерывных систем модели процессов описываются в пространстве состояний системой дифференциальных уравнений вида
dxi
 f i (t , x1 ,, x m , u1 ,, u r ), i  1, 2,, m
dt
,
(П.5.1)
где fi – известные (линейные или нелинейные) функции,
Систему уравнений (П.5,1) можно записать в векторной форме в виде
   
X  f (t, X ,U ) ,
(П.5.2)
или в виде
 
xi  f i (t , X ,U ),
i  1, 2, , m;
xi 
dxi
dt .
Пусть задано состояние, в котором система находилась в
начальный момент t0 . Этот момент в дальнейшем для определенности примем равным нулю, а момент окончания процесса t1
равным T. Тогда аргумент процесса t изменяется в пределах 0 
t  T, а начальным состоянием системы будет вектор

X (0)   x1 (0), x2 (0),, xm (0)  ,
где xi(0) – начальное значение i–той координаты вектора состояния системы.
Проанализируем, каким образом модель отражает связь между управлением и состоянием системы, изменяющимся под воздействием управления.
Пусть на промежутке 0  t  T задано

управление U (t ) . Подставляя его в правую часть системы (2), получим
   
X  f (t, X ,U (t ))
(П.5.3)
102
Имеем систему дифференциальных
уравнений относительно

X . Решая ее с учетом начальных
неизвестной

 вектор - функции
условий X (0) , получим X (t ) . Это решение
и есть траектория, от
вечающая заданному управлению U (t ) . При этом мы предполагаем, что для системы (П.5.3) выполнены условия, обеспечивающие
существование и единственность ее решения при заданных
начальных условиях (решение задачи Коши).
Итак, задание управления в непрерывной модели однозначно
определяет ее поведение. Задавая различные законы управления,
получаем, следовательно, различные траектории системы.
Модель дискретной управляемой системы имеет вид системы
разностных уравнений:
xi (t  1)  f i t , x1 (t ),, x m (t ), u1 (t ),, u r (t ) , i  1, 2,, m
В векторной форме эту модель, как и в непрерывном случае,
будем записывать
в виде




X (t  1)  f t, X (t ),U (t ) ,
или в виде


xi (t  1)  f i t, X (t ),U (t ) , i  1, 2,, m
(П.5.4)
Здесь t – номер цикла принимает дискретные значения t = 0,
1, 2, , T - 1. Начальное значение X (0) будем, как и выше, считать известным.
В дискретной системе,
как и в непрерывной, задание про
граммы управления U (t ) при t = 0, 1, 2, , T – 1 позволяет однозначно определить соответствующую ей траекторию системы.
При этом в дискретном случае не требуется наложения какихлибо условий на правые части уравнений (П.5.4), как в непрерывном случае, где требовалось обеспечить существование и
единственность
задачи Коши. В самом деле, при подстановке

значения U (t ) в правую часть (П.5.4) получаем систему уравне
X
ний, которая позволяет при известном значении
состояния (t ) в

момент времени t определить состояние X (t  1) в следующий
момент
времени. Так как в начальный момент t = 0 состояние

X (0) известно, то, подставив его в правую часть (4), получим




X (1)  f 0, X (0),U (0)  .
103

X
Подставляя затемнайденное значение (1) и t = 1 в (4), так
же найдем значение X (2) . Продолжая этотпроцесс, через T шагов получим последнее искомое значение X (T ) .
Таким образом и в дискретном случае уравнения модели
(4)

позволяют однозначно определить траекторию системы X (t ) , если задано управление U (t ) .  

Следовательно, процесс V  X (t ),U (t ) должен удовлетворять
следующим ограничениям:





Процессы X (t )  X , U (t ) U или V  X (t ),U (t )V при всех 0
 t  T.



X
(
t
),
U
(t ) удовлетворяет системе уравнений (П.5.2) в
Пара
непрерывной модели при t  [0, T ] или (П.5.4) в дискретной модели при t = 0, 1, , T – 1.

X
Заданы начальные условия (0) .


В непрерывной модели на вектор-функции X (t ),U (t ) накладываются некоторые
дополнительные ограничения: вектор–

функцию U (t ) будем считать кусочно-непрерывной, а векторфункцию X (t ) - непрерывной
и кусочно-дифференцируемой.



Процессы V  X (t ),U (t ), удовлетворяющие указанным условиям, будем называть допустимыми. Таким
образом, допустимый

процесс - это программа управления U (t ) и соответствующая ей
траектория системы X (t ) , удовлетворяющие перечисленным
ограничениям.
Множество допустимых процессов в задачах оптимального
управления представляет собой множество M допустимых элементов. Теперь для постановки оптимизационной задачи необходимо ввести в рассмотрение целевую функцию или функционал
J, заданный на множестве M. Задача оптимального

управления

будет состоять в выборе такого элемента Vоп  X оп (t ),U оп (t )
множества M, на котором функционал J достигает экстремального значения. Такой процесс
мы будем называть оптимальным

U оп (t ) - оптимальным
процессом, управление

траекторию X оп (t ) - оптимальной траекторией.
104
управлением, а
Функционал J, заданный на множестве допустимых процессов, описывает цель, согласно которой оптимизируется процесс,
поэтому его часто называют целевой функцией.
Значение J(V0), которое функционал J принимает на данном
процессе V0, характеризует качество процесса и позволяет сравнить два любых процесса. Оптимальным, т.е. более предпочтительным по сравнению с любым другим процессом, будет тот,
где значение функционала минимально (максимально).
В задачах оптимального управления для непрерывных систем
чаще всего применяются интегральные функционалы следующего вида:
T
 

J   f 0 (t, X ,U )dt  F X (T )   min
,
0
(П.5.5)
 

f
(
t
,
X
,
U
),
F
(
X
) - заданные подынтегральная и терми0
где
нальная функции. Выражение (П.5.5)

 позволяет вычислить для
каждого допустимого процесса X (t ), U (t ) определенное значение
J и тем самым задать функционал на множестве
допустимых
про

цессов. Для этого необходимо
подставить X (t ), U (t ) вместо аргу 
ментов функции f 0 (t, X ,U ) , которая становится функцией времени, после чего вычислить интеграл. Затем к значению интеграла

прибавляем
 
значение
терминальной
функции
F(X )
при
X  X (T ) .
Функционал J состоит из двух частей: значения интеграла
T

 
f 0 (t , X ,U )dt

F X (T )  - терми-
и функции конечного состояния
нальной функции.

Первое из этих слагаемых оценивает качество
0
процесса на X (t ), U (t ) на всем промежутке [0, T], второе слагаемое – качество конечного состояния системы. Иногда в задачах
оптимального управления конечное состояние системы X (T ) задается. В этом случае второе слагаемое функционала (П.5.5) есть
величина постоянная и, следовательно, не влияет на его минимизацию. Такие задачи называются задачами
с фиксированным пра
вым концом траектории. Условие X (T )  X 1 следует добавить в
качестве дополнительного ограничения к условиям, определяю105
щим множество допустимых процессов. Функционал (П.5.5) выбирается таким образом, чтобы содержательный смысл входящих
в него слагаемых отвечал цели управления в конкретной задаче.
В частных случаях любое из слагаемых в (П.5.5) может отсутствовать. Тогда функционал будет иметь вид
T
 
J   f 0 (t , X ,U )dt  min
,
0
(П.5.6)
или

J  F  x (T )   min .
(П.5.7)
Возникающие в этих случаях оптимизационные задачи могут
быть сведены одна к другой и, следовательно, ни одна из них не
является более общей.
В литературе по оптимальному управлению оптимизационные задачи с функционалом вида (П.5.5) называют задачами
Больца, с функционалом вида (П.5.6) - задачами Лагранжа, а с
функционалом вида (П.5.7) - задачами Майера.
Покажем, что задача Больца может быть сведена к задаче
Майера. Для этого введем еще одну скалярную переменную состояния xm+1(t), определяемую соотношениями
 
x m 1 (t )  f 0 (t, X ,U ),
xn 1 (0)  0 .
Тогда
T
 
xm 1 (T )   f 0 (t, X ,U )dt
0
.
Поэтому функционал (П.5.5) можно записать следующим образом в виде (П.5.7)

J  xm 1 (T )  F X (T )  ,
что соответствует задаче Майера.
Аналогично
в случае дифференцируемости по времени

функции F X (T ) задача Майера может быть сведена к задаче Лагранжа.
106
Отметим, что если в задаче Лагранжа (П.5.6)
подынтеграль 
ная функция равна единице, т.е. f 0 (t, X ,U )  1 , то функция
T
J   dt  T  min
.
Такая задача, заключающаяся в минимизации времени
управления T, называется задачей на быстродействие.
Функционалы вида (П.5.5) охватывают широкий класс задач
оптимального управления, в том числе и оптимизации экономических процессов.
Для задач оптимизации в дискретных системах функционал
имеет вид
0
J
T 1






f
t
,
X
(
t
),
U
(
t
)

F
X
(T )   min
 0
t 0
.
(П.5.8)
К функционалу (П.5.8) относятся все замечания и комментарии, сделанные к функционалу (П.5.5).
Итак, мы определили все понятия, необходимые для постановки задач оптимального управления. Поставим задачу о минимуме функционала (П.5.5) в непрерывном и (П.5.8) в дискретном



V

X
(
t
),
U
(t )  .
случае на множестве M допустимых процессов
Она может быть сформирована в двух вариантах:
оптимальный процесс для непрерывной системы
 Определить


Vоп  X оп (t ),U оп (t )  , чтобы J = min.
Определить минимизирующую
последовательность для дис


кретной системы Vоп  X оп (t ),U оп (t ) , чтобы J = min.
Задача оптимального управления, как правило, ставится в
первом варианте. Но тогда она, как мы убедились, не всегда имеет решение. В то же время во втором варианте задача оптимального управления всегда имеет решение, если только функционал
J ограничен снизу на множестве M. Последнее условие часто
удается проверить достаточно просто. Например, в большом
ко 

личестве экономических приложений функции f 0 (t, X ,U ), F ( X )
являются неотрицательными при любом наборе аргументов. В
этом случае функционал J не может принимать отрицательных
значений. Следовательно, он ограничен снизу.
107
В теории оптимального управления термины «состояние» и
«управление» имеют наглядный содержательный смысл. Он заключается
в том, что, как отмечалось выше,
задавая управление


U (t ) , мы задаем и траекторию процесса X (t ) , а изменяя програм
U
му (t ) - управляем процессом. Здесь t = 0, 1, 2,  - номера цик-
лов.
Кроме того, имеются и некоторые
формальные отличия: в

непрерывном варианте состояние X (t ) входит в уравнение про
цесса вместе со своей производной X (t ) , а управление U (t ) непосредственно. Это обуславливает различные математические
требования
к классам функций, к которым принадлежат
функции



X (t ), U (t ) . В дискретном случае состояние X (t ) входит в отличие

U
(t ) в управление процессом вместе со своим знаот управления

X
чением (t  1) в момент времени (t + 1).
Приведем примеры, иллюстрирующие постановку задач оптимального управления.
Пример 1. Рассмотрим открытую модель Леонтьева, которая
описывается следующим балансовым соотношением:
X  aX  bX  C
(П.5.9)
Соотношение (П.5.9) показывает, как валовая продукция X
распределяется на производственные затраты aX, прирост основных производственных фондов bX и потребление С.
Если рассматривать развитие экономики на некотором промежутке времени t  [0, T ] , то различные альтернативы ее развития определяются тем, как задается потребление C. Задав его на
промежутке [0, T], найдем однозначно из уравнения модели траекторию роста валового продукта X(t).
Чтобы пояснить последнее, представим уравнение (П.5.9) в
виде
1 a
1
X 
X C
b
b
(П.5.10)
Из (П.5.10) видно, что при задании C(t) это соотношение
превращается в дифференциальное уравнение относительно X(t)
с заданной правой частью, откуда величина X(t) может быть
108
найдена. Кроме того, известны начальное состояние X(0) и ограничения на минимальную и максимальную величину потребления. Если учесть и вытекающую из экономического смысла неотрицательность переменных в рассматриваемой модели, то перечисленные ограничения можно представить в виде
X(0) = X0 , Cmin  C  Cmax , X  0.
(П.5.11)
Если теперь воспользоваться терминологией, введенной ранее для постановки задач управления, то соотношение (П.5.10)
представляет собой уравнение процесса, C – управление, X – состояние системы. Накладываемые на процесс V   X (t ), C (t )  ограничения определяются соотношениями (П.5.11).
Таким образом, соотношения (П.5.10), (П.5.11) определяют
множество допустимых в данной системе процессов.
Чтобы определить наиболее эффективный путь экономического роста, т.е. выбрать из множества допустимых процессов
наилучший, требуется задать функционал J, определяющий качество процесса. Отметим, что выбор критерия оптимальности развития экономической системы – самостоятельная, имеющая важное значение, проблема экономики.
Критерий, предусматривающий рост потребления и возможность наращивать определенный экономический потенциал к конечному моменту времени, может быть выражен функционалом
следующего вида:
T
J    e   t Cdt  X (T )  max
0
.
(П.5.12)
Здесь первое слагаемое представляет собой суммарное взвешенное потребление на промежутке [0,T], терминальный член
имеет смысл объема выпуска продукции в конечный момент времени. Весовые коэффициенты   говорят о приоритете, который имеет каждое из этих слагаемых. Если мы отдаем предпочтение потреблению, то    , а если предпочтение отдается
накоплению производственного потенциала, то  < . Подынтегральное выражение
e   t C - дисконтированное потребление,
e   t - взвешивающая функция,  - коэффициент дисконтирова-
ния.
109
Итак, рассмотренная динамическая модель распределения
валового продукта с учетом цели развития экономического объекта является задачей оптимального управления с функционалом
J, заданным соотношением (П.5.12) и ограничениями (П.5.10),
(П.5.11), которым должен удовлетворять допустимый процесс.
Эта задача полностью соответствует сформулированной выше
задаче оптимального управления. Отметим, что речь идет о максимизации функционала J, что эквивалентно минимизации
функционала -J, т.е. функционала, взятого с противоположным
знаком.
Пример 2. Рассмотрим задачу оптимального распределения
капитальных вложений в отрасли на заданном интервале планирования.
Обозначим через K(t) величину основных производственных фондов отрасли в году t. В процессе воспроизводства основных производственных фондов их количество будет расти за счет
капитальных вложений, а уменьшаться за счет физического и морального износа.
Будем считать, что ввод в действие основных фондов в году
t, численно равный I(t), удовлетворяет ограничениям
I min  I (t )  I max ,
(П.5.13)
где минимальное I min и максимальное I max значения ввода в
действие основных фондов – известные постоянные или зависящие от времени функции, а величина выбытия фондов в году t
равна K (t ) . Тогда уравнение баланса основных фондов, отражающее равенство прироста основных производственных фондов
в году t за счет ввода их в действие и за счет выбытия примет вид
K (t )  K (t )  I (t ),
(П.5.14)
или
K (t  1)  (1  )K (t )  I (t ),
(П.5.15)
где K (t )  K (t  1)  K (t ) - прирост основных фондов в году.
Уравнение (П.5.15) является дискретной моделью роста основных фондов отрасли.
Будем считать заданным начальное значение основных фондов. Учитывая естественное условие их неотрицательности, имеем
K (0)  K 0 , K (t )  0, t  0, 1, , T .
(П.5.16)
110
Теперь можно рассматривать в качестве характеристики происходящего в системе процесса пару V  K (t ), I (t )  , считая K(t)
состоянием системы, I(t) - управлением, а (П.5.15) – уравнением
процесса. Тогда множество M допустимых процессов задается
условиями (П.5.13), (П.5.15), (П.5.16).
Качество протекающего в системе процесса изменения основных фондов зададим функционалом
T 1
J    I (t )  K (T )  min
t 0
,
(П.5.17)
где ,  - некоторые неотрицательные числа.
Выражение (П.5.17), являющееся критерием оптимальности
процессов, состоит из двух слагаемых. Для того чтобы пояснить
экономический смысл критерия, положим  = 1,  = 0. Тогда
J
T 1
 I (t )
, и минимизация этого функционала отражает требование максимальной экономии капиталовложений. Если же  = 0,
 = 1, то J = - K(T), и минимизация такого функционала равносильна максимизации K(t) значения основных фондов в конце
планового периода.
Таким образом в функционале (П.5.17) отражены два, вообще
говоря, противоположных требования к процессу - экономии капиталовложений с одной стороны и увеличения основных производственных фондов отрасли – с другой. Числа ,  являются
весовыми коэффициентами. Если  > , то приоритет отдается
первому требованию, если  < , то второму.
Таким образом, имеем задачу оптимального управления дискретным процессом, заданным уравнением (П.5.15) с функционалом (П.5,17), ограничениями на управление (П.5.13) и на состояние (П.5.16).
В данной постановке задачи оптимального управления правый конец траектории K(t) является свободным, так как отсутствует ограничение на значение K(T). Вместе с тем, если положить в функционале (П.5.17)  = 1,  = 0, то при этом естественно
наложить требование на значение K(T). Иначе I(t)  0, и задача
теряет экономический смысл. В рассматриваемом случае будем
t 0
111
считать заданным K(T) = K1, где величина K1 задает наряду с
функционалом J цель управления системой.
Пример 3. Рассмотрим непрерывный вариант модели оптимального распределения капитальных вложений. Такая модель
представляет интерес для теоретических исследований. Составим
уравнение баланса основных фондов отрасли в непрерывном варианте.
Величина K прироста основных фондов на промежутке [t, t
+t] будет равна K(t+t) - K(t). В отличие от введенных в дискретной модели переменных обозначим через I(t) интенсивность
ввода основных фондов в момент времени t. Под интенсивностью
будем понимать количество вводимых в единицу времени фондов. Тогда на рассматриваемом промежутке будет введено I(t)t
единиц основных фондов. Обозначим через  интенсивность выбытия основных фондов. Тогда общее количество выводимых из
производства за время t фондов будет равно tI(t). С учетом
сказанного уравнение баланса (14) можно записать в виде
K (t  t )  K (t )  tK (t )  I (t )t .
(П.5.18)
Если разделить обе части последнего уравнения на t и перейти к пределу при t0, слева получим значение производной,
а уравнение (П.5.18) перепишем следующим образом:
K  K  I .
(П.5.19)
К этому нужно добавить начальное условие и ограничения на
значения переменных:
K (0)  K 0 , K  0, I min  I  I max .
(П.5.20)
Рассматривая данный процесс как управляемый, будем, как и
в примере 2, считать K(t) состоянием процесса, I(t) – управлением. Процесс описывается уравнением (П.5.19), которое вместе с
ограничениями (П.5.20) определяет множество M допустимых
процессов V  K (t ), I (t )  .
Обобщением функционала (П.5.17) на непрерывный случай
будет функционал вида
T
J    Idt  K (T )  min
0
.
(П.5.21)
112
Теперь задача оптимального управления заключается в отыскании оптимального процесса Vоп  K оп (t ), I оп (t )  , являющегося
допустимым и минимизирующего функционал (П.5.21).
Как и в примере 2, если в выражении (П.5.21)  = 0, требуется задать конечное состояние K(T) = K1.
Пример 4. Рассмотрим задачу оптимального распределения
капитальных вложений между отраслями.
Этот пример является обобщением примеров 2 и 3 для нескольких отраслей. Как и выше, речь пойдет о распределении
ограниченного объема вводимых в действие основных производственных фондов на некотором интервале времени t  [0, T ] . Отличие состоит в том, что распределение нужно осуществить не
только во времени, но и между отраслями, которые являются в
данном случае «конкурентами».
Пусть имеются отрасли с номерами i = 1, 2, , n. Если в i –
ой отраcли Ki(t) – основные производственные фонды в году t, i
- коэффициент ежегодного выбытия фондов (коэффициент амортизации), Ii(t) - объем вводимых в действие в году t основных
фондов, то для каждой из отраслей можно написать уравнение
баланса основных фондов, аналогичное (П.5.15):
K i (i  1)  (1   i ) K i (t )  I i (t ), t  0, 1, , T  1
(П.5.22)
Известны основные фонды отраслей на начальный год t = 0:
Ki(0) i = 1, 2, , n.
(П.5.23)
Это будет начальным условием для системы уравнений
(П.5.22).
Кроме того, суммарная величина вводимых в действие основных фондов ограничена. С учетом перечисленных ограничений на переменные модели можно записать
n
 I i  I max ,
i 1
I i  I min  0, K i  0, i  1, 2, , n
.
(П.5.24)
Соотношения (П.5.22) – (П.5.24) описывают ограничения на
множество
допустимых
процессов
V  K1 (t ), , K n (t ), I1 (t ), , I n (t )  .
Обобщением на случай n отраслей функционала (П.5.17)
будет
113
J
T 1 n
n
  i I i (t )  i K i (T )  min
t  0 i 1
i 1
.
(П.5.25)
Функционал (П.5.25) вместе с ограничениями (П.5.22) –
(П.5.24) определяет задачу оптимального
управления. Состояни
ем процесса здесь является вектор K  ( K1 , K 2 , , K n ) основных
фондов отраслей, управлением – вектор I  ( I1 , I 2 , , I n ) вводимых в действие фондов.
Сформулированная задача оптимального управления относится к классу задач оптимизации дискретных процессов. Может
быть также поставлена аналогичная задача и в непрерывном времени. Для этого необходимо заменить систему разностных уравнений (П.5.22) системой дифференциальных уравнений
K i   i K i  I i ,
i  1, 2, , n .
(П.5.26)
а функционал (П.5.25) – выражением
T n
n

J     i I i di  i K i (T )  min
i 1

0  i 1
.
(П.5.27)
Тогда получим непрерывную задачу оптимального управления, описываемую функционалом (П.5.27), уравнениями процесса (П.5.26) и ограничениями (П.5.23), (П.5.24).
114
Приложение 6. Построение траекторий управляемых
процессов
Непрерывные системы
Задачи оптимального управления непрерывными детерминированными системами делятся на два класса:
Задачи, в которых функции управления ui(t) неограничены и
являются непрерывными во времени (задачи Лагранжа).
Задачи, в которых функции управления ui(t) имеют ограничения и на интервале управления претерпевают разрывы первого
рода, т.е. имеющих в точках разрыва конечные пределы слева и
справа (задачи Понтрягина).
Введем понятие траекторий управляемых процессов и рассмотрим построение этих траекторий.
Пусть имеется управляемый процесс, описываемый в пространстве состояний системой дифференциальных уравнений
   
X  f (t , X ,U ) ,

f
где  ( f1 , f 2 , , f m ),
(П.6.1)


X  ( x1 , x 2 , , x m ), U  (u1 , u2 , , u r ),
fi – известные функции.
Заданы также интервал

 управления t = 0  T и начальное со-
стояние системы X (0)  X 0 .
Если задать программу управления для непрерывного вектора U (t ) , то этой программе будет соответствовать определенная

X
(t
)
X
траектория вектора состояния 
. Чтобы найти (t ) , нужно
подставить известный вектор U (t ) в (П.6.1) и решить для этого
векторного уравнения задачу Коши с заданным начальным

X
(
0
).
U
условием
Такое решение X(t) в силу непрерывности (t )
будет существовать. Построенные на графике зависимости xi(t)
на интервале t = 0  T будут представлять траектории процесса во
времени. Если число переменных состояния равно двум, то траектории процесса можно представить на плоскости с координатами x1, x2, называемой фазовой плоскостью. Если число переменных состояния больше двух, то траектории процесса могут
быть представлены в многомерном фазовом пространстве с координатами x1, x2, x3  .
115

U
(t ) - разрывРассмотрим теперь случай, когда управление
ная функция. Будем в качестве допустимых считать такие управления, которые имеют на интервале управления t = 0  T конечное число точек разрыва первого рода (рис.1.а). Пусть U (t ) терпит разрывы в точках t1, t2  tk < T.
u
(а)
t
t1
t2
tk
T
x
(б)
t
t1
tk
T
t2
Рис. П.6.1. Траектория управляемого процесса во времени
при разрывной функции управления
Тогда в этих точках существуют односторонние пределы
(пределы слева и справа)


lim U (t )  U k ,
t tk
t  tk


lim U (t )  U k .
t tk
t  tk

U
Чтобы однозначно задавать значения (t ) в точках разрыва,



U
(
t
)

U
k
потребуем, чтобы U (t ) была непрерывна справа. Тогда
и график ее (для одной составляющей вектора) будет выглядеть
так, как представлено на рис. 1.а. Для построения решения, соответствующего заданному закону управления, рассмотрим последовательноотрезки 0  t1, t1  t2 ,  tk  T. На промежутке 0  t1
функция U (t ) будет непрерывна во всех точках, если дополнить
ее значением при t = t1, равным пределу слева. Тогда
на этом

X (t )
промежутке времени будет
 определена траектория  , отвечающая заданной функции U (t ) и начальному условию X (0).
116
Рассмотрим теперь отрезок t1  t2. Если на нем доопределить
функцию в точке t1 пределом справа, а в точке t2 пределом слева,
она также будет непрерывна.
 Если в качестве начального условия
взять конечное состояние X (t1 ) , то мы слева получим траекторию
системы.
 Продолжая этот процесс, мы в итоге получим траекторию X (t ) на всем интервале управления.

X
Отметим некоторые свойства построенной траектории (t ) .
Во-первых, эта траектория, как следует из правила ее
 построения,
однозначно соответствует заданным управлению U (t ) и начальному условию, поэтому ее можно считать обобщением решения
задачи Коши на случай
разрывных управлений. Во-вторых, полу
ченное решение X (t ) будет непрерывным. В-третьих, на каждом
интервале (ti, ti+1) X (t ) имеет непрерывную производную в любой
точке, а в точках разрыва ti – производную слева и справа. Производная
этой
функции, следовательно, будет кусочнонепрерывна.
В качестве примера рассмотрим управляемую систему, заданную системой уравнений
x1  x2  u1 ,
x 2  2u2
на промежутке t  [0, 6] . Начальные значения переменных
x1(0) = x10 , x2(0) = x20 примем равными x10 = 1, x20 = -1, а управления зададим в виде
0 при t  [0, 4],
u1  
1 при t  [4, 6],
 0,5 при t  [0, 2],
u2  
при t  [2, 6].
 0
Точки разрыва управлений делят отрезок [0, 6] на три части
точками t1 = 2, t2 = 4. Эти точки и являются точками разрыва
управления.
Рассмотрим промежуток [0, 2]. При таких значениях t управления имеют значения u1 = 0, u2 = -1. Система после подстановки имеет вид
x1  x 2 ,
x 2  1.
117
Начальные условия на этом промежутке заданы условием задачи.
Найдем общее решение полученной системы:
2
x1   t2  C1t  C2 ,
x 2  t  C1.
Подставляя сюда начальные условия, найдем значения произвольных постоянных С1 = -1, С2 = 1. Следовательно, траектория
системы на рассматриваемом промежутке имеет вид
2
x1   t2  t  1, x2  t  1.
Определим отсюда начальное значение x1(2) = x12 , x2(2) =
x22 на следующем промежутке [2, 4]. Для этого нужно подставить t = 2 в полученные выражения для x1 , x2. Начальными
значениями будут x12 = - 3, x22 = - 3.
Система уравнений процесса, которой удовлетворяет искомая
траектория, на этом промежутке будет следующей:
x1  x2 ,
x 2  0.
Общее решение x1 = C1t + C2 , x2 = C1 после подстановки
начальных условий даст уравнение траектории на промежутке
[2, 4]:
x1  3t  3, x 2  3,
откуда получим x1(4) = x14 = - 9, x2(4) = x24 = - 3.
Наконец, траектория на участке [4, 6] определяется как решение системы
x1  x2  1,
x 2  0,
откуда с учетом найденных начальных значений x14 , x24 получим
x1  2t  1, x 2  3 .
Окончательно полученная траектория, отображенная на рис.
П.6.2, имеет вид
118
 t 2  t  1 при t  [2, 4],
 2
x1 (t )    3t  3 при t  [2, 4],
  2t  1 при t  [4, 6],

 t  1 при t  [0, 2] ,
x 2 (t )  
  3 при t  [2, 6].
Графическое представление траекторий управляемой системы часто дает ценную информацию для решения задач управления. Изображение траекторий на плоскости  xi , t  , как сделано на
рис. П.6.2, - один из возможных способов их графического представления. Иногда более информативным бывает представление
траекторий на фазовой плоскости (x1, x2).
x1, x2
1
-1
2
4
t
6
0
-3
x2(t)
-9
x1(t1)
-12
Рис. П.6.2. Траектория управляемого процесса во времени
Рассмотрим в качестве примера систему второго порядка
x1  x 2  u1 ,
x 2   x1  u2
и изобразим на фазовой плоскости все ее траектории для
значений управления u1 = - 1, u2 = 1. Подставляя эти значения
управлений в уравнения процесса, после подстановки получаем
x2  x 2  1 и находим общее решение полученной системы:
x1  C1 sin t  C2 cost  1,
x2  C1 cost  C2 sin t  1,
Эти уравнения задают в параметрическом виде искомое семейство траекторий. Параметр t можно исключить, перенося
119
единицу в левую часть и сложив возведенные в квадрат части
уравнений:
( x1  1) 2  ( x2  1) 2  C12  C22 .
Теперь видно, что кривые данного семейства – окружности
1
2
2 2
радиусом r  (C1  C 2 ) с центром в точке (1, 1).
Аналогично можно построить семейство кривых, отвечающих значению управления u1 = 1, u2 = - 1. Проводя такие же
вычисления,
получим
уравнение
в
виде
( x1  1) 2  ( x2  1) 2  C12  C22 , т.е. семейство окружностей с центром
в точке (-1, -1).
На фазовой плоскости системы оба семейства траекторий
изображены на рис. П.6.3. Стрелками показано направление движения точки  x1 (t ), x2 (t )  по траектории при возрастании t.
x2
1
-1
1
x1
-1
Рис. П.6.3. Траектория управляемого процесса на фазовой
плоскости
С помощью построений можно решать более сложные задачи, например, построение траекторий, отвечающих кусочнопостоянным управлениям. Это часто бывает необходимо в задачах оптимального управления.
Например, пусть известно начальное состояние системы
x1 (0)  2,
x2 (0)  1,
и требуется отыскать траекторию системы, отвечающую на

0, 32 
промежутке времени
управлениям
 1 при t  0,  ,
 1
при t  0, 2 ,
2
u1  
u2  
 3
 3


1
при
t

,
,

 1 при t   2 , 2 .
2 2
120
При t  0,  / 2 управления будут иметь значения u1 = - 1, u2
= 1. Так как мы уже построили все множество траекторий с такими значениями управлений, остается выяснить, какая из них
проходит через начальную точку (2, 1). Мы знаем, что это окружность, следовательно, нужно определить ее радиус. Это нетрудно
сделать, заметив, что он равен расстоянию от точки (2, 1) до
центра, т.е. точки (1, 1). Это расстояние и вместе с ним радиус r
= 1. Таким образом, на первом участке t  0,  / 2 траектория системы – дуга окружности радиусом r = 1 с центром в точке (1, 1).
Далее мы можем воспользоваться следующим из формул для x1
и x2 соображением, что радиус-вектор точки  x1 (t ), x2 (t )  траектории, проведенной из ее центра, за промежуток времени описывает угол, численно равный длительности промежутка. Следовательно, радиус-вектор по отношению к начальному состоянию в
конце промежутка 0, 2 поворачивается на угол 2.
Нетрудно видеть (рис. П.6.4), что тогда при t   / 2 система
оказывается в состоянии x1 (  / 2)  1, x2 (  / 2)  0 . Теперь, пользуясь изложенными соображениями, можно построить участок траектории на промежутке 2, 32. Этот участок – половина дуги
окружности радиусом 5 с центром в точке (-1, -1).
x2
1
-1
0
1
2
x1
-1
Рис. П.6.4. Траектория управляемого процесса на фазовой
плоскости при кусочно-постоянном управлении
Дискретные системы
В качестве примера построения траекторий управляемых
процессов для дискретных систем рассмотрим систему, описываемую однородным разностным уравнением второго порядка вида
121
x(n + 1) = u(n) x(n) – x(n – 1),
где u(n) – управляющее воздействие, n – номер цикла.
Зададим ограничение на управление - 2  u  2 и начальные
условия x(0), x(-1), например x(0) = 0,7; x(-1) = 0. При этих
условиях по уравнению вычислим x(1), x(2), x(3) и т.д.
На рис. П.6.5 приведены траектории дискретного процесса
x(n) от номера цикла n при постоянных значениях управляющего воздействия u = 0,5 и u = 1.
Из этого рисунка видно, что дискретные значения x(n) представляют отсчеты из гармонического колебания постоянной амплитуды, частота которого зависит от управляющего воздействия
u.
Если построить эту траекторию на фазовой плоскости с координатами x(n) и x(n - 1) (фазовый портрет), то эта траектория
в зависимости от величины управляющего воздействия будет
иметь вид эллипсов, представленных на рис. П.6.6.
При u = 0 эллипс превращается в окружность.
x(n)
u=0,5
n
1
0
2
3
4
5
6
7
8
9
10
11 12
x(n)
u=1
n
0
1
2
3
4
5
6
Рис. П.6.5. Траектория дискретного процесса при постоянных
значениях u
x(n)
u=0
u>0
u<0
0
x(n-1)
122
Рис. П.6.6. Траектории дискретного процесса на фазовой
плоскости при различных значениях u
На рис. П.6.7 приведены траектории дискретного процесса
при двух фиксированных значениях управляющего воздействия:
при u  2 и при u = 1.
x(n)
u 2
2
1
1
2
x(n-1)
u=1
Рис. П.6.7. Траектории дискретного процесса
при двух фиксированных значениях u
Из рис. П.6.7 видно, что траектории представляют собой два
эллипса с наклоном главной оси этих эллипсов под углом /4
относительно оси x(n - 1). Эти эллипсы имеют точки пересечения. Соединив эти точки прямыми через начало координат, эти
прямые образуют сектора с углами 1 и 2 соответственно,
причем 2 =  - 1.
Теперь построим траектории процесса при изменяющемся
управляющем воздействии. Закон изменения управляющего воздействия зададим следующим: если точка на фазовой плоскости
x(n), x(n - 1) попадает в сектор 1, то устанавливаем u = 1, а если в сектор 2, то u  2 . При таком законе изменения управляющего воздействия траектория процесса приведена на рис. П.6.8
и имеет вид раскручивающейся спирали, что свидетельствует о
бесконечном возрастании амплитуды процесса x(n).
Если закон изменения управляющего воздействия задать обратным предыдущему, а именно: если точка на фазовой плоскости x(n), x(n - 1) попадает в сектор 1, то устанавливаем u  2 , а
если в сектор 2, то u = 1. При таком законе управления траекто123
рия процесса приведена на рис. П.6.9 и имеет вид сворачивающейся к началу координат спирали.
x(n)
1
2
1
x(n-1)
2
Рис. П.6.8. Траектория дискретного процесса
в виде раскручивающейся спирали
x(n)
1
2
1
x(n-1)
2
Рис. П.6.9. Траектория дискретного процесса
в виде сворачивающейся спирали
Отметим, что разностное уравнение второго порядка вида
x(n + 1) = u x(n) – - x(n - 1) можно представить в виде системы из
двух связанных разностных уравнений первого порядка
x1(n + 1) = x1(n) – u1 x2(n)
x2(n + 1) = x2(n) + u1 x1(n + 1),
где u1 – управляющее воздействие.
Траектория процесса в этом случае описывается в координатах x1 и x2.
Для определения связи между управляющими воздействиями
u и u1 преобразуем эту систему в одно разностное уравнение
второго порядка. Для этого подставим во второе уравнение значение x1(n + 1) из первого уравнения. В результате получим
124
x2(n + 1) = x2(n) + u1 x1(n) – u12 x2(n).
Из второго уравнения системы на предыдущем такте
имеем: x2(n + 1) = = x2(n - 1) + u1 x1(n), откуда выразим значение
x1 ( n ) 
1
u1
x2 (n)  x2 (n  1)
x1(n):
. Подставим это выражение в приведенное выше уравнение и получим разностное уравнение второго порядка
x2(n + 1) = (2 - u12) x2(n) - x2(n - 1).
Сопоставляя это уравнение с исходным, получим следующие
соотношения между воздействиями u и u1:
u = 2 - u12,
u1   2  u .
Построение траекторий управляемых процессов дает о них
наглядное графическое представление и позволяет определить,
как от управляющего воздействия зависит вид траекторий и их
характерные особенности.
Приложение 7. Поиск оптимального управления непрерывными детерминированными процессами методами Лагранжа-Понтрягина
В общем виде управляемая динамическая система описывается системой дифференциальных уравнений первого порядка
вида
xi  f i (t, xi , u j ),
i  1  m, j  1  r
,
(П.7.1)
где xi – переменные состояния системы,
uj – управляющие воздействия,
125
fi – известные функции,
x i 
dxi
dt
.
Заданы также интервал

 управления t = 0  T и начальное со-
стояние системы X (0)  X 0 .

U
Необходимо определить управляющий вектор оп (t ) , при ко-
тором в определенном смысле достигается наилучший результат,
например, нужно минимизировать функционал вида
T
 

J   f 0 (t, X ,U )dt  F X (T )   min
.
0
(П.7.2)
Пусть непрерывные функции fi , f0 и F непрерывно дифференцируемы по xi и uj. Если на управляющие воздействия не
накладываются ограничения, то такая задача нахождения оптимального управления принадлежит классу вариационного исчисления и относится к задаче Лагранжа.
Если на управляющие воздействия uj накладываются ограничения двух видов:
управляющие воздействия могут изменяться в допустимых
пределах uj uдоп ,
управляющие воздействия могут претерпевать разрывы первого рода, то такая задача нахождения оптимального управления может
быть решена с использованием принципа максимума Понтрягина.
В методе Лагранжа для решения оптимизационной задачи
вводятся два вида вспомогательных функций:
функция Гамильтона, определяемая по выражению
m
H   f i pi  f 0
i 1
,
(П.7.3)
где fi – функции в выражении (П.7.1),
f0 – подынтегральная функция в выражении (П.7.2),
pi – присоединенные функции, определяемые в результате
решения следующей системы дифференциальных уравнений:
p i 
dpi
dH

,
dt
dxi
i  1 m
,
(П.7.4)
126
или в векторной форме:

df 
p i  
p,
dx
df1
dx1
df 2
dx1
m
m
....
df m
dx1
df
 .................................
dx
df m
df1
df 2
....
dx
dx
dx
где матрица
Из (П.7.4) следует:
dxi
dH
 x i  
,
dt
dpi
m
разностью m  m.
i  1 m
.
(П.7.5)
Уравнения (П.7.4) и (П.7.5) представляют собой каноническую или гамильтонову форму записи уравнений ЭйлераЛагранжа, играющих важную роль в классическом вариационном
исчислении. В теории классического вариационного исчисления
доказывается следующая теорема, определяющая необходимые
условия оптимальности:
при оптимальном управлении системой, описываемой
(П.7.1), когда минимизируется функционал (П.7.2), обращаются в
нуль частные производные
условия:
dH
 0,
du j
dH
du j
,
то есть должны выполняться
j  1  r.
(П.7.6)

U
Для поиска вектора оптимального управления оп (t ) методом
Лагранжа необходимо вначале определить присоединенные
функции pi. Они определяются в результате решения дифференциальных уравнений (П.7.4). Для этого необходимо знать граничные условия для присоединенных функций pi. Эти граничные
условия определяются в зависимости от конкретных особенностей задачи оптимального управления.
Если требуется минимизировать функционал вида:
m
J   ci xi (T )  min
i 1
,
(П.7.7)
127
то есть речь идет о минимизации линейной комбинации координат системы в конце процесса управления, то граничные
условия для присоединенных функций определяются из выражения:
pi(T) = - ci , i = 1  m.
Если нужно минимизировать нелинейную функцию координат xi(T), а именно:
J = F(xi(T)) = min, i = 1  m,
где F – нелинейная функция, дважды дифференцируемая по
всем аргументам xi, тогда граничные условия для присоединенных функций определяются из выражений:
dF
pi (T )   dx
i
t T
.
Если нужно минимизировать функционал вида:
T
 
J   f 0 ( X ,U , t )dt  min
,
0
(П.7.8)
в котором терминальная функция F = 0, то граничные условия для присоединенных функций равны нулю в точке t = T, то
есть:
pi(T) = 0, i = 1  m.
Условие трансверсальности. Часто в задачах оптимального
управления задаются определенные условия для системы в конце
процесса управления, в точках xi(T). Если вместе с основной задачей оптимального управления в виде функционала (35) должны
выполняться условия в конце процесса управления, заданные в
виде:
Fj(xi(T)) = 0, j = 1  m,
причем функции Fj дважды дифференцируемы по всем xi,
тогда граничные значения для присоединенных функций при t =
T определяются из условия трансверсальности
m
dF j
j 1
dxi
pi (T )     j
,
t T

где j - неизвестные множители Лагранжа, определяемые из
граничных условий системы в конце процесса управления.
128
Пример 1. Динамическая система описывается системой
дифференциальных уравнений вида:
x1  x2 ,
x 2  u.
Заданы также промежуток или интервал управления t = 0  1
и начальное состояние системы x1(0) и x2(0). Необходимо найти
оптимальное управление uоп, при котором достигается условие
1
J   (u  u 2 )dt  min
.
0
Решение. Для данного критерия оптимального управления
функция Гамильтона имеет вид:
2
H   f 0   f i pi  (u  u 2 )  p1 x 2  p 2 u,
i 1
система присоединенных функций равна:
dH
p 1   dx
0
1
dH
p 2   dx
  p1.
2
Граничные условия для присоединенных функций в этом
примере равны нулю в конце процесса управления, то есть p1(1) =
0, p2(1) = 0, так терминальная функция в функционале J равна
нулю.
p 1  0, и p1 (1)  0, то p1 (t )  0, p 2   p1 , тогда
Так как
dp 2   p1dt , откуда p 2 (t )   p1t  c, так как p1  0, то p2 (t )  c. Но
p 2 (1)  0, следовательно p 2 (t )  0.
Тогда функция Гамильтона примет вид
мальное управление найдем из условия
129
dH
du
H  u  u 2 . Опти 0,
следовательно
 1  2uоп  0,
uоп   12 .
откуда
Действительно,
интеграл
1
J   (u  u 2 )dt  min
u
1
J
  1.
2 и равен min
4
при оп
Пример 2. Динамическая система описывается системой
дифференциальных уравнений вида
0
x1  x2 ,
x 2  u.
Задано начальное состояние системы x1(0) = 0 , x2(0) = 0.
Необходимо на интервале управления системой t = 0  1 обеспечить два условия:
минимизировать интеграл
1
1
J   u 2 dt  min
2
0
и обеспечить конечное состояние системы, заданное выражениями
F1  x1 (1)  1  0 , F2  x 2 (1)  1  0 .
Из этих выражений следуют конечные состояния координат
системы
x1(1) = 1, x2(1) = 1.
Решение. Функция Гамильтона для этого примера примет
вид:
1
H  p1 f1  p2 f 2  f 0  p1 x2  p2 u  u 2 .
2
Присоединенные функции определим из формулы (П.7.4)
dpi
H

,
i  1, 2
dt
xi
и получим p 1  0, следовательно p1  c1 , p 2   p1 , следовательно p 2   p1t  c 2 .
p i 
Для определения коэффициентов с1 и с2 воспользуемся условием трансверсальности
2
F j
j 1
xi
pi (1)     j
,
t  1,
130
где j – неизвестные множители Лагранжа, обеспечивающие
заданное конечное состояние системы. Из этого выражения имеем: p1(1) = - 1, p2(1) = - 2 .
Тогда p1(t) = - 1, p2(t) = 1t + c2.
При t = 1 имеем равенство: -2 = 1  1+ c2, откуда c2 = 1 - 2 , тогда p2(t) = 1t - 1 - 2.
Подставим эти выражения в формулу для функции Гамильтона и получим:
1
H  (1t  1   2 )u  1 x2  u 2 .
2
Из условия получения оптимального управления методом
Лагранжа имеем:
dH
 1t  1   2  uоп  0.
du
Откуда
uоп (t )  1t  1   2 .
Неизвестные множители 1 и 2 определим из условия, чтобы при t = 1 обеспечить заданное конечное состояние координат
системы: x1(1) = 1, x2(1) = 1.
Для этого осуществим интегрирование уравнений состояния
системы с учетом ее начального состояния x1(0) = 0 и x2(0) = 0.
Из второго уравнения
x 2 
dx2
 u  1t  1   2
dt
имеем
dx 2  udt  (1t  1   2 )dt .
После интегрирования этого выражения получим:
1
x2 (t )  1t 2  (1   2 )t  c2 .
2
При t = 0 x2(0) = 0, следовательно c2 = 0.
x (t )  1  t 2  (   )t.
1
2
2 1
Тогда 2
Подставим это выражение в первое уравнение системы
x1 
dx1
dt
 x2
и после интегрирования выражения
чим:
131
dx1  x 2 dt полу-
1
1
x1 (t )  1t 3  (1   2 )t 2  c1.
6
2
При t = 0 x1(0) = 0, следовательно c1 = 0.
При t = 1 имеем x1(1) = 1, x2(1) = 1. Подставим в уравнения
для x1(t) и x2(t) эти значения при t = 1 и получим:
1
1
1  ( 1   2 )  1
6
2
1
1  ( 1   2 )  1
2
Решение этой системы дает искомые множители Лагранжа:
1  6,  2  2 .
Тогда окончательный результат для оптимального управления примет следующий вид:
uоп (t )  6t  4,
x1оп (t )  t 3  2t 2 ,
x 2оп (t )  3t 2  4t.
Траектория оптимального управления uоп и координат x1оп,
x2оп системы на интервале управления t = 0  1 приведена на
рис.10.
uоп, x1оп, x2оп
4
3
2
uоп
x2оп
1
t
x1оп
0
0,5
1
-2
Рис. П.7.1 Траектория оптимального управления для примера
2
Отличие принципа максимума Понтрягина от метода Лагранжа состоит в том, что из-за ограничений на управление и
132
наличия в управляющих функциях разрывов первого рода условия (П.7.6) в строгом математическом смысле не выполняются.
Эти условия в принципе максимума Понтрягина заменяются на
другое более
общее положение, а именно: чтобы управляющий

вектор U (t ) решил поставленную оптимизационную задачу минимизировать функционал J, необходимо существование не рав
P
ного тождественно нулю вектора присоединенных функций (t )
с соответствующим граничным условием, который вместе с вектором управления U (t ) на всем интервале управления обеспечивал бы максимум функции Гамильтона, то есть:

U оп (t )  arg max H .
(П.7.9)
Если нужно максимизировать функционал J, то указанное
относительно H условие максимума заменяется условием минимума H, то есть:

U оп (t )  arg min H .
(П.7.10)
Существенное преимущество принципа максимума по сравнению с классическим вариационным исчислением (метод Лагранжа) состоит в том, что он применим для любого множества
U.
Задачи со свободным конечным временем. В ряде задач оптимального управления конечное время t1 = T не задано, тогда
говорят о задачах со свободным конечным временем.
Частным случаем таких задач является задача на быстродействие, когда надо минимизировать функционал
J
t1
 f 0 dt  min
t0
.
При этом f0  1, тогда получим
нимизируем интервал управления.
J  t1  t0  T  min , т.е. ми-
Приложение 8. Принцип максимума для дискретных
систем
Постановка задачи.
133
Динамика дискретных систем описывается в пространстве
состояний системой из m разностных уравнений первого порядка
вида:


xi (n  1)  f i ( X (n),U (n), n),
i  1, m
(П.8.1)

где X (n) - вектор переменных состояний разности 1  m,

U (n) - вектор управления размерности 1  r,
f i - известные функции, i  1, m.
Заданы
начальные значения всех переменных состояние си
стемы X (0)  ( x1 (0), x2(0).....xm (0)), область допустимых значений
вектора управления U (n) U доп. и интервал управления n = 0  N.
Могут быть
 дополнительно заданы конечные граничные условия
системы X (N ).
Необходимо на интервале управления системой n = 0  N так
изменять элементы вектора управления U (n), чтобы обеспечился
какой-либо из критериев оптимального управления, например,
минимум интегральной целевой функции вида:
J
N 1



f
(
X
(
n
),
U
(
n
),
n
)

F
(
X
( N )  min
 0
n 0
,
(П.8.2)
где F – терминальный член, характеризующий конечное состояние системы.
Если конечные граничные
условия системы не заданы, то

есть элементы вектора X (N ) неизвестны, то граничные условия
для присоединенных функций определяются из условия трансверсальности:
pi ( N )  
F
xi
,
i  1, m.
xi  xi ( N )
(П.8.3)
Решение.
Функция Гамильтона для дискретных систем определяется по
выражению:
m
H   pi f i  f 0 ,
i 1
(П.8.4)
134
где f0 – известная функция, входящая в выражение для целевой функции,
fi – известные функции, описывающие состояние системы,
pi - присоединенные функции, определяемые из разностных уравнений первого порядка следующего вида:
pi (n) 
H
xi
,
i  1, m.
p  p ( n 1)
(П.8.5)
Запись p = p(n + 1) означает, что в выражении
H
x i
все пере-
x, u
менные i j записываются с номером цикла n , а переменные
pi с номером цикла n + 1.
Принцип максимума Понтрягина–Беллмана
для дискретных

систем. Он формулируется так: если вектор U оп (n) U доп оптимален в смысле поставленной оптимизационной задачи, то необходимым
условием для этого является существование N векторов

P(n), при которых частные производные
H
0
u j
.
p  p ( n 1)
(П.8.6)
H (n)  max в случае, если вектор
 Тогда функция Гамильтона
U оп (n ) лежит на границе допустимой области U . Иначе говоря,
доп
оптимальный
вектор

U оп (n)  arg max H .
(П.8.7)
Выражение (П.8.7) следует
понимать и читать так: оптималь
ный вектор управления U оп (n ), являющийся аргументом функции
Гамильтона, такой, который максимизирует функцию Гамильтона.
Если целевая функция J = max, то оптимальный вектор
управления должен минимизировать функцию Гамильтона, то
есть в этом случае:
U оп (n)  arg min H .
В отличие от сильного принципа максимума для непрерывных систем, принцип максимума Понтрягина–Беллмана для дискретных систем называют слабым принципом максимума. При135
чина состоит в том, что принцип максимума для дискретных систем является приближенным. Для дискретных систем доказана

следующая теорема: оптимальный вектор управления U оп (n ) в
дискретных системах обращает в максимум функцию Гамильтона
с погрешностью матрицы относительного дискретного времени
t , то есть:

H (U оп ( n ))  max H  t ,
где:
t 0 0  0
0 t
t  



0 0   t - диагональная матрица,
t  Tц / T
– относительная продолжительность цикла или такта в
дискретных системах.
Очевидно, что чем меньше величина цикла Tц по сравнению
с общим интервалом управления T, тем меньше эта погрешность.
При t 0 дискретные системы превращаются в непрерывные, и
погрешность принципа максимума для них стремится к нулю.
Пример 1. Затраты x1 первого основного цеха завода от цикла к циклу
описываются разностным уравнением первого порядка вида:
x1 (n  1)  x1 (n )  x 2 (n )  u2 (n ) ,
(П.8.8)
а затраты x2 второго
разностным уравнением вида:
x 2 (n  1)  x1 (n )  u1 (n )
(вспомогательного)
цеха
описываются
(П.8.9)


X
X
(
0
)
Заданы начальное и конечное состояния системы
и (N ) и
интервал управления системой n = 0  N.
Ставится задача: так изменять управление цехами u1 и u2 (изменять
затраты), чтобы на интервале управления n = 0  N выполнялось условие
минимума интегральной целевой функции
J
 x12 (n)  x22 (n)  u12 (n)  u22 (n)  min .
N 1
n 0
(П.8.10)
Эта функция учитывает затраты цехов x1 и x2 на каждом цикле, а
также изменение затрат, вызванных величинами u1 и u2. Известно, что
изменение объема производства в ту или иную сторону влечет увеличение
136
потерь, связанных с перестройкой производства. Терминальная функция F
в этой задаче равна нулю.
Решение. Вначале запишем выражение для функции Гамильтона с
учетом (П.8.8), (П.8.9) и (П.8.10)
2
H   pi f i  f 0  p1 ( x1  x 2  u2 )  p 2 ( x1  u1 )  x12  x 22  u12  u22
i 1
.
Разностные уравнения, по которым вычисляются присоединенные
функции pi, определяются из выражения (П.8.5)
H
pi ( n ) 
, i  1, 2
xi p  p( n 1)
.
Применим это выражение при i = 1 и i = 2 для функции H и получим
искомые выражения для присоединенных функций:
p1 ( n )  p1 ( n  1)  p 2 ( n  1)  2 x1 ( n )
(П.8.11)
p2 (n )  p1 (n  1)  2 x 2 (n )
(П.8.12)
и u2 определяется из принципа
Оптимальное управление цехами u1
максимума (П.8.7)
U оп ( n )  arg max H ,
откуда следует формула (П.8.6), устанавливающая связь между
элементами u
и u
оптимального вектора управления U оп (n ) и
1оп
2оп
переменными xi и pi
H
ui
 0.
p  p ( n 1)
Применим это выражение при i = 1 и i = 2 для функции H и
получим:
p2 (n  1)  2u1оп (n)  0
p1 (n  1)  2u2оп (n)  0.
Из этих уравнений получим соотношения:
u1оп ( n )  0,5 p 2 ( n  1)
(П.8.13)
u 2оп ( n )  0,5 p1 ( n  1)
(П.8.14)
Подставим их в (П.8.8), (П.8.9) и получим:
x1 ( n  1)  x1 ( n )  x 2 ( n )  0,5 p1 ( n  1)
x 2 ( n  1)  x1 ( n )  0,5 p 2 ( n  1)
(П.8.15)
(П.8.16)
137
Эти уравнения совместно с (П.8.11) и (П.8.12) описывают дискретную
динамическую систему при оптимальном управлении.
Недостатком уравнений (П.8.11), (П.8.12), (П.8.15) и (П.8.16) является
то, что первые два уравнения описывают процесс от конца к началу (номер
цикла n убывает), а вторые два уравнения – от начала к концу.
Преобразуем их к одному виду, например, от конца к началу. В
данной задаче направление безразлично, так как граничные условия
переменных состояния xi заданы и в начале и в конце процесса управления.
Из (П.8.16) имеем:
x1 ( n )  x 2 ( n  1)  0,5 p 2 ( n  1) .
(П.8.17)
Вычтем (П.8.16) из (П.8.15) и получим:
x 2 (n )  x1 (n  1)  x 2 (n  1)  0,5 p1 ( n  1)  0,5 p2 ( n  1) .
(П.8.18)
Подставим в (П.8.11) значение x1(n) из (П.8.17) и получим:
p1 ( n )  p1 ( n  1)  2 p2 (n  1)  2 x 2 ( n  1) .
(П.8.19)
Подставим в (П.8.12) значение x2(n) из (П.8.18) и получим:
p2 (n )  2 p1 (n  1)  2 x1 ( n  1)  2 x 2 ( n  1)  p2 ( n  1) .
(П.8.20)
Уравнения (П.8.17), (П.8.18), (П.8.19) и (П.8.20) описывают
динамическую систему от конца к началу при оптимальном уравнении. В данной задаче терминальная функция F не задана, и
условием трансверсальности для определения граничных значений присоединенных функций pi(N) воспользоваться нельзя.
Поэтому в данной задаче необходимо найти такие значения pi(N),
 при которых от заданного конечного состояния си) надо перейти к заданному начальному состоянию
стемы X (N

системы X (0) по уравнениям (П.8.17)  (П.8.20).
Для этого необходимо провести преобразование над указанными
уравнениями на всех циклах процесса управления от n = N – 1 до n = 0 и
выразить
значения
pi(N) через известные значения элементов векторов


X (N ) и X (0) .
Сделаем эти преобразования при конкретных численных значениях
N, X (N ) и X (0) .
Пусть N  4, x1 ( 4)  4, x 2 ( 4)  0, x1 (0)  1, x 2 (0)  1 .
Тогда при n = 3 с учетом граничных условий на конце x1(4) = 4 и
x2(4) = 0 из уравнений (П.8.17)  (П.8.20) получим:
x1(3) = - 0,5p2(4)
x2(3) = 4 - 0,5p1(4) + 0,5p2(4)
p1(3) = p1(4) + 2p2(4)
p2(3) = 2p1(4) - 8 - p2(4)
При n = 2 из уравнений (П.8.17)  (П.8.20) получим:
138
x1(2) = x2(3) - 0,5p2(3)
x2(2) = x1(3) - x2(3) - 0,5p1(3) + 0,5p2(3)
p1(2) = p1(3) + 2p2(3) - 2x2(3)
p2(2) = 2p1(3) - 2x1(3) + 2x2(3) - p2(3)
Подставим в эти уравнения значения x1(3), x2(3), p1(3) и p2(3),
полученные при n =3 и, сделав необходимые арифметические вычисления,
получим:
x1(2) = 8 - 1,5p1(4) + p2(4)
x2(2) = p1(4) – 2,5p2(4) - 8
p1(2) = 6p1(4) - p2(4) - 24
p2(2) = - p1(4) + 7p2(4) + 16
При n = 1 из уравнений (П.8.17)  (П.8.20) получим:
x1(1) = x2(2) - 0,5p2(2)
x2(1) = x1(2) - x2(2) - 0,5p1(2) + 0,5p2(2)
p1(1) = p1(2) + 2p2(2) - 2x2(2)
p2(1) = 2p1(2) - 2x1(2) + 2x2(2) - p2(2)
Подставим в эти уравнения значения x1(2), x2(2), p1(2) и p2(2),
полученные при n = 2
и, сделав необходимые арифметические
вычисления, получим:
x1(1) = - 1,5p1(4) - 6p2(4) - 16
x2(1) = - 6p1(4) + 7,5p2(4) + 36
p1(1) = 2p1(4) + 18p2(4) + 24
p2(1) = 18p1(4) - 16p2(4) - 96
При n = 0 вычислять значения p1 и p2 нет необходимости, поэтому
определим только выражения для x1(0) и x2(0) по (П.8.17) и (П.8.18) при n
= 0 с учетом результатов, полученных выше:
x1(0) = - 15p1(4) + 15,5p2(4) + 84
x2(0) = 15,5p1(4) – 30,5p2(4) - 112
Так как начальные граничные условия заданы: x1(0) = -1, x2(0) = 1, то
после подстановки в эти выражения значений x1(0) и x2(0) получим
систему из двух уравнений:
15p1(4) - 15,5p2(4) = 85
15,5p1(4) – 30,5p2(4) = 113
Решив эту систему, получим неизвестные значения присоединенных
функций на конце процесса p1(4) и p2(4).
Решение этой системы дает следующие результаты:
p1(4) = 3,872
p2(4) = - 1,737
Подставив эти значения в уравнения (П.8.17)  (П.8.20) при известных
x1(4) = 4 и x2(4) = 0, определим значение x1(3), x2(3), p1(3) и p2(3). Снова
подставим эти значения в (П.8.17)  (П.8.20) и определим значения x1(2),
x2(2), p1(2) и p2(2). Проделав эту процедуру до n = 0, определим все
значения x1(n), x2(n), p1(n) и p2(n) на всем интервале управления. Отметим,
что значения x1(0) и x2(0) должны совпасть с заданными значениями
139

X
(0) с допустимой погрешностью. Элементы вектора
вектора
оптимального управления определяются из соотношений (П.8.13) и
(П.8.14).
В таблице П.8.1 приведены результаты вычислений по описанной
процедуре. Здесь же приведены значения подынтегральной функции f0 и
значение целевой функции J, вычисленной по формуле (П.8.10).
Таблица П.8.1
n
x1
0
1
2
0,23
0,45
1,0035
5
x2
0,99
45
0,2595
0,923
p1
0,478
0,96

9
p2
1,488

0,031
u1оп
0,74
0,74
4
0,0155
05
u2оп
0,23
0,484
0,19
9
5
9
f0
2,61
0,355
1,64
0
7
По табл. П.8.1 можно построить
x1 ( n ), x 2 ( n ), u1оп ( n ), u2оп ( n ) .
3
0,868
4
4
1,195
0
0,398
3,872
5
5
1,481
0,8685
1,936
6,686
1,737
J=11,
2979
траектории процессов
Постановка задачи оптимального управления заводом, выпускающим
бетон, при известном начальном состоянии и спросе на бетон на каждом
цикле.
Необходимо на заданном интервале управления заводом n = 0  N
так спланировать выпуск бетона при известном на него спросе, чтобы
суммарные потери производителя и потребителей бетона (строительных
организаций) от несовпадения спроса и предложения были минимальны.
Функция спроса бетона (в тыс. тонн) r(n) задана таблицей П.8.2.
Таблица
П.8.2
n
0
1
2
3
4
5
r(n
1
2
1
5
4
8
)
где
n - номер цикла, например, номер дня недели,
r(n) - потребный раствор бетона, (тыс. тонн) по дням недели.
Процесс производства бетона описывается разностным уравнением
вида:
140
x(n + 1) = x(n) + u(n),
(П.8.21)
где u(n) - управление изменением объема производимого продукта. В
этой задаче число m = 1.
Начальное условие x(0) = 1. Конечное условие x(N) не задано, N = 5.
Математически критерий оптимального управления заводом запишем
в виде целевой функции, являющейся интегральной функцией потерь
изготовителя и потребителей продукции:
N 1
J    y1 ( n ) y 2 ( n ) y1 ( N )min
n 0
,
(П.8.22)
где функция
 x(n )r (n ) 2 при x(n )r ( n )
y1 (n )  
2
ax(n ) r (n ) при x(n )  r (n )
(П.8.23)
отражает суммарные потери
производителя и потребителей
продукции от несовпадения спроса и предложения, когда разница x(n) r(n)  0, причем при x(n)  r(n) эти потери больше, чем при x(n)  r(n), т.к.
простои строителей обходятся дороже.
Функция
y2(n) = bu2(n)
(П.8.24)
описывает потери производителя, связанные с изменением объема
производства.
Решение задачи оптимального управления бетонным заводом
осуществляется следующим образом. Пусть a = 2, b = 3.
Функция Гамильтона на основании (П.8.4) с учетом (П.8.24) и (П.8.22)
имеет вид:
H = p(x + u) - y2 - y1 ,
а с учетом (П.8.23) и (П.8.24) получим:
2
при xr
2  ( x  r)
H  p( x u )3u 
2
при xr
2( x r )
Выражение для присоединенной функции определим по
формуле (П.8.5)
p(n ) 
2x ( n )r ( n ) при xr
H
 p( n  1)  
 x p  p( n  1)
4x ( n )r ( n ) при xr
(П.8.25)
Выражение для оптимального управления заводом определяется по (П.8.6)
р(n + 1) - 6uоп(n) = 0 , откуда
141
1
uоп  p( n 1)
6
.
(П.8.26)
Подставим это выражение в (П.8.21) и получим:
1
x(n  1)  x(n )  p(n1)
6
, откуда
1
x ( n )  x ( n  1)  p( n1)
6
.
(П.8.27)
Чтобы сделать расчеты по этому уравнению, надо знать x(N) и p(N).
Для определения p(N) воспользуемся условием трансверсальности
(П.8.3)
F
p ( N ) 
 x x x( N )
.
Из (П.8.22) на основании (П.8.2) и (П.8.23) следует, что в данном
случае терминальный член:
 x( N )r( N )2 при x r
F 
2
2x( N )r( N ) при xr
2x( N )r( N ) при xr
p ( N ) 
4x( N )r( N ) при xr
Тогда
(П.8.28)
Так как значение x(N) неизвестно, то определить значение p(N)
аналитически не представляется возможным.
В ситуациях, подобных данной, когда число граничных условий
меньше числа разностных уравнений, а условием трансверсальности
воспользоваться нельзя, решить задачу можно методом перебора. Суть
метода в следующем. Вначале зададим наугад значение x(N). По здравому
смыслу оно не должно сильно отличаться от r(N) = r(5) = 8. Затем по
выражению (П.8.28) определим величину p(N) = p(5). Далее по выражению
(П.8.27) определим величину x(4), а по выражению (П.8.25) определим
p(4).
Далее повторим этот процесс вычислений по формулам (П.8.27) и
(П.8.25) при n = 3 и определим x(3) и p(3).
Далее повторим процесс вычислений по формулам (П.8.27) и (П.8.25)
при n = 2, n = 1 и n = 0. В результате определим значение x(0).
Теперь сравним его с заданным начальным условием x(0). Если
разница между рассчитанным и заданным значением x(0) по модулю
меньше числа   0, то мы угадали величину x(N). В противном случае
снова вернемся к началу вычислений, зададимся другим значением x(N) и
повторим процесс вычислений снова. И так до тех пор, пока не получится
142
. После этого по (П.8.27) и
(П.8.25) рассчитывается весь процесс от n = 5 до n = 0. Величину uоп (n )
рассчитываем по (61).
Описанную процедуру решения задачи методом перебора можно
выполнить быстро, если запрограммировать разностные уравнения
(П.8.28), (П.8.27) и (П.8.25) на ЭВМ.
заданная величина x(0) с погрешностью
Результаты решения задачи оптимального управления бетонным заводом приведены в таблице П.8.3.
Таблица П.8.3
n
x
0
1
1
1,9
025
uоп
0,
9025
f0
402
0,8
376
2,
4435
2
2,7
578
1,4
176
2,1
237
3
4,1
142
0,8
562
9,0
57
4
5,0
5
6,2
085
1,1
-
5,3
6,4
943
3,6
178
076
189
J=28,
9686
На рис. П.8.1 приведены зависимости x(n) и r(n), построенные по
табл. П.8.2 и табл. П.8.3.
x(n),r(n)
r(n)
8
7
6
5
4
3
2
1
x(n)
n
0
1
2
3
4
5
Рис. П.8.5. Зависимости x(n) и r(n)
Из этого рисунка видно, что функция оптимального предложения
товара x(n) представляет собой сглаженный процесс от функции спроса
r(n).
Приложение 9. Постановка и решение задачи оптимального управления непрерывными процессами методом ДП в
общем виде
143
Пусть задана оптимизационная задача для непрерывного
процесса, описываемого системой из m дифференциальных
уравнений вида:
 
dxi (t )
 f i ( X ,U , t ),
dt
i  1, m
.
где fi –известные функции,
X - вектор состояния (1  m),

U - вектор управления (1  r).
(П.9.1)

X
(0) , допустимые
Заданы начальное состояние системы


пространства состояний и управлений X (t ),U (t ) Vдоп , интервал
управления t = 0  T и выражение для целевой функции вида:
T
 

J   f 0 ( X ,U , t )dt  F ( X (T ))  min ,
(П.9.2)
где f0, F – подынтегральная и терминальная функции соответственно.
Необходимо найти оптимальный вектор управления

0
U оп (t ), на интервале t = 0  T, чтобы обеспечить (П.9.2).
Для решения задачи оптимального управления непрерывными системами методом динамического
программирования

(ДП) введем функцию Беллмана ( X , t ), являющуюся
функцией

m + 1 переменной (m переменных вектора X и одна переменная
–

время). Отличительной особенностью функции ( X , t ) является
то, что
 она не должна зависеть от переменных вектора управления U .

( X , t ) построим две ноЗатем с помощью
  функции
 Беллмана
вые функции R( X ,U , t ) и (X ) (в литературе их называют иногда
формальными функциями) по соотношениям:
 
 
 
 m 
R ( X ,U , t ) 

f i ( X ,U , t )  f 0 ( X ,U , t ),
t i 1 xi


Ф( X )  ( X , T )  F ( X ) .
i  1, m
(П.9.3)
(П.9.4)
Поставленная оптимизационная
 задача решается методом ДП
при таком векторе
управления U оп (t ), который формирует
про
 
цесс V  X ,U , t  , максимизирующий функцию R( X ,U , t ) на всем
интервале управления t = 0  T, то есть
144


 
Vоп  ( X оп ,U оп , t )  arg max R( X ,U , t ),


X оп ,U оп Vдоп


(П.9.5)

Ф
(X
) при t = T, т.е. в конце
а также минимизирует функцию
 
X  X оп оптимальный вектор управлепроцесса
управления.
При



 
U
(
t
)

arg
max
R
(
X
,
U
,
t
)
R
(
X
,U , t )
оп
оп
ния
. Отметим, что функция
может быть представлена через функцию Гамильтона Н в виде:
 
d
R ( X ,U , t )  H 
dt ,
(П.9.6)
 
 

f i ( X ,U , t )  f 0 ( X ,U , t )
i 1 xi
m
где
H
(П.9.7)
функция Гамильтона, в которой частные производные
выступают в роли присоединенных функций.
С учетом (П.9.6) выражение (П.9.5) примет вид:

x i


d
( X оп ,U оп , t )  H max 
,
dt
(П.9.8)

d
H max 
 C (t )
dt
откуда:
,
(П.9.9)

где C(t ) - процесс при максимальной функции Гамильтона.
Из (П.9.9) получим:

d
  H max  C (t )
dt
.
(П.9.10)
Это уравнение Гамильтона–Якоби–Беллмана
для непрерыв
ных процессов. При C(t ) = 0 как частный случай из него следует
уравнение Беллмана
d
  H max
dt
,
в которое входит производная функции Беллмана по времени.
Граничные условия для уравнений (П.9.9) и (П.9.10)
определяются
из (П.9.4), откуда следует :

( X , T )   F ( X )  C1 ,


C

C
(
T
)


(
X
).
где 1
C(t )  0 имеем:
При


( X , t )   F ( X ).
(П.9.11)
(П.9.12)
145
Из (П.9.9) и (П.9.10) следует, что решение этих уравнений с
граничными условиями (П.9.11) и (П.9.12) есть задача Коши.
Основной проблемой применения метода ДП
 для непрерывных процессов является отыскание функции ( X , t ) . Универсальных алгоритмов поиска этой функции не существует.
146
Список литературы
1. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное
управление. М.: Наука, 1979.
2. Беллман Р. Динамическое программирование. М.: Изд-во
иностр. лит., 1960.
3. Беллман Р. Методы вычислений // Автоматика и телемеханика. 1993. № 8. С. 10.
4. Брокате М. Оптимальное управление системами гистерезисного типа // Автоматика и телемеханика. 1991. № 12; 1992. №
1.
5. Винер Н. Кибернетика и общество. М.: Изд-во иностр. лит.,
1958.
6. Интрилигатор М. Математические методы оптимизации и
экономическая теория/Пер. с англ. - М.: Айрис-пресс, 2002. - 576 с.: ил. (Высшее образование).
7. Колемаев В.А. Математическая экономика: Учебник для вузов. - 2-е
изд., перераб. и доп. - М.: ЮНИТИ-ДАНА, 2002. - 399 с.
8. Красовский Н.Н. Теория управления движением. М.:
Наука, 1968.
9. Лагоша Б.А. Оптимальное управление в экономике: теория
и приложение: учеб. Пособие. – 2-е изд., перераб. И доб. / Б.А.
Лагоша, Т.Г. Апалькова. – М.: Финансы и статистика, 2008. – 224
с.:ил.
10. Лагоша Б.А. Оптимальное управление в экономике: Учеб. пособие.
- М.: Финансы и статистика, 2003. - 192 с.: ил.
11. Основы теории оптимального управления: Учеб. пособие для экон.
вузов/В.Ф.Кротов, Б.А.Лагоша, С.М.Лобанов, и др.; Под ред. В.Ф.Кротова.
- М.: Высш. шк., 1990. - 430 с.: ил.
12. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.:
Наука, 1969.
13 Ройтенберг Я.Н. Гироскопы. М.: Наука, 1975.
14. Рудик А.П. Ядерные реакторы и принцип максимума
Понтрягина. М.: Атомиздат, 1970.
15. Черноусько Ф.Л., Колмановский В.Б. Вычислительные и
приближенные методы оптимального управления // Итоги
науки и техники. Мат. анализ. 1977. Т. 14..
16. Шимко П.Д. Оптимальное управление экономическими
147
системами :учеб.пособие для вузов. - СПб.: Бизнес-пресса,
2004 Гриф МО
17. Экономико-математические методы и прикладные модели:
Учеб. пособие для вузов/В.В. Федосеев, А.Н. Гармаш, Д.М.
Дайитбегов и др.; Под ред. В.В. Федосеева. - М.: ЮНИТИ, 2002. 391 с.
18. Afanasiev V.N., Kolmanovskii V.B., Nosov V.R. Mathematical
Theory of Control Systems Design. Dordrecht: Kluwer, 1996.
19. Swan G.W. Application of Control Theory in Medicine. N.Y.:
Dekker, 1984.
148
Скачать