1 Основные понятия Существует множество определений той области современной науки, которую называют исследованием операций. Приведем одно из самых общих: «Исследование операций − прикладное направление кибернетики, используемое для решения организационных (в том числе экономических) задач (распределения ресурсов, управления запасами, упорядочения и согласования и др.)...»1 . Как видно из этого определения, предмет исследования операций необычайно широк. Такое понимание появилось далеко не сразу. Возникновение и становление исследования операций относят к периоду второй мировой войны. В то время речь шла исключительно о военных приложениях (задачи противовоздушной обороны, охраны конвоев, эффективности систем стрельбы и т.д.). Позднее, в 50-х и 60х гг. ХХ в. методы исследования операций стали применяться и в гражданских областях: промышленности, торговле, политике... Теоретический аспект исследования операций состоит в построении и исследовании математических моделей принятия оптимальных решений. Именно такое определение исследования операций мы далее и примем в качестве рабочего. Операция как совокупность целенаправленных действий немыслима без определения цели. Цель может формулироваться по-разному. Например, в военных операциях она может заключаться в достижении победы над противником, в минимизации собственных потерь, в максимизации разности ущербов и т.п. В производстве и торговле можно стремиться к получению наибольшей прибыли, минимизации себестоимости продукции. Отметим, что именно наличие определенной цели выделяет исследование операций из общей тематики системного анализа и математического моделирования. К достижению цели стремится человек, группа лиц или организация, называемая оперирующей стороной. В ее распоряжении имеются ресурсы (людские, материальные, денежные, временные и т.д.). Внутри оперирующей стороны выделяется лицо, называемое исследователем операции. Исследователь операции преследует ту же цель, что и оперирующая сторона. Однако, он не принимает окончательных решений. Его задача состоит в формировании и изучении математической модели операции и выработке рекомендаций по выбору способов действий (стратегий). Контролируемые факторы − это влияющие на исход операции величины, значения которых определяет своими действиями оперирующая сторона в рассматриваемой операции. При этом поступающая информация об обстановке, в которой происходит операция, может существенно расширить возможности выбора контролируемых факторов. Правило выбора контролируемых факторов в зависимости от 1 Советский энциклопедический словарь. М.: Советская энциклопедия, 1979. 2 поступающей информации называется стратегией. Обстановка проведения операции обычно описывается заданием информации о неконтролируемых факторах. Неконтролируемые факторы описывают состояние внешней среды и действия других субъектов, влияющих на исход операции. Среди них выделяют: случайные факторы, для которых известен вероятностный закон распределения, и неопределенные, относительно которых известна лишь область их возможных значений. Неопределенные факторы делятся, в свою очередь, на: • природные неопределенности; • стратегии, контролируемые другими субъектами, имеющими собственные интересы, действия которых влияют на исход операции. При этом субъекты, имеющие по отношению к оперирующей стороне противоположные интересы, называются противниками; • факторы, характеризующие неясность цели оперирующей стороны (см. пример ??). Стремление оперирующей стороны к достижению цели операции описывается стремлением к увеличению значения критерия эффективности, зависящего от контролируемых и неконтролируемых факторов. Иногда цель состоит в уменьшении значения заданного критерия; в таких случаях его обычно называют критерием потерь. Изучаются и модели с несколькими критериями эффективности. Немало примеров многокритериальных задач дает экономика. Деятельность предприятия оценивается по нескольким показателям: прибыль, доля в общем объеме продаж и т.д. Активы банка оцениваются обычно по двум показателям: доходность и риск. Еще одна область приложений − проектирование сложных технических объектов. Например, конструкция автомобиля оценивается по нескольким техническим характеристикам: скорость, грузоподъемность, экономичность двигателя и т.д. Задачу исследования операций можно сформулировать как поиск оптимальной (с точки зрения поставленной цели) стратегии оперирующей стороны. Решение этой задачи включает следующие основные этапы: 1 ) формальное описание множеств значений контролируемых и неконтролируемых факторов; 2 ) описание зависимости исхода операции от значений факторов; 3 ) определение на множестве возможных исходов количественного критерия или нескольких критериев, характеризующих исход операции с точки зрения поставленной цели; 3 4 ) описание информационных потоков, поступающих в ходе операции оперирующей стороне и другим субъектам, и формализация множеств стратегий всех участников; 5 ) определение зависимости исхода операции от набора стратегий; 6 ) описание модели выбора стратегий прочими субъектами операции; 7 ) определение критерия эффективности на множестве стратегий оперирующей стороны и выбор оптимальной по этому критерию стратегии1 . Основные разделы теории исследования операций, излагаемые в данном пособии, связаны с указанными этапами построения математической модели операции и поиска оптимальной стратегии. Последовательность изложения отражает переход от простейшей задачи принятия решений, изучаемой в теории оптимизации, к более сложным постановкам, включающим случайные и неопределенные факторы, наличие нескольких критериев, участие других субъектов с собственными интересами, многошаговые операции с последовательным поступлением информации. В заключительных главах рассматриваются современные приложения исследования операций в экономике и политике (о других приложениях см. [?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?]). Базовые модели Оптимизация. В абстрактной постановке простейшая математическая модель принятия решений состоит в следующем. Имеется множество X стратегий x, на котором определена скалярная числовая функция W (x) − целевая функция. Принцип оптимальности отвечает максимизации W (x), т.е. оптимальна стратегия x∗ ∈ X, для которой W (x∗ ) = max W (x). (В.1) x∈X Таким образом, принятие решения происходит на основе оптимизации целевой функции. Оптимальных стратегий может быть несколько. Если нет никаких оснований предпочесть одну стратегию другой, то их следует считать эквивалентными (равноценными, одинаково приемлемыми) для оперирующей стороны. Поэтому исследователь операций может предложить оперирующей стороне любое решение задачи (В.1) 1 Более подробно о структуре операции и особенностях взаимодействия исследователя и оперирующей стороны см. монографию Ю.Б. Гермейера [?]. 4 Дальнейшую селекцию решений удается осуществить, только привлекая дополнительную информацию о цели операции, т.е. изменяя принцип оптимальности и, в конечном счете, меняя постановку задачи исследования операций. Пример В.1. Рассмотрим пример из области оптимального проектирования. Пусть коробка изготавливается из прямоугольного листа материала размера a × b, a < b. Для этого из четырех углов прямоугольника вырезаются квадраты со стороной x и материал сгибается вдоль линий, отмеченных на рис. В.1 пунктиром. x b a Рис. В.1 В результате получается коробка с основанием − прямоугольником размера (a − 2x) × (b − 2x) и высотой x. Здесь стратегия x ∈ X = (0, a/2) может быть оценена целевой функцией V (x) = x(a − 2x)(b − 2x) − объемом коробки. Максимум функции V (x) на множестве X достигается в точке √ a + b − a2 − ab + b2 ∗ x = . 6 Многокритериальная оптимизация. Задачи, в которых существует единственный, четко сформулированный критерий эффективности, встречаются на практике не так уж часто. В более сложных ситуациях задается векторный критерий эффективности. Подобный многокритериальный подход появляется когда: • качество решения оценивается с нескольких точек зрения, по отдельным компонентам качества; • качество решения оценивается для нескольких вариантов условий; • оперирующая сторона включает нескольких субъектов, интересы которых описываются различными целевыми функциями. Для того, чтобы пояснить специфику многокритериальных задач принятия решения, будем считать, что имеется множество X стратегий x, на котором задан 5 векторный критерий эффективности W (x) = (W1 (x), ..., Ws (x)) (В.2) Каждый из составляющих скалярных критериев Wi (x), i = 1, ..., s, обладает тем свойством, что для оперирующей стороны его значение выгодно увеличивать. Рассмотрим следующие два способа сравнения стратегий: а) стратегия x предпочтительнее стратегии x0 (обозначение: xSx0 ), если Wi (x) > Wi (x0 ), i = 1, ..., s; (В.3) б) стратегия x предпочтительнее стратегии x0 (обозначение: xP x0 ), если Wi (x) > Wi (x0 ), i = 1, ..., s, W (x) 6= W (x0 ). (В.4) Принимая способ сравнения стратегий (В.3) или (В.4), мы тем самым задаем на X так называемое бинарное отношение. Первое из них представляет отношение строгого доминирования (отношение Слейтера), а второе − отношение Парето1 . Пример В.2. Девушка N N при выборе жениха руководствовалась двумя критериями: заработком и ростом избранника. Это означает, что другими качествами (ум, обаяние и т.п.) все претенденты на ее руку обладали в равной степени. В табл. В.1 представлена информация, которой располагала N N . Tаблица В.1 Претенденты Петр Андрей Максим Заработок(усл. ед.) 1300 1000 800 рост (см) 168 180 175 Андрей строго предпочтительнее Максима, а Петр и Андрей не сравнимы по данному векторному критерию. Среди последних двоих N N сделала нелегкий выбор, разрешившийся в пользу Андрея. Как определить понятие оптимальной стратегии в задаче с несколькими критериями, если имеется лишь способ сравнения стратегий (В.3) или (В.4)? Естественно здесь воспользоваться аналогией с оптимизацией по скалярному критерию эффективности. Найденная из решения оптимизационной задачи (В.1) стратегия x∗ обладала тем свойством, что не существовало стратегии x ∈ X более предпочтительной, чем x∗ . 1 Вильфредо Парето (1848−1946) − итальянский социолог и экономист. В социологии известен как основатель теории элит. 6 В нашем случае оптимальной назовем такую стратегию x∗ , что не существует стратегии x ∈ X, для которой xRx∗ , где R − бинарное отношение, совпадающее с S или P . Особенность данного определения состоит в том, что существует целое множество P (X, W ) неэквивалентных в общем случае между собой стратегий, оптимальных по Парето, и аналогичное множество S(X, W ) стратегий, оптимальных по Слейтеру. Введем множество векторных оценок стратегий Y = {y ∈ E s | y = W (x), x ∈ X}. Для случая двух критериев (s = 2) изобразим его на плоскости (рис. В.2). Множество Парето P (Y ) = W (P (X, W )) составляет кривая BC (северо-восточная граница) множества Y, а множество точек, оптимальных по отношению Слейтера S(Y ) = W (S(X, W )), − кривая ABCD, включающая горизонтальный отрезок AB и вертикальный отрезок CD. На рис. В.2 изображена также векторная оценка y, связанная отношениями S и P с векторной оценкой z (в пространстве оценок). Из определений (В.3) и (В.4) отношений S и P , очевидно, следует, что P (Y ) ⊆ S(Y ) и P (X, W ) ⊆ S(X, W ). W2 6 A B ay $ C az Y 0 D - W1 Рис. В.2 Поиск множества P (X, W ) или S(X, W ) обычно представляет собой лишь первую стадию анализа задачи принятия решений при нескольких критериях. Для выделения какого-либо конкретного решения требуется дополнительная информация от оперирующей стороны. Иногда такая информация может выражаться в сведении («свертке») векторного критерия (В.2) в скалярный. Это снова приводит к задаче оптимизации (В.1). Пример В.3. Продолжим рассмотрение примера В.1. Обозначим через M (x) = 4x2 площадь сэкономленного материала (четырех вырезанных уголков). Альтерна- 7 тива x ∈ X оценивается двумя критериями W1 (x) = V (x) и W2 (x) = M (x). Заметим, что на полуинтервале [x∗ , a/2) критерий W1 (x) убывает, а критерий W2 (x) возрастает. Поэтому P (X, W ) = [x∗ , a/2). Принцип гарантированного результата. Рассмотрим ситуацию, когда исход операции зависит не только от стратегии x ∈ X оперирующей стороны, но и от значения неопределенного фактора y ∈ Y и оценивается функцией F (x, y). Оперирующая сторона стремится, по возможности, максимизировать ее значение. Эта фраза, конечно, нуждается в разъяснении и уточнении. Прежде всего, поясним, что y − это неконтролируемый оперирующей стороной фактор, о котором известно лишь, что y ∈ Y и, вообще говоря, неизвестно никакого его распределения вероятностей (которого, возможно, и вообще не существует). Такого рода неконтролируемые факторы называются в исследовании операций неопределенными. Неопределенные факторы в модели операции могут появляться либо из-за недостаточной изученности обстановки проведения операции («природная неопределенность»), либо из-за действий субъектов, преследующих свои, отличные от оперирующей стороны, цели, либо из-за использования огрубленных математических моделей. Каким образом можно определить критерий и принцип оптимальности в операции с неопределенными факторами? Формально рассматриваемую ситуацию можно свести к задаче принятия решений с векторным (бесконечномерным) критерием W (x) = {F (x, y), y ∈ Y }, (В.5) где y ∈ Y играет роль «индекса». Специфика задачи, состоящая в неинформированности оперирующей стороны об y, подсказывает нам, что не все способы приведения векторного критерия (В.5) к скалярному приемлемы. В анализе операций с неопределенными факторами важную роль играет принцип гарантированного результата: при оценке эффективности стратегии оперирующей стороне следует исходить из наихудшего значения этих факторов. В данном случае, поскольку оперирующая сторона не распоряжается выбором y ∈ Y и не имеет информации о вероятностном распределении y, то в качестве критерия разумно выбрать W (x) = min F (x, y). (В.6) y∈Y Величина (В.6) называется оценкой эффективности стратегии x. Стратегия, имеющая большую оценку эффективности, является для оперирующей стороны более предпочтительной. Отсюда сразу приходим к принципу оптимальности. Оптимальной считается стратегия x∗ ∈ X, для которой W (x∗ ) = max W (x) = max min F (x, y). x∈X x∈X y∈Y (В.7) 8 Введенный принцип оптимальности называется принципом максимина или принципом гарантированного результата, величина W (x∗ ) − наилучшим гарантированным результатом, а x∗ − оптимальной гарантирующей стратегией. Пример В.4. Пожарные охраняют полигон, имеющий форму круга G радиуса R. Будем предполагать, что из любой точки полигона можно проехать на машине в любую другую точку по прямой линии и что машины двигаются с постоянной скоростью. Решается вопрос о размещении на полигоне трех пожарных расчетов. Нужно так выбрать точки их расположения, чтобы до возникшего в точке y ∈ G пожара можно было скорее всего добраться. Пусть xi ∈ G, i = 1, 2, 3, − точки полигона, в которых располагаются пожарные расчеты. Контролируемые факторы x = (x1 , x2 , x3 ); неопределенный фактор y ∈ G; F (x, y) = min ρ(xi , y), i=1,2,3 где ρ(xi , y) − расстояние между точками xi и y. Оценка эффективности (В.6) в данном случае записывается в виде W (x) = max F (x, y). y∈Y Очевидно, оптимальная стратегия обладает тем свойством, что объединение трех кругов B(xi , W (xi )) с центрами в точках xi радиусов W (xi ) покрывает круг G. Пусть x∗ − стратегия, состоящая в том, что пожарные расчеты располагаются на серединах трех радиусов, углы между которыми равны 120◦ . Докажем, что √ стратегия x∗ является оптимальной. Заметим, что W (x∗ ) = 3R/2. √ Предположим, что найдется стратегия x = (x1 , x2 , x3 ), для которой W (x) < 3R/2. Построим окружность радиуса R с центром в точке O. Пусть радиус OT содержит точку x1 , точки A, H, D и S лежат на окружности и ∠AOT = ∠HOT = ∠SOC = ∠DOC = 60◦ (рис. В.3). Ca D aHH aS HH a O Aa x1 a aH a T Рис. В.3 √ Из неравенства W (x) < 3R/2 следует, что круг B(x, W (x)) не содержит точки A и H. Следовательно, точки x2 , x3 не содержатся в секторе DOSC. Тогда точка C 9 не будет лежать в объединении кругов B(xi , W (xi )), i = 1, 2, 3, что противоречит определению W (x). Приведенные модельные примеры решались на основе элементарных рассуждений. Однако, решение практических задач исследования операций требует привлечения современных математических методов оптимизации, решения минимаксных задач, использования ЭВМ. При построении модели операции принцип максимина обычно постулируется. Наши рассуждения являются лишь попыткой убедить в целесообразности его использования. В самом деле, какое-то значение y ∈ Y обязательно реализуется в момент проведения операции, причем не исключено, что y примет самое неблагоприятное для оперирующей стороны значение, на котором достигается (реализуется сколь угодно точно) оценка (В.6). В таком случае нельзя действительно гарантировать результат операции, лучший, чем (В.7). Это может произойти не только, когда y выбирает противник, преследующий цель, противоположную оперирующей стороне, но и когда y − природная неопределенность. Принцип гарантированного результата имеет аксиоматическое обоснование, но главным аргументом, говорящим в его пользу, служит, конечно, практика, успешное использование в операциях, например, военного и экономического характера. Принцип гарантированного результата иногда связывают с «перестраховкой» в принятии решения, поскольку наилучший гарантированный результат оказывается слишком малым, неприемлемым для оперирующей стороны. Зачастую это не лишено оснований. Один из путей увеличения оценки исхода операции заключается в уменьшении неопределенности Y и расширении множества стратегий X. С формальной точки зрения это соответствует тому, что возрастает минимум (В.6) и увеличивается максимин (В.7). Содержательно проблема сводится к получению дополнительной информации о неопределенном факторе, которую нужно добыть, как правило «заплатив» за это, и к умению (возможности) этой информацией воспользоваться. Свои ресурсы необходимо распределять в зависимости от поступающей информации о неопределенных факторах. Такой подход связан с разработкой динамических (многошаговых) моделей принятия решений и уточнением принципа максимина применительно к этим моделям. Принятие решений в конфликтных ситуациях: игры двух лиц. Пусть исход операции определяется двумя факторами: стратегией оперирующей стороны x ∈ X и стратегией другого субъекта y ∈ Y. Цель оперирующей стороны состоит в максимизации функции F (x, y), а второго участника (противника, подчиненного, партнера) − в максимизации функции G(x, y). Такого рода конфликтная ситуация называется игрой двух лиц и изучается теорией игр. Принципы выбора оптималь- 10 ной стратегии существенно зависят от порядка выбора стратегий, возможностей передачи информации о стратегиях и заключения обязательных соглашений. Рассмотрим наиболее характерные случаи, предполагая функции выигрыша непрерывными, а множества стратегий компактными. а) Антагонистическая игра: G(x, y) ≡ −F (x, y). Противник выбирает свою стратегию, зная стратегию оперирующей стороны. Тогда при заданной стратегии x разумный противник выберет y ∈ Arg max G(x, y) = Arg min F (x, y). y∈Y y∈Y (В.8) Поэтому оценкой эффективности любой стратегии x является величина W (x) = min F (x, y), y∈Y (В.9) а оптимальная стратегия определяется как x∗ ∈ Arg max min F (x, y). x∈X y∈Y (В.10) б) Стратегии выбираются одновременно и независимо друг от друга, нет никакой дополнительной информации о противнике. Исходя из принципа гарантированного результата, оперирующей стороне следует использовать ту же оценку эффективности (В.9) и выбирать стратегию согласно (В.10). Аналогичный подход используется в ситуации, когда функция выигрыша противника неизвестна. в) Ситуация отличается от предыдущей наличием информации о том, что противник выбирает свою стратегию, исходя из принципа гарантированного результата, т.е. назначает y ∗ ∈ Argmaxy∈Y min G(x, y) = Arg min max F (x, y). x∈X y∈Y x∈X (В.11) Тогда, если y ∗ определяется однозначно, то W (x) = F (x, y ∗ ), оптимальная стратегия x ∈ Arg max F (x, y ∗ ). x∈X Рассмотрим следующий пример: X = Y = {1, 2}, F (1, 1) = 2, F (1, 2) = −2, F (2, 1) = −1, F (2, 2) = 5. Тогда согласно (В.10) оптимальная стратегия оперирующей стороны x∗ = 2, а максимальный гарантированный результат W ∗ = −1. В то же время, исходя из условия (В.11), x = 1, W = 2. Таким образом, информация о том, что противник придерживается принципа гарантированного результата в смысле (В.11) побуждает оперирующую сторону отказаться от выбора стратегии согласно тому же критерию. 11 Возникает вопрос: как противники должны выбирать стратегии в указанной ситуации, если оба придерживаются принципа гарантированного результата и знают об этом? Решение этой проблемы обсуждается далее в подразд. ?? Здесь опишем класс конфликтных ситуаций, для которых такой проблемы не возникает. Пара стратегий (x0 , y 0 ) называется седловой точкой функции F (x, y), если для любых x ∈ X и y ∈ Y выполнены неравенства F (x, y 0 ) 6 F (x0 , y 0 ) 6 F (x0 , y). Седловой точке можно придать следующий игровой смысл. Если игроки выбрали в качестве стратегий компоненты x0 , y 0 седловой точки, то каждому из них невыгодно отклоняться от выбранной стратегии. Поэтому седловая точка является формализацией концепции равновесия в игре. Пусть X 0 − множество стратегий, обеспечивающих максимальный гарантированный результат согласно (В.10), а Y 0 − множество стратегий, обеспечивающих max min G(x, y) y∈Y x∈X для противника. Следующие утверждения доказаны в подразд. ?? Пусть max min F (x, y) = min max F (x, y) = v. x∈X y∈Y y∈Y x∈X Тогда всякая пара (x0 , y 0 ), где x0 ∈ X 0 , y ∈ Y 0 , является седловой точкой функции F (x, y), и во всех этих точках выигрыш равен v. Справедливо и обратное: если существует седловая точка (x0 , y 0 ), то максимин равен минимаксу и x0 ∈ X 0 , y 0 ∈ Y 0. Для класса игр, в которых существует седловая точка, принцип гарантированного результата ведет к выбору x0 ∈ X 0 независимо от информации о приверженности противника принципу гарантированного результата. г) Интересы сторон не являются противоположными, партнер выбирает свою стратегию, зная стратегию оперирующей стороны. Тогда следует ожидать выбора def y ∈ Y (x) = Arg max G(x, y). y∈Y Такой выбор возможен в следующих случаях: 1 ) партнер действует после того, как наблюдает стратегию x; 2 ) оперирующая сторона дает достоверное обязательство применить стратегию x. 12 Оценка эффективности стратегии x, исходя из принципа гарантированного результата, имеет вид W (x) = min F (x, y), y∈Y (x) а максимальный гарантированный результат W ∗ = sup min F (x, y). x∈X y∈Y (x) Отметим, что даже при непрерывных функциях выигрыша и компактных множествах стратегий последний супремум может не достигаться (см. пример ??2). д) Стратегии выбираются одновременно и независимо друг от друга, партнеры не могут заключить никакого обязательного соглашения. Именно такое взаимодействие называют некооперативной игрой. Пара (x0 , y 0 ) называется ситуацией равновесия (равновесием по Нэшу) игры Γ, если max F (x, y 0 ) = F (x0 , y 0 ), max G(x0 , y) = G(x0 , y 0 ). x∈X y∈Y Если оба игрока придерживаются ситуации равновесия, то одному игроку от нее невыгодно отклоняться. Такой подход представляется достаточно обоснованным, если в игре существует единственное равновесие по Нэшу (x0 , y 0 ). В этом случае оценка эффективности W (x) = F (x, y 0 ) приводит к выбору стратеги x0 . Однако, для многих конфликтных ситуаций характерно наличие нескольких равновесий по Нэшу. Рассмотрим следующий пример. Пример В.5. Игроками являются два водителя, которым надо проехать через перекресток, к которому они подъехали одновременно (рис. В.4). Есть две стратегии пересечения перекрестка: использовать правило, согласно которому водитель должен пропустить помеху справа (стратегия 1), или правило, согласно которому водитель должен пропустить помеху слева (стратегия 2). Если оба водителя придерживаются одного правила, то они успешно разъедутся, в противном случае может возникнуть авария. Следовательно, для благоприятного исхода в таких играх у всех игроков должен быть одинаковый подход к выбору правил поведения. 2 6 1 Рис. В.4 13 Более формально, пусть ситуация соответствует рисунку и первый водитель является оперирующей стороной. Выигрыши участников зададим следующим образом: F (1, 1) = G(2, 2) = 1, F (2, 2) = G(1, 1) = 0, F (1, 2) = G(1, 2) = −1, F (2, 1) = G(2, 1) = −10. Здесь два равновесия по Нэшу: (1,1) и (2,2). Если каждый выберет лучшее с его точки зрения равновесие, то оба получат −10 (попадут в аварию). Вопрос о правомерности использования равновесия по Нэшу для моделирования поведения в конфликтных ситуациях типа некооперативной игры рассматривается ниже в подразд. ?? Основной вывод состоит в том, что такой подход обоснован для типичных, многократно повторяющихся конфликтных ситуаций. При этом в случае неединственности равновесия выбор конкретных стратегий определяется предысторией и закрепляется традицией, а иногда − законом. Так, в данном примере российские Правила дорожного движения предписывают «пропустить помеху справа» независимо от информации о приверженности партнера этому принципу. Из истории исследования операций Как и любая развивающаяся наука, исследование операций имеет глубокие корни. В истории можно найти массу свидетельств того, что принятие и реализация целенаправленных действий опирались на предварительные (операционные) исследования1 . К одному из первых исследователей операций относится Архимед (ок. 287−212 гг. до н.э.), создавший в III в. до н.э. систему защиты Сиракуз от кораблей римлян. В том, что Сиракузы выдержали осаду в течение трех лет, историки видят в основном заслугу изобретательного ума Архимеда. При этом речь идет именно об операционном исследовании, в котором требовалось осуществить оценку эффективности и выбор различных вариантов обороны. В средние века после тринадцатилетней войны 1454−1466 гг. в локальных конфликтах между Тевтонским орденом и Польшей принимал активное участие «епископ города Торуня, неплохой врач, математик и механик, некий Миколай Коперник. Среди всего прочего, он так хорошо расположил артиллерию замка Фромборк, что штурмующие его орденские войска за два часа стрельбы потеряли половину личного состава и в панике отступили. Н. Коперник (1473−1543) известен не только своими астрономическими открытиями. По его проекту введена новая монетная система в Польше, а в г. Фрауенбурге он построил гидравлическую машину, с помощью которой снабжались водой все дома. 1 Данный очерк основан на материалах, подготовленных проф. В.В. Федоровым [?]. 14 Ярким примером анализа систем может служить усовершенствование тактики ведения боя Александром Македонским (356−323 до н.э.). Основой тактики, перенятой Александром от своего отца Филиппа, была македонская фаланга, которая состояла из 16 рядов пехоты, вооруженной длинными пиками. Главная задача фаланги заключалась в том, чтобы сковать противника своей неповоротливостью в обороне и разгромить его в наступлении, используя свою огромную ударную мощь. В решающий момент боя, когда пехота противника оказывалась скованной, ее атаковала с обоих флангов македонская кавалерия. Фаланга обеспечивала первые победы Александра, но у нее были два серьезных недостатка, которыми впоследствии не преминули воспользоваться враги македонян. К этим недостаткам следует отнести, во-первых, отсутствие подвижности, объяснявшееся большой инертностью фаланги, и, во-вторых, незначительная дальность действия ее ударной силы. Александр много экспериментировал, пытаясь устранить эти недостатки. В конце концов он пришел к единственно правильному решению. Прежняя глубина ряда (16 человек) была сохранена, но из этих 16 шеренг лишь первые три и последняя были представлены тяжелой македонской пехотой, вооруженной копьями. Остальные 12 шеренг строились из легкой пехоты, вооруженной дротиками. Результатом этого было увеличение подвижности фаланги без сколько-нибудь значительного уменьшения ее массы. Наряду с этим такая перегруппировка позволяла Александру наносить удары по противнику на расстоянии и принимать оборонительный порядок при сближении. К этому примеру целесообразно добавить, что Александр Македонский был не только великим полководцем, но и ученым-философом. Первым его учителем был сам Аристотель (384−322 до н.э.). В походах его сопровождали группы философов, которые несомненно являлись прообразом нынешних групп по исследованию операций. Есть все основания полагать, что военные успехи Александра в значительной степени зависели от его научной подготовки, его способности к аналитическому мышлению и от умения пользоваться советами ученых-специалистов. Нет сомнений в том, что он вполне понимал значение исследования систем для решения военных задач своего времени. В начале XIX века американский изобретатель Э. Уитни (1765−1825) убедил правительство США передать ему заказ на изготовление 10 тысяч мушкетов стоимостью 13 долларов 40 центов каждый. Срок исполнения заказа был определен в 2 года. До этого времени ружье от приклада до ствола изготовлялось вручную, в результате чего детали одного ружья не соответствовали размерам деталей другого. Уитни пришло в голову делать все части ружей машинным способом и настолько точно, чтобы каждая деталь одного ружья могла быть заменена такой же деталью другого. Он добился этого, сконструировав новое ружье и внедрив новую систему производства, при которой необученный рабочий мог производить предметы, равные по 15 качеству предметам, изготовленным самыми искусными и опытными механиками. «Попутно» Уитни изобрел фрезерный станок. Несмотря на это, потребовалось восемь лет, чтобы выполнить заказ, поскольку практика открывала многие недочеты в его системе. В 1811 г. Уитни получил новый заказ на 15 тысяч ружей и выполнил его в 2 года благодаря своей фабричной системе производства. В 1885 г. американский инженер Фредерик У. Тейлор (1856−1915) провел исследование по оптимизации системы производства, основанной на глубоком разделении труда, рационализации трудовых движений. Один из многих выводов, к которым он пришел, состоит в том, что землекопы захватывают лопатой больший груз, чем это требуется для достижения максимальной производительности. Тот же Ф.У. Тейлор во время работы в качестве инженера по научному управлению сталелитейной компании «Бетлехем стил» заметил, что каждый рабочий грузил 12,5 тонны чугуна в день на грузовики и что в полдень все рабочие падали от усталости. Он провел анализ всех факторов, вызывающих усталость рабочих, и заявил, что рабочие способны грузить не 12,5 тонны, а 47 тонн в день! В 1916 г. английский инженер-изобретатель и специалист в области аэродинамики Фредерик Уильям Ланчестер (1868−1946) исследовал модели боевых действий. Он получил явное решение дифференциальных уравнений, носящих его имя. Это решение позволяет, исходя из соотношения сил и их боевой эффективности, делать выводы о победе одной из противодействующих сторон. Датский исследователь А.К. Эрланг (1878−1929), работавший в Копенгагенской телефонной компании, в 1917 г. изучал системы массового обслуживания с приложениями к проблемам телефонной связи. В 1917 г. к Томасу А. Эдисону (1847−1931) обратилось правительство США с просьбой создать акустический прибор для обнаружения подводных лодок. Однако, тот поставил перед собой более глобальную задачу спасения от них надводных кораблей и обратился за информацией к флоту США о потерях торгового флота. Нужной информации не было, и тогда Эдисон сам собрал и изучил необходимые статистические сведения. Оказалось, что пароходные компании используют во время войны те же маршруты, что и в мирное время; только 6% судов потоплено ночью; подводные лодки редко атаковали на мелководье. В результате проведенных исследований он дал следующие рекомендации: • в опасной зоне суда должны находиться только ночью; • следует отказаться от стандартных маршрутов; • днем укрываться в гаванях или на мелководье; • заходить в глубоководные порты только ночью. Эти рекомендации не были своевременно внедрены и снова переоткрыты во время второй мировой войны. Эдисон был великим гением-изобретателем, он изобрел не один прибор, а тысячи. Одной из причин такой удивительной продуктивности является основанная 16 им в начале своей карьеры исследовательская лаборатория в Менло-Парк, НьюДжерси, где он нанял себе группу способных помощников. Это был прототип больших научно-исследовательских лабораторий, которые с тех пор основало большое количество промышленных фирм. Создание Эдисоном современной, хорошо оборудованной исследовательской лаборатории, где множество людей работало как единая система, стало одним из важных его изобретений − хотя он и не мог его запатентовать. Эдисон был не только изобретателем. Он также принимал участие в производстве и организовал несколько промышленных компаний. Самой главной из них стала компания «Дженерал Электрик». Генри Форд (1863−1947) в 1896 г. сконструировал автомобиль по своему проекту и организовал в 1903 г. «Форд Мотор Компани» − предприятие, которое добилось быстрого успеха. В основу деятельности предприятия была положена концепция Форда: сконструировать доступный по цене автомобиль, созданный специально для каждодневной езды. Его первые модели не совсем отвечали этим высоким целям. Но знаменитая «Модель Т», представленная в 1908 г., приблизилась к ним максимально. В конце концов было продано более 15 млн таких автомобилей. Форд сразу понял, что должен снизить их себестоимость. С этой целью он ввел на своих заводах ряд очень эффективных технологий. Они включали в себя полностью заменимые части, большую степень разделения труда, сборочную линию. Методы производства требовалось тщательно анализировать и постоянно пытаться найти способы усовершенствования. Сложную задачу следовало разделить на несколько простых, чтобы с ними могли справиться неквалифицированные рабочие (многие из которых были неграмотными) без долгих периодов подготовки. Ни одна из этих идей не принадлежала лично Форду. Как мы видели выше, Энди Уитни применил взаимозаменяемые детали примерно на век раньше, Фредерик Уинслоу Тейлор защищал все эти идеи в своих трудах, а несколько малых фирм уже использовали сборочные линии для своего производства. Но Форд был первым масштабным промышленником, который применил все это целиком, системно. Начало становления современного исследования операций связывают с работами в период второй мировой войны. В 1935 г. в Великобритании начались работы по обнаружению самолетов с помощью радиолокаторов, а в 1936-м − эксперименты по наведению истребителей-перехватчиков с помощью радиолокационных станций. Вначале эти работы из соображений секретности велись независимо, а в конце 1937 г. были объединены. При этом была осознана новизна проблем, возникающих изза взаимодействия техники, людей, административных структур, необходимость оценки эффективности системы противовоздушной обороны. Для решения новых проблем была создана научная группа под руководством физика П. Блэккета. В ее первоначальный состав входили: один физик, три физиолога, два специалиста по математической физике, астрофизик, офицер, топограф, физик-экспериментатор 17 и два математика. В декабре 1941 г. П. Блэккет составил записку «Ученые в сфере операционных исследований», в которой он изложил взгляды на предмет и специфику той науки, которую мы сегодня называем исследованием операций. В США группа по исследованию операций была создана в 1942 г. под руководством опять же физика Ф. Морза. Аналогичные отделы организованы в Канаде в 1942 г. Специалисты этих исследовательских групп, в отличие от английских, занимались в основном вопросами организации действий военно-морских и военновоздушных сил. Общее число ученых в группах по исследованию операций при штабах и командованиях составляло примерно 700 человек. После войны часть ученых, занимавшихся операционными исследованиями, вернулись к своим мирным профессиям. Однако, несмотря на это, подразделения исследования операций расширялись, создавались различные центры стратегических исследований; так в 1949 г. в США возникла известная корпорация РЭНД. Центр тяжести переместился от задач военного характера к задачам, связанным с экономикой, планированием, политикой. В промышленности США фирма «Локхид» одной из первых создала у себя группу по исследованию операций. Расширению круга изучаемых проблем способствовало появление и внедрение ЭВМ. Первый период развития исследования операций отражен в книге Ф. Морза и Д. Кимбелла «Методы исследования операций» [?]. В 1946 г. вышло ее секретное, а в 1951 г. − открытое издание. У нас она переведена в 1956 г. В настоящее время написано много очень разных книг, которые в той или иной степени представляют состояние и понимание предмета исследования операций. В нашей стране идеи и методы исследования операций в силу исторических причин развивались в значительной степени независимо от западных разработок. Без сомнения к операционным исследованиям может быть причислена разработка плана ГОЭЛРО, который стал не только планом электрификации, а проектом «гармоничного соединения» земледелия, промышленности и транспорта, или, говоря современным языком, − комплексной программой размещения и развития производительных сил страны. Председателю комиссии ГОЭЛРО Г.М. Кржижановскому (1872−1959) было предоставлено право привлекать для работы как разные учреждения, так и отдельных лиц. В разработке плана участвовали крупнейшие специалисты страны: энергетики, экономисты, строители, инженеры, статистики и др. Они образовали несколько групп: центральную и группы по районам. Часть работ выполнялась подгруппами и отдельными специалистами. Был принят порядок многократного обмена материалами между группами по районам и центральной группой. Исходная информация оперативно поступала из губерний и уездов. Отличительной особенностью плана была его комплексность. Ведь надо было решить сразу несколько проблем: транспортную, топливную, продовольственную. В этой связи план предусматривал путем строительства тепловых и гидроэлектро- 18 станций перевести основы развития страны на путь всемерной электрификации и использовать ее как инструмент интенсификации производства в промышленности и сельском хозяйстве на базе самой современной техники. Одновременная электрификация железных дорог с использованием естественных водных артерий позволяла решить транспортную проблему и вопросы поставки продовольствия с сельскохозяйственного юга России в промышленные центр и северо-запад. Денежная часть плана предусматривала затраты в размере 17 млрд. золотых рублей. И лишь 7% из них (1,2 млрд р.) пошли непосредственно на электроэнергетику. Основные средства предназначались для почти двукратного расширения обрабатывающей и добывающей промышленности, а также на восстановление, улучшение и расширение транспорта. Полностью план по электростроительству был выполнен в 1931 г., а в 1935 г. выработка электроэнергии в стране в 13,5 раза превысила уровень 1913 г. и в 52 раза уровень 1921 г. К 1935 г. вместо запланированных 30 электростанций было построено 40. Уже в 1928 г. был превышен довоенный уровень по таким важнейшим показателям, как национальный доход, объем валовой промышленности и производство средств производства. В 1930 г. в соответствии с планом был вдвое превзойден довоенный уровень промышленного производства. К 1936 г. производительность труда в промышленности превысила довоенный уровень более чем в 2,5 раза по годовой выработке и более чем в 3,5 раза по часовой выработке. По уровню промышленного производства Советский Союз вышел на первое место в Европе и на второе в мире. Другими примерами блестяще спланированных и реализованных операций являются первый этап космической программы Советского Союза, завершившийся запуском в космос Ю.А. Гагарина, и работы по созданию в СССР атомного и термоядерного оружия. В 70−80-х гг. ХХ в. на базе ОКБ им. П.О. Сухого под руководством академиков Н.Н. Моисеева и П.С. Краснощекова была создана система формирования облика летательных аппаратов. В ее основе лежала формализованная модель процесса проектирования от «внешнего» проектирования, где формулируются цели создания нового технического объекта и устанавливаются требования к его функциональным характеристикам, до «внутреннего» проектирования, которое разделяется на этапы предварительного, эскизного и рабочего проектирования. На каждом этапе (уровне) проектирования объект с разной степенью детализации характеризуется конструктивными параметрами, на которые накладываются ограничения компоновочной схемы и которые оцениваются с помощью векторного критерия технических характеристик. С использованием построенной схемы была осуществлена декомпозиция задачи внешнего проектирования [?]. Эта работа сыграла большую роль в создании самолета СУ-27, являющегося важным компонентом военно- 19 воздушных сил СССР и России с начала 80-х гг. и до настоящего времени. Что касается теории исследования операций, то активную роль в ее развитии сыграли математики, занимавшиеся решением тех или иных прикладных проблем и создавшие для этих целей соответствующий математический аппарат. Так в середине 30-х гг. А.Я. Хинчин (1894−1959) и Б.В. Гнеденко (1912−1995) начали изучать класс вероятностных задач, получивших впоследствии название задач теории массового обслуживания. Л.В. Канторович (1912−1986) выполнил основополагающие работы в области линейного программирования, предложил в конце 30-х гг. ряд линейных оптимизационных моделей планирования производства. И в настоящее время методы линейного программирования широко применяются для анализа производственных и более общих экономических проблем. Советские ученые-экономисты В.С. Немчинов (1894−1964) и В.В. Новожилов (1892−1970) внесли большой вклад в разработку методов экономических измерений эффективности производства и в формирование концепций оптимального функционирования плановой экономики. В 1945 г. в трудах Математического института им. В.А. Стеклова опубликован сборник статей по теории стрельбы1 под редакцией А.Н. Колмогорова (1903−1987). В нем сформулирован общий подход к построению критериев и оценке эффективности систем стрельбы. В послевоенные годы Д.А. Вентцель и В.С. Пугачев развивали так называемую «теорию эффективности технических систем», в рамках которой появились многие методы и принципы выбора проектных параметров технических систем, наилучшим образом отвечающих достижению поставленных целей. По своей сути это были типично операционные системы. Значительное место в становлении единой научной дисциплины «исследование операций» в нашей стране принадлежит Е.С. Вентцель (1907−2002), Н.Н. Воробьеву (1925−1995), Ю.Б. Гермейеру (1918−1975), Н.Н. Моисееву (1917−2000) и др. С их именами связано более ясное понимание смысла этой науки, развитие ее концепций, математических моделей и методов принятия решений. Детальному обоснованию и развитию подвергся принцип гарантированного результата − один из основных принципов принятия решений в условиях неопределенности. 1 Труды МИАН. Т. XII. 1945.