Элементы математической статистики Тема 1 - Описательная статистика 1. Случайная величина и способы еѐ описания 2. Основные распределения и их генерация в Excel 3. Генеральная совокупность. Выборочные данные. Группировка данных 4. Параметры распределения (персентиль, квартиль, меры положения, изменчивости, формы) 5. Инструменты вычисления параметров распределения в Excel 6. Наглядные методы описательной статистики 1. Случайная величина и способы еѐ описания Основные распределения и их генерация в Excel Случайной величиной называется переменная величина, которая в зависимости от исхода испытания случайно принимает одно значение из множества возможных значений (неизвестно заранее –какое именно) . Случайная величина, принимающая различные значения, которые можно записать в виде конечной или бесконечной последовательности, называется дискретной случайной величиной. Примеры: число очков, выпавших при бросании игральной кости; число родившихся детей в семье; число отказавших элементов в приборе, состоявшем из n элементов и т. д. Случайная величина, которая может принимать все значения из некоторого числового промежутка, называется непрерывной случайной величиной. Примеры: прирост веса домашнего животного за месяц есть случайная величина, которая может принять значение из некоторого промежутка; прогнозируемая температура воздуха по области и т. д. Условимся случайные величины обозначать большими буквами, а их значения соответствующими малыми буквами. Тогда, если Х – случайная дискретная величина, х1, х2, …хn - возможные значения, каждое из них возможно, но не достоверно, и величина Х может принять каждое с них некоторой вероятностью: В результате опыта величина Х примет одно из значений, т.е. произойдет одно из несовместных, образующих полную группу событий. Случайная величина будет полностью описана с вероятностной точки зрения, если сможем указать, какой вероятностью обладает каждое из значений, т.е. распределить суммарное значение, равное единице, между значениями случайной величины. Всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями называется законом распределения случайной величины. Простейшей формой задания закона распределения является таблица, в которой перечислены возможные значения случайной величины и соответствующие им вероятности: х1 х2 … хn р1 р2 … рn Такую таблицу называют рядом распределения . Функция распределения Ряд распределения служит исчерпывающей характеристикой (законом распределения) прерывной случайной величины. Однако, эта характеристика не является универсальной; она существует только для случайных прерывных величин. Нетрудно убедиться, что для случайной непрерывной величины такой характеристики построить нельзя. Действительно, случайная непрерывная величина имеет бесчисленное множество возможных значений, сплошь заполняющих некоторый промежуток (так называемое «несчетное множество»). Составить таблицу, в которой были бы перечислены все возможные значения такой случайной величины, невозможно. Кроме того, каждое отдельное значение непрерывной случайной величины обычно не обладает никакой, отличной от нуля, вероятностью. Следовательно, для случайной непрерывной величины не существует ряда распределения в том смысле, в каком он существует для прерывной величины. 1 Однако, различные области возможных значений случайной величины все же не являются одинаково вероятными, и для непрерывной величины существует «распределение вероятностей», хотя и не в том смысле, как для прерывной Для количественной характеристики этого распределения вероятностей удобно воспользоваться не вероятностью события Х = х, а вероятностью события Х< х, где х — некоторая текущая переменная. Вероятность этого события, очевидно, зависит от х, то есть некоторая функция от х. Эта функция называется функцией распределения случайной величины Х и обозначается F (x); F(x) = P(X < x) Функцию распределения F(x) иногда называют также интегральной функцией распределения или интегральным законом распределения. Функция распределения — самая универсальная характеристика случайной величины. Она существует для всех случайных величин: как прерывных, так и непрерывных. Функция распределения полностью характеризует случайную величину с вероятностной точки зрения, т. е. является универсальной формой закона распределения. Общие свойства функции распределения - Функция распределения F(x) есть неубывающая функция своего аргумента, т. е. при x2 >x1 , F(x2) > F(x1) - На минус бесконечности функция распределения равна нулю: F(- оо)= 0 На плюс бесконечности функция распределения равна единице F(+ оо)= 1 Очевидно, если рассматривать случайную величину Х как случайную точку Х на оси Ох, которая в результате опыта может занять то или иное положение, то функция распределения F(x) есть вероятность того, что случайная точка Х в результате опыта попадет левее точки х. Будем увеличивать х, т. е. перемещать точку х вправо по оси абсцисс. Очевидно, при этом вероятность того, что случайная точка Х попадет левее х, не может уменьшиться; следовательно, функция распределения F(x) с возрастанием х убывать не может. Докажите аналогичным способом второе и третье свойство функции распределения - График функции распределения F(x) в общем случае представляет собой график неубывающей функции (рисунок 1), значения которой начинаются от 0 и доходят до 1, причѐм в отдельных точках функция может иметь скачки (разрывы). F(x) х Рисунок 1 По мере увеличения числа значений случайной величины и уменьшения интервалов между ними число скачков становится больше, а сами скачки –меньше, ступенчатая кривая становится более плавной, случайная величина приближается к непрерывной величине, а еѐ функция распределения – к непрерывной функции. Функция f(x) –производная от функции распределения – характеризует как бы плотность, с которой распределяются значения случайной величины в данной точке. Эта функция называется 2 плотностью распределения или дифференциальной функцией распределения (кривая распределения) Зная распределения вероятностей, интересующих случайных величин, можно делать статистические выводы о событиях, в которых эти случайные величины участвуют, проверять гипотезы, оценивать параметры. Но среди всех вероятностных распределений есть такие, которые используются на практике особенно часто. Среди дискретных распределений – это биноминальное и пуассоновское, среди непрерывных – показательное и нормальное. Основные распределения и их генерация в Excel Биноминальное распределение – одно из самых распространенных дискретных распределений, которое служит вероятностной моделью для многих явлений. Оно возникает в тех случаях, когда нас интересует сколько раз происходит некоторое событие в серии из определенного числа независимых событий (опытов). Биномиальное распределение (распределение Бернулли) - распределение вероятностей числа появлений некоторого события при повторных независимых испытаниях, если вероятность появления этого события в каждом испытании равна p Пример Для удобства и наглядности будем полагать, что нам известна величина p – вероятность того, что вошедший в магазин посетитель окажется покупателем и (1– p) = q – вероятность того, что вошедший в магазин посетитель не окажется покупателем. Если X – число покупателей из общего числа n посетителей, то вероятность того, что среди n посетителей оказалось k покупателей равна P(X= k) = , (1) Формулу (1) называют формулой Бернулли Если эту последовательность оборвать, то из последовательности независимых испытаний Бернулли получаются биномиальная, геометрическая, паскалева и отрицательная биномиальная случайные величины Биномиальная случайная величина (m|n,p) – число m успехов в n испытаниях. Свойства: - Математическое ожидание MX = np - Дисперсия DX= np(1-p) - Биноминальное распределение может быть аппроксимировано нормальным распределением или распределением Пуассона. Пакет анализа данных Excel содержит средства для генерации случайных чисел по некоторым известным распределениям. Пакет доступен через меню Сервис, команда - Анализ данных. Если данной команды нет в меню, необходимо выбрать из этого же меню команду «Надстройка». В появившемся окне выставить флажок (т.е. пометить) возле инструмента «Пакет анализа». С помощью процедуры «Генерация случайных чисел» данного пакета можно моделировать объекты, имеющие случайную природу, по заданному распределению вероятностей. Для этого надо вызвать процедуру «Генерация случайных чисел» через команду Сервис, Анализ данных : Рисунок 2 – Сервис, Анализ данных, Генерация данных 3 В следующем окне необходимо заполнить параметры: число переменных (определяет - сколько случайных величин моделируем); число случайных чисел (означает - сколько значений будет иметь одна случайная величина); вид распределения, его параметры и выходной интервал. Распределение Пуассона играет важную роль в ряде вопросов физики, теории связи, теории надежности, теории массового обслуживания – словом, всюду, где в течение определенного времени может происходить случайное число каких-то событий (радиоактивных распадов, телефонных вызовов, отказов оборудования, несчастных случаев и т.п.) Рассмотрим наиболее типичную ситуацию, в которой возникает распределение Пуассона. Пусть некоторые события могут происходить в случайные моменты времени, а нас интересует число появлений таких событий в промежутке времени от 0 до T (например, количество звонков, поступающих на АТС). Сделаем следующие предположения,: - Вероятность появления события за малый интервал времени длины примерно пропорциональна , т.е. равна а + о( ), где а>0 – параметр задачи, отражающий среднюю частоту событий - Если в интервале времени длины уже произошло одно событие, то условная вероятность появления в этом же интервале другого события стремится к нулю при >0 - Количество событий, происшедших на непересекающихся интервалах времени, независимы как случайные величины. В этих условиях случайное число событий, происшедшее за время от 0 до Т распределено по закону Пуассона с параметром аТ Свойства : Математическое ожидание и дисперсия случайной величины, распределенной по закону Пуассона с параметром , равны параметру Связь с другими распределениями: - При большом n и малом р существует связь между биноминальным распределением и распределением Пуассона. - При > 9, распределение Пуассона может быть аппроксимировано нормальным распределением со средним и дисперсией - Сумма m независимых случайных величин, имеющих пуассоновские распределения соответственно, имеет также распределение Пуассона с параметром 1 , 2 .... т 1 2 ... т Для генерации чисел, распределенных по Пуассоновскому закону с помощью пакета анализа, после выполнения команды: Сервис, Анализ данных, Генерация случайных чисел необходимо указать вид распределения – пуассоновское, и значение параметра . Показательное распределение играет базовую роль по крайней мере в двух областях применения статистических методов. К первой из них относятся задачи, связанные с данными типа «времени жизни». Понимать этот термин следует достаточно широко. В медикобиологических исследованиях под ним может подразумеваться продолжительность жизни больных при клинических исследованиях, в технике – продолжительность безотказной работы устройств, в психологии –время, затрачиваемое испытуемым на выполнение тестовых задач и т.д. 4 Второй областью активного использования показательного распределения являются задачи массового обслуживания. Здесь речь может идти об интервалах между обращениями клиентов, телефонными звонками и т.п. В пуассоновской модели интервалы времени между появлениями последовательных событий имеют показательное распределение. Показательное распределение часто называют экспоненциальным. Параметр в некоторых областях именуют «отношением риска» В некоторых задачах вместо µ используют параметр b , b = 1/ µ Свойства: - Математическое ожидание: MX =1/ µ - Дисперсия DX = 1/ µ 2 - Среди других распределений данное распределение выделяется отсутствием «памяти» (отсутствие последействия) Связь с другими распределениями: Показательное распределение является частным случаем гамма распределения. 2. Генеральная совокупность. Выборочные данные Всякое исследование, в т.ч. и статистическое, начинается со сбора фактов, наблюдения; выводы, обобщения, как в науке, так и в практике ценны лишь тогда, когда они обоснованы фактами. К статистическим данным, пригодным для обобщений, предъявляется ряд требований: ­ данные должны быть максимально полными, но не отрывочными, случайно выхваченными; ­ данные должны быть абсолютно достоверными и точными; ­ данные должны соответствовать принципу единообразия, сопоставимости; ­ данные должны соответствовать принципу своевременности (сбор должен быть организован только в строго определенное время, но кроме этого, данные должны быть представлены так же в срочном порядке). Объектом статистического наблюдения называется та совокупность, о которой должны быть собраны необходимые сведения. Сплошное наблюдение - учет всех без исключения единиц в пределах данной совокупности. Материалы сплошного наблюдения позволяют выделить в составе изучаемой массе единицы качественно однородной группы и определить по каждой группе средние величины по наиболее существенным признакам. Единовременное и текущее наблюдения осуществляются в форме сплошного наблюдения, если необходимо получить сведения об объеме изучаемых явлений. Организация сплошного наблюдения не всегда возможна и целесообразна. Поэтому необходимо осуществлять не сплошное (частичное) наблюдение - учитывать только часть единиц совокупности, по которой составляют представление о характерных особенностях изучаемого явления в целом. Не сплошное наблюдение имеет определенные преимущества по сравнению со сплошным наблюдением: ­ требуется значительно меньше затрат труда и средств в связи с уменьшением числа обследуемых единиц; ­ данные могут быть собраны в более короткие сроки и по более широкой ­ программе, чтобы в заданных пределах всесторонне раскрыть особенности изучаемой совокупности, провести более глубокое научное исследование; ­ данные не сплошного наблюдения привлекаются для контроля материалов сплошного наблюдения; ­ не сплошное наблюдение должно быть репрезентативным (представительным). Наиболее совершенным с научной точки зрения видом не сплошного наблюдения является выборочное наблюдение. Выборочное наблюдение представляет собой такой вид статистического наблюдения, при котором обследованию подвергается некоторая часть единиц 5 изучаемой совокупности, отобранная в определенном строго научном порядке, с целью последующей характеристики всей совокупности. Группа элементов, образующая выборочное наблюдение, называется выборкой или выборочной совокупностью, а все множество изучаемых элементов, входящих в сплошное наблюдение называется – генеральной совокупностью. Повторная и бесповторная выборки. Репрезентативность. При составлении выборки можно поступать двумя способами: после того как объект отобран и над ним произведено наблюдение, он может быть возвращен или не возвращен в генеральную совокупность. В соответствии со сказанным выборки подразделяют на повторные и бесповторные. Для того, что бы по данным выборки можно было достаточно уверенно судить об интересующем признаке генеральной совокупности, необходимо, что бы объекты выборки правильно его представляли. Другими словами, выборка должна правильно представлять пропорции генеральной совокупности. Это требование коротко формулируют так: выборка должна быть репрезентативной (представительной). Репрезентативная выборка - это такая выборка, в которой все основные признаки генеральной совокупности, из которой извлечена данная выборка, представлены приблизительно в той же пропорции или с той же частотой, с которой данный признак выступает в этой генеральной совокупности. Ведущий принцип, лежащий в основе такой процедуры, - это принцип рандомизации, случайности. Выборка называется случайной (иногда мы будем говорить простая случайная или чистая случайная выборка), если выполняется два условия. Вопервых, выборка должна быть построена таким образом, чтобы любой человек или объект в пределах совокупности имел равные возможности быть отобранным для анализа. Во-вторых, выборка должна быть сформирована так, чтобы любое сочетание из n объектов (где n - просто количество объектов, или случаев, в выборке) имело равные возможности быть отобранным для анализа. Таким образом, построение простой случайной выборки обычными методами требует большого объема технической работы, особенно когда речь идет о широкомасштабных явлениях. По этой причине процедуры формирования случайной выборки видоизменяют, что бы увеличить их возможности. Один из таких распространенных вариантов называется случайной систематической выборкой и используется тогда, когда исследуется сравнительно большая совокупность, каждый член которой занесен в определенный единый список. Процедура выглядит следующим образом: Оценивается количество объектов в совокупности и делится на желательное количество объектов в выборке. Если обозначить результат через k, то фактически можно сказать, что желаемая выборка - это один из каждых k-объектов, или, говоря по-другому, каждый k-й объект. Техника формирования случайной систематической выборки по сравнению с формированием простой случайной выборки имеет два важных преимущества: ее удобно применять по отношению к большим совокупностям, отвечающим условию наличия единого списка, и у нее много потенциальных возможностей использования. Тем не менее, применяя эту процедуру, мы должны иметь в виду одну очень важную ее особенность. Поскольку случайная систематическая выборка менее случайна, чем прямой выбор в результате может быть получена менее репрезентативная подгруппа. Это можно проследить и на уровне определения, и на операциональном уровне. Чтобы установить необходимый объем выборки следует учесть несколько факторов. Один из наиболее важных - гомогенность - степень близости друг к другу членов данной совокупности с точки зрения изучаемых характеристик. Если каждый индивидуум в совокупности в точности такой же, как все остальные, то, выбрав всего лишь одного из них, получим действительно репрезентативную выборку. Напротив, если каждый индивидуум в совокупности абсолютно не похож ни на какой другой, то, прежде чем сможем утверждать, что у нас имеется репрезентативная выборка, потребуется провести перепись всей совокупности. В первом случае совокупность называют полностью гомогенной, во втором -полностью гетерогенной. Разумеется, в действительности большинство совокупностей располагается между этими двумя полюсами. Чем более гомогенна данная совокупность, т.е. чем меньше различий между ее членами, тем меньшая по объему выборка необходима для ее представления. Напротив, чем гетерогеннее совокупность, т.е. чем больше различий между ее членами, тем большая выборка необходима для ее представления. Таким образом, внутри уровней можно использовать, не теряя при этом репрезентативности, выборки меньшего объема, чем следовало бы для всей совокупности. Сходным образом, чем больше категорий необходимо исследовать, тем больше 6 должна быть выборка. Это вполне естественно, поскольку, чем больше различий между объектами принимается во внимание, тем больше объектов необходимо изучить, чтобы выборка получилась репрезентативной. Случайные выборки из генеральной совокупности можно создать средствами Excel. Для этого используется процедура Выборка из меню Сервис, Анализ данных. Данная процедура создает выборку из генеральной совокупности, рассматривая входной диапазон как генеральную совокупность. Если совокупность слишком велика для обработки или построения диаграммы, можно использовать представительную выборку. Кроме того, если предполагается периодичность входных данных, то можно создать выборку, содержащую значения только из отдельной части цикла. Например, если входной диапазон содержит данные для квартальных продаж, создание выборки с периодом 4 разместит в выходном диапазоне значения продаж из одного и того же квартала. 3. Группировка статистических данных В результате первой стадии статистического исследования - статистического наблюдения получают сведения о каждой единице совокупности. Задача второй стадии статистического исследования состоит в том, чтобы упорядочить и обобщить первичный материал, свести его в группы и на этой основе дать обобщенную характеристику совокупности. Этот этап в статистике называется сводкой. Различают простую сводку (подсчет только общих итогов) и статистическую группировку. Статистическая группировка сводится к расчленению совокупности на группы по существенному для единиц совокупности признаку. Группировка позволяет получить такие результаты, по которым можно выявить состав совокупности, характерные черты и свойства типичных явлений, обнаружить закономерности и взаимосвязи. Построение статистического ряда распределения включает следующие этапы: 1. Определение минимального (Хmin) и максимального (Хmax) значений признака. 2. Определение размаха варьирования признака: R=Xmax-Xmin R 3. Определение длины интервала: h , 1 3,32 lg n где h - длина интервала, R -размах варьирования признака, n -объем выборки 3. Определение граничных значений интервалов (ai +bi). Так как Xmax и Xmin являются случайными величинами, рекомендуется отступить влево от нижнего предела варьирования. При этом, за нижнюю границу первого интервала предлагается h принимать величину, равную a1 x min 2 Если оказывается, что a1 0 , хотя по смыслу величина неотрицательная, то можно принять a1 0 Верхняя граница первого интервала b1=a1+h. тогда, если b1-верхняя граница i-го интервала (причем a1+1=bi), то b2=a2+h, b3=a3+h и т.д., построение интервалов продолжается до тех пор, пока начало следующего по порядку интервала не будет равным или больше Xmax. 5. Группировка результатов наблюдений. Так как граничные значения признака могут совпадать с границами интервалов, то условимся в каждый интервал включать варианты большие, чем нижняя граница интервала (xi>ai), и меньшие или равные верхней границе (xi<bi). Примечание: Число интервалов обычно берут равным от 7 до 11 в зависимости от числа наблюдений и точности измерений с таким расчетом, чтобы интервалы были достаточно наполнены частотами. Если получают интервалы с нулевыми частотами, то нужно увеличить ширину интервала (особенно в середине интервального ряда). Построить вариационный ряд можно с помощью статистической функции Частота табличного процессора Excel Для этого надо ввести данные в столбец на листе таблицы, в соседний столбец ввести границы интервалов (определив длину интервала по вышеприведенной методике). Предварительно необходимо выделить столбец для вывода частот. Количество элементов в возвращаемом массиве должно быть на единицу больше числа элементов в массиве интервалов. Затем вызвать Мастер 7 функций из меню Вставить, Функцию или по кнопке fх , выбрать в категории Статистические «Частота», из категории «Статистические». В появившемся окне необходимо заполнить аргументы функции. Первый аргумент функции «Частота» - массив данных, массив интервалов (массив карманов) – второй аргумент функции «Частота». Закончить ввод, необходимо нажатием клавиш Shift+Ctrl+Enter, так как в результате получаем не одно значение (число), а массив значений - частот. 4. Параметры распределения ( перцентиль, квартиль, меры положения, изменчивости, формы) p- Персентиль определяет такое значение заданного распределения, которое больше рпроцентов всех значений распределений. Например, если вес новорожденного ребенка относится к 75 персентили, то он весит больше, чяем 75% всех новорожденных детей. Если покупателю известна 90 персентиль для цен на дома по разным районам, то он может лего сопоставить стоимость 90% домов по разным районам. Близкими по смыслу к персентилям являются квартили. Квартили соответствуют 25, 50, 75 персентилям, т.е. четвертям распределения (их называют первой, второй, третьей квартилью). Разница между третьей и первой квартилью называется интерквартильным диапазоном, в этом диапазоне располагается 50% данных и он дает представление о ширине распределения. Один из способов подсчета персентилей и квартилей является построение таблицы частот, по столбцу накопленных частот легко определить значения персентилей. Также имеются специальные статистические функции для расчета по заданному персентилю –значения из выборки или по данному значению из выборки –соответствующего значения персетиля. Это функции ПЕРСЕНТИЛЬ и ПРОЦЕНТРАНГ. ПЕРСЕНТИЛЬ - Возвращает k-ую персентиль для значений из интервала. Эта функция используется для определения порога приемлемости. Например, можно принять решение экзаменовать только тех кандидатов, которые набрали большее количество баллов, чем 90-ая персентиль. Синтаксис: ПЕРСЕНТИЛЬ(массив;k) Массив — массив или интервал данных с числовыми значениями, который определяет относительное положение. k — значение персентили в интервале от 0 до 1 включительно. ПРОЦЕНТРАНГ - Возвращает категорию значения в наборе данных как процентное содержание в наборе данных. Эта функция используется для оценки относительного положения точки данных в множестве данных. Например, c помощью функции ПРОЦЕНТРАНГ можно оценить положение подходящего результата тестирования среди всех результатов тестирования. Синтаксис: ПРОЦЕНТРАНГ(массив;x;разрядность) Массив — массив или интервал данных с числовыми значениями, который определяет относительное положение. x — значение, для которого определяется процентное содержание. Разрядность — необязательное значение, определяющее количество значащих цифр для возвращаемого процентного значения. Если этот аргумент опущен, то функция ПРОЦЕНТРАНГ использует три цифры (0,xxx). Распределения вероятностей характеризуются функциями плотности вероятности (ПВ). В свою очередь, эти функции характеризуются параметрами генеральной совокупности. Например, ПВ для нормального распределения характеризуется двумя параметрами: средним (произносится ―мю‖), которое обозначает центр распределения, и стандартным отклонением (произносится ―сигма‖), которое характеризует изменчивость значений распределения. (Зная эти параметры, можно рассчитать ПВ для нормального распределения). В большинстве случаев значения параметров генеральной совокупности неизвестны и их можно только оценить. Именно для этого предусмотрены оценочные функции, или оценки. При анализе данных желательно использовать состоятельные и неискаженные оценки, которые 8 стремятся к истинным значениям параметров генеральной совокупности при увеличении размеров выборки. Теоретически при достаточно большой выборке можно получить оценку с любой заданной точностью. Для оценки среднего для нормального распределения можно использовать следующую 1 n формулу выборочного среднего x : x для xi , а для оценки стандартного отклонения ni1 нормального распределения можно использовать следующую формулу выборочного стандартного n xi отклонения s : s x 2 . Обе оценки являются состоятельными, т.е. стремятся к истинным n 1 значениям и при увеличении размеров выборки n .Насколько большой должна быть выборка, чтобы получить хорошую оценку истинных значений параметров генеральной совокупности? Для ответа на этот вопрос нужно проанализировать выборочное распределение, т.е. определить, какому распределению удовлетворяет оценочная функция. Для этого можно создать несколько выборок и вычислить для них выборочные средние. Затем можно собрать выборочные средние в новую ―выборку выборок‖ и проанализировать ее распределение при увеличении размера каждой исходной выборки. i 1 Виды средних Средние величины используются для характеристики обычных, типичных значений признака, когда они рассчитываются по данным однородной совокупности. Например, можно говорить о типичной заработной плате работников определенной профессии в отдельной отрасли, о среднем надое молока от коров определенной породы при соответствующих нормах кормления и т.д. Если средние рассчитываются по неоднородным данным, например, среднее потребление мяса, производство национального дохода надушу населения в республике, то эти средние характеризуют государство как единую народнохозяйственную систему; поэтому они называются системные средние. Средняя арифметическая простая (невзвешенная) вычисляется по формуле: х1,х2,х3,…,хn значения осредняемого признака; n - число значений Средняя арифметическая взвешенная вычисляется по формуле: где, х1,х2,х3,…хn- значения осредняемых вариантов у отдельных промышленных предприятий, магазинов, хозяйств и других объектов (значения случайной величины) ; f1, f2, f3, …, fn - значения веса у отдельных промышленных предприятий, магазинов, хозяйств и других объектов. Если осредняемый признак первичный, то в качестве f берутся частоты, если - вторичный, то в качестве f берется признак, по отношению к которому рассчитывается значение вторичного признака. Например, первичным признаком будет надой молока на одну корову, при расчете среднего надоя в качестве веса будут использоваться данные о количестве коров, имеющих определенный надой молока. Процент жирности молока - вторичный признак, рассчитывается в виде соотношения количества жира к количеству молока; при расчете среднего процента жирности в качестве веса будет использоваться количество молока, имеющего определенный процент жирности. Средняя гармоническая взвешенная вычисляется по формуле: где, х1,х2,х3,…,хn - значения осредняемого показателя (; М1,М2,М3,…,Мn- веса у отдельных предприятий, магазинов, хозяйств. 9 Мода (М0 ) и медиана (Me) Мода (М0 ) и медиана (Me) относятся к наиболее часто используемым структурным средним Модой называется значение признака, наиболее часто встречающееся в совокупности, в ряде распределения. В дискретном ряде распределения моду найти просто - взять значение признака, имеющего наибольшую частоту. При расчете моды по данным интервального ряда распределения используется формула: , где: х0 - нижняя граница модального интервала, т.е. интервала, который чаще всего встречается; d - размах интервала; f2 - частота модального интервала; f1 и f3 - соответственно частота интервала, предшествующего модальному, и интервала, следующего за модальным. Примером использования моды является учет цен на рынках: учитывается цена на отдельный товар, наиболее часто встречающийся. Медианой в статистике называется значение признака, которое делит численность упорядоченного ряда распределения на две равные части. Упорядоченным рядом распределения называется ряд, значение признака в котором изменяется в порядке возрастания или убывания. Наглядным примером медианы может быть следующий. Представим шеренгу солдат, стоящих по росту; медианным ростом будет рост солдата, стоящего в середине шеренги. Мода и медиана дают представление о типичном, обычном значении признака, к тому же они позволяют получить представление о структуре совокупности, поэтому их называют структурными средними. В отличие от средних значений отдельных признаков модальные и медианные значения не увязываются в систему. Зная медианное значение часовой выработки, продолжительности рабочего дня и рабочего месяца, медианное значение месячной выработки рабочего на их основе получить будет нельзя. Значение медианы в меньшей степени, чем средней, зависит от резко отличающихся от остальных значений признака Меры изменчивости (стандартное отклонение, дисперсия) Кроме средних значений случайной величины, которые в определенном смысле характеризует определяют положение случайной величины, употребляются ещѐ ряд характеристик, каждая из которых описывает то или иное свойство распределения. Средний квадрат отклонений значений признака от их средней - дисперсия. Среднее квадратичное отклонение - корень квадратный из дисперсии Дисперсия есть наименьшее из всех возможных значений среднего квадрата отклонений. Это можно назвать минимальным свойством средней арифметической. дисперсия, рассчитанная в целом по совокупности, равна межгрупповой плюс средней из внутригрупповых дисперсий. Коэффициент вариации. характеризует относительный уровень различий. Коэффициент вариации является безразмерной величиной, что позволяет использовать его для сравнения уровня колеблемости по разным объектам, для разных признаков. Например, для сравнения различий в уровне дифференциации заработной платы между странами. Меры формы (ассиметрия, экцесс) 10 Третий центральный момент служит для характеристики асимметрии (скошенности) распределения. Если распределение симметрично относительно среднего то все моменты нечетного порядка равны нулю. Естественно поэтому в качестве характеристики выбрать какой-то из нечетных моментов, простейший из них третий центральный момент: Положительная асимметрия указывает на отклонение распределения в сторону положительных значений. Отрицательная асимметрия указывает на отклонение распределения в сторону отрицательных значений. Чтобы получить безразмерную величину вводят коэффициент асимметрии, который равен третьему центральному моменту деленному на куб стандартного отклонения. Четвертый центральный момент служит для характеристики так называемой крутости , т.е. островершинности или плосковершинности распределения. Эти свойства описываются с помощью эксцесса: Ex 4 4 3 Число 3 вычитается потому, что для весьма распространенного в 4 природе нормального распределения равен3 Положительный эксцесс обозначает относительно остроконечное распределение. Отрицательный эксцесс обозначает относительно сглаженное распределение. 4 5. Инструменты вычисления параметров распределения в Excel В Excel довольно полно представлены методы описательной статистики, причем для расчетов можно воспользоваться как отдельными статистическими функциями, так набором средств анализа данных (так называемым пакетом анализа). Рассмотрим вначале основные функции, реализующие методы описательной статистики: СРЗНАЧ(число1; число2; ...) – вычисляет среднее значение аргументов МЕДИАНА(число1;число2;...) - возвращает медиану заданных чисел МОДА(число1;число2; ...) - возвращает моду заданных чисел ДИСП(число1;число2; ...) - оценивает дисперсию по выборке СТАНДОТКЛОН(число1; число2; ...) - оценивает стандартное отклонение по выборке. СКОС(число1;число2; ...) возвращает асимметрию распределения Число1, число2, ... — от 1 до 30 аргументов, для которых вычисляется мода, аргумент можно задать диапазоном ячеек ЭКСЦЕСС(число1;число2; ...) - возвращает эксцесс множества данных СЧЁТ(значение1; значение2; ...) (используется для подсчета количества элементов выборки ДОВЕРИТ(альфа;станд_откл;размер) - возвращает доверительный интервал для среднего генеральной совокупности Для применения этих функций достаточно на листе Excel ввести данные (можно в столбец, строку или блоком; лишь бы одна ячейка –одно число); затем установив курсор в пустой ячейке вызвать необходимую функцию, меню Вставка, Функция . В категории Статистические выбрать одну из вышеуказанных функций Для анализа данных с помощью «Пакета анализа» следует указать входные данные и выбрать параметры; анализ будет выполнен с помощью подходящей статистической макрофункции, а результат будет помещен в выходной диапазон. Другие средства позволяют представить результаты анализа в графическом виде. Они доступны через команду Анализ данных меню Сервис. Если этой команды нет в меню, необходимо загрузить надстройку Пакет анализа. Раздел анализа «Описательная статистика» служит для создания одномерного статистического отчета, содержащего информацию о центральной тенденции и изменчивости входных данных. При вызове в появившемся окне необходимо указать входной диапазон данных, параметры и выходной диапазон. Для каждого столбца (строки) значений будут рассчитаны числовые характеристики Для построения рядов распределения на компьютере можно воспользоваться «Мастером функций» и «Мастером диаграмм» . Для этого введите данные в столбец (строку) на листе таблицы, в соседний столбец введите границы интервалов (определив длину интервала по 11 вышеприведенной методике для примера возьмем d =1,3). Выделите столбец для вывода частот. Количество элементов в возвращаемом массиве должно быть на единицу больше числа элементов в массиве интервалов. Затем вызовете из меню Вставить, Функцию и выберите «Частота», из категории «Статистические». В появившемся окне заполните аргументы функции. Массив данных – первый аргумент функции «Частота», массив интервалов (массив карманов) – второй аргумент функции «Частота». Закончить ввод, необходимо нажатием клавиш Shift+Ctrl+Enter, так как в результате мы получаем не одно значение (число), а массив значений Для расчета всех числовых характеристик распределения, построения частотных таблиц, гистограмм, диаграмм ящик с усами, ствол с листьями используется надстройка к Excel – StatPlus. Для установки надстройки необходимо записать пакет на компьютер. Затем войтя в меню Сервис, Надстройки через кнопку Обзор указать путь к папке, в которой расположен файл с расширением xla и нажать кнопку ОК. В строке меню появится дополнительная команда StatPlus. Команды описательной статистики находятся в меню StatPlus, Discribtion Statistics. В поле Data указывается диапозон исходных данных, в поле OutPut указывается выходной диапозон на этом же листе или новый лист. Желательно диапозону данных присвоить имя. 6. Наглядные методы описательной статистики Построить гистограмму по полученному ряду распределения в Excel, используя инструмент «Мастер диаграмм» можно в том случае, если интервалы группировки –равномерные. После вызова «Мастера диаграмм» : на первом шаге надо указать тип диаграммы – гистограмма на втором шаге в качестве диапазона данных указать массив (столбец) вычисленный частот, выбрав кнопку ряды «в строках»; - на третьем шаге задать параметры диаграммы (подписать заголовок, оси и т.д.) - на четвертом шаге указать, где расположить гистограмму (на этом же листе или новом) - нажать кнопку «Готово» Построить гистограмму можно также, используя инструмент «Гистограмма» Пакета анализа Excel . Для этого надо вызвать меню Сервис, Анализ данных (в Excel 2007 меню Данные, Анализ данных) и заполнить элементы дианового окна инструмента «Гистограмма»: входной диапазон, интервал карманов (по -умолчанию создается автоматически), выходной диапазон, Парето (отсортированная диаграмма - Установите флажок, чтобы представить данные в порядке убывания частоты. Если флажок снят, то данные в выходном диапазоне будут представлены в порядке возрастания отрезков, а трех самых правых столбцов с отсортированными данными не будет), Интегральный процент, вывод графика Диаграмма типа ―ящик с усами‖ (boxplot) изображает важные характеристики описательной статистики на одном компактном рисунке. Он предложен Джоном Таки (John Tukey) в 1977 г. в основополагающей книге Exploratory Data Analysis. Диаграмма типа ―ящик с усами‖ отображает перечисленные ниже характеристики описательной статистики. 1. Первая квартиль, медиана, третья квартиль и интерквантильный диапазон. 2. Минимальное и максимальное значения. 3. Умеренные и экстремальные выбросы. Диаграмма типа ―ящик с усами‖ дает хорошее визуальное представление изменчивости данных, а также асимметрии распределения. P-персентиль – такое значение заданного распределения, которое больше p -процентов всех значений распределения (Например, урожайность конкретного хозяйства региона относят к 75 персентили, значит урожайность в этом хозяйстве больше 75% урожайности во всех хозяйствах. Квартиль соответствует 25%, 50% и 75% перцентилям. Первый компонент диаграммы типа ―ящик с усами‖ называется интерквартиль ((IQR), который простирается от первой до третьей квартили. Для создания этого диапазона нарисуйте прямоугольник (―ящик‖) от первой до третьей квартили. Внутри ящика нарисуйте горизонтальную линию на уровне медианы (второй квартили). После отображения интерквартильного диапазона - 12 можно приступать к вычислению внутреннего и внешнего ограждений. Внутренние ограждения (inner fences) располагаются в области больше третьей квартили + 1,5 IQR или меньше первой квартили – 1,5 IQR. Внешние ограждения (outer fences) располагаются в области больше третьей квартили + 3 IQR или меньше первой квартили – 3 IQR. Все значения, которые лежат в промежутке между внутренним и внешним ограждениями, называются умеренными выбросами (moderate outlier) и обозначаются символами . Все значения, которые лежат за пределами внешних ограждений, называются экстремальными выбросами (extreme outlier) и обозначаются символами . Усы - это вертикальные линии, проведенные от ящика до максимального и минимального значения в областях умеренных выбросов. Эти значения не считаются выбросами. внешнее внутреннее 3-я квартиль медиана 1-я квартиль внутреннее внешнее Тема 2 Статистика выводов 1. 2. 3. 4. Нормальное распределение. Центральная предельная теорема . Распределения Стьюдента и Фишера Доверительный интервал. Проверка статистических гипотез (Критерии Стьюдента, Фищера) 1. Нормальное распределение. Центральная предельная теорема Нормальное распределение - является наиболее важным распределением статистического анализа. Многие случайные переменные удовлетворяют нормальному распределению, а во многих статистических тестах предполагается, что данные удовлетворяют нормальному распределению. Разнообразные статистические данные с хорошей степенью точности можно считать реализациями случайной величины, имеющей нормальное распределение. Можно предполагать нормальное распределение у случайной величины, если на еѐ отклонение от некоторого фиксированного значения аддитивно влияет множество различных факторов, причем влияние каждого из них вносит малый вклад в это отклонение, а их действия почти независимы. Кроме того, в силу центральной предельной теоремы распределение целого ряда широко распространенных в статистике функций от случайных величин хорошо аппроксимируется нормальным распределением. Нормальное распределение часто встречается в реальных исследованиях. Оно удобно для компьютерной обработки. Использованию нормального распределения для приближенного описания случайных величин не препятствует то обстоятельство, что эти величины обычно могут принимать значения только из какого-то ограниченного интервала (скажем, размер изделия должен быть больше нуля и меньше километра), а нормальное распределение не сосредоточено целиком ни на каком интервале. Однако, вероятность больших отклонений нормальной случайной величины от среднего значения настолько мала, что ее практически можно считать равной нулю. Кроме того, линейная комбинация любых нормально распределѐнных величин вновь распределена нормально. Для исследования "нормальных" данных математической статистикой выработаны эффективные методы. Эти методы непригодны для данных другой природы в том смысле, что выполнить соответствующий расчѐт можно, но результат будет неправильным. Поэтому, когда к имеющимся наблюдениям применяются ориентированные на нормальное распределение методы, необходимо выяснить, похоже ли распределение этих наблюдений на нормальное. С полной уверенностью сказать это невозможно, но, по крайней мере, от грубых ошибок такие проверки могут уберечь. Случайная величина ξ имеет нормальное распределение вероятностей с параметрами а и σ² (обозначение: ξ ~ N(a, σ²)), если ее плотность распределения задается формулой: 13 Математическое ожидание и дисперсия случайной величины ξ ~ N(a, σ²) равны Е(ξ) = a, (ξ) = σ². Другими словами случайная величина группируется вблизи a, причем типичные отклонения от a близки к σ (σ > 0). Плотность распределения стремится к нулю при удалении х от среднего значения. График функции плотности симметричен относительно точки а. Значит, медиана нормального распределения равна а. В точке а функция φ(х) достигает своего максимума, который равен . Значит, мода нормального распределения равна а. Таким образом, параметр а характеризует положение графика функции на числовой оси. Это параметр положения. Параметр σ характеризует степень сжатия или растяжения графика плотности. Это параметр масштаба. Вся совокупность нормальных распределений представляет собой двухпараметрическое семейство. Рассмотрим случайную величину η ~ N(0, 1). Случайная величина: Следовательно, характеристики любой нормально распределѐнной случайной величины легко определить по соответствующим характеристиками стандартной нормально распределѐнной величины с параметрами а = 0 и σ = 1. Плотность стандартного нормального распределения есть . Функция распределения стандартного нормального распределения обозначается Ф(х) и еѐ часто называют функцией Лапласа. Функция произвольного нормального распределения N(a, σ²): Известно, что площадь фигуры, ограниченная графиком функции плотности распределения, осью абсцисс и отрезками двух вертикальных прямых, х = b, х = с, есть вероятность попадания случайной величины в интервал (b, с). В связи с этим полезно знать, как распределяются доли площадей между кривой φ(х) и осью абсцисс. Случайная величина N(0,1) с вероятностью, примерно равной 34,1% попадает в интервал (0;1), с вероятностью 13,6% попадает в интервал (1;2), с вероятностью, примерно равной 2,14% попадает в интервал (2;3), с вероятностью, примерно равной 0,13% попадает в интервал (3;4). Отсюда для произвольной нормально распределенной случайной величины можно сформулировать правило, именуемое в литературе правилом сигм: нормально распределѐнная случайная величина ξ ~ N(a, σ²) как правило, попадает в интервал (а - 2σ, а + 2σ) (с вероятностью 95,44%), и практически наверняка попадает в интервал (а - 3σ, а + 3σ) (вероятность 99,73%). Верхние односторонние квантили распределения имеют следующий смысл. Высказывание "верхняя 95%-ая односторонняя квантиль равна 1,64" означает, что с вероятностью 95% стандартная нормально распределѐнная случайная величина не превышает 1,64. При этом Ф(1,64) ≈ 0,95. Односторонние квантили таковы: 95% - 1,64; 97,5% - 1,96; 99% - 2,33; 99,5% - 2.58. Верхние двусторонние квантили распределения имеют следующий смысл. Высказывание "верхняя 95%-ая двусторонняя квантиль равна 1,96, означает, что с вероятностью 95% стандартная нормально распределѐнная случайная величина по модулю не превышает 1,96. Ясно, что односторонняя (1 - ε) квантиль совпадает с двусторонней (1 - 2ε) квантилью. Двусторонние квантили таковы: 95% - 1,96; 97,5% - 2,24; 99% - 2,58; 99,5% - 2.81. Если ξ1 и ξ2 - независимые нормально распределенные случайные величины с параметрами a1, σ1² 14 и a2, σ2² соответственно, то их сумма ξ1 + ξ2 тоже распределена по нормальному закону, притом с параметрами a1 + a2 и σ1² + σ2². Для окончательной проверки закона распределения наблюдений используют критерии согласия. Однако в качестве первого шага проверки удобно применять простой Распределение выборочных средних для случайных выборок данных, каждый элемент которых подчиняется нормальному распределению со средним и стандартным отклонением n , где n — размер также будет нормальным со средним а и стандартным отклонением выборки. Например, если каждое наблюдение подчиняется нормальному распределению со средним 0 и стандартным отклонением 1, то выборочное среднее для выборки из 100 таких наблюдений также будет нормальным со средним 0 и стандартным отклонением 0,1. Увеличивая размер выборки, можно наблюдать визуальное представление зависимости между размером выборки и выборочным стандартным отклонением. Обратите внимание: при увеличении размера выборки диапазон наиболее вероятных значений сужается и приближается к значению 0, т.е. более крупные выборки позволяют точнее оценивать выборочное среднее Центрально предельная теорема (теорема Чебышева- Ляпунова) Если каждое наблюдение подчиняется распределению со средним а и стандартным отклонением , то, согласно центральной предельной теореме, распределение выборочных средних приблизительно удовлетворяет нормальному распределению со средним а и стандартным n , где n — размер выборки. Эта теорема справедлива для любого отклонением распределения, если его среднее и стандартное отклонение существуют и имеют конечные значения. Например, распределение выборочных средних для случайных выборок из данных, которые подчиняются равномерному распределению, приблизительно удовлетворяет нормальному распределению (а не равномерному распределению, как можно было бы ожидать). Чем больше размер выборки, тем точнее распределение выборочных средних удовлетворяет нормальному распределению. 2. Распределения Стьюдента и Фишера Чтобы использовать нормальное распределение для анализа данных, нужно точно знать значение , что не всегда возможно и потому приходится использовать оценку . В таких случаях вместо нормального распределения следует использовать t-распределение. Оно характеризуется параметром, который влияет на точность оценки , а именно степенями свободы. При анализе выборочных данных количество степеней свободы равняется количеству наблюдений минус 1. По мере увеличения количества степеней свободы (т.е. возрастания размера выборки) tраспределение точнее соответствует нормальному распределению. При этом оценка также становится точнее. Для низкого количества степеней свободы t-распределение имеет более длинные хвосты, чем нормальное распределение. При ошибочном использовании нормального распределения вместо t-распределения возможна недооценка вероятностей экстремальных значений. Для определения вероятности распределения по заданного х для можно использовать функцию Excel - СТЬЮДРАСП (x; степени_свободы; хвосты), где x — численное значение, для которого требуется вычислить распределение; степени_свободы — целое, указывающее число степеней свободы, хвосты — число возвращаемых хвостов распределения. Если хвосты = 1, то функция СТЬЮДРАСП возвращает одностороннее распределение. Если хвосты = 2, то функция СТЬЮДРАСП возвращает двухстороннее распределение. Вместо таблицы для определения критических значений t-распределения при проверки гипотез по критерию Стьюдента можно использовать функцию Excel - СТЬЮДРАСПОБР (вероятность; степени_свободы), где вероятность – вероятность, связанная с t – распределением. F-распределение Фишера используется преимущественно для статистического анализа регрессии и дисперсии данных. F-распределение характеризуется двумя параметрами степени свободы: числителем и знаменателем степеней свободы. Эти параметры используются для вычисления среднеквадратической ошибки разных факторов регрессии и дисперсии данных. F15 распределение часто обозначается как F m, n , где m — числитель, а n — знаменатель степеней свободы. В Excel имеется две функции, связанные с F – распределением: - FРАСП(х, степень свободы1, степень свободы2) - где x — численное значение, для которого требуется вычислить распределение; степенъ_свободы1 — целое, указывающее число степеней свободы числителя, степенъ_свободы2 - целое, указывающее число степеней свободы знаменателя. - FРАСПОБР(вероятность, степень свободы1, степень свободы2) - где вероятность – вероятность, связанная с F – распределением. Данная функция может быть использована вместо таблицы для определения критического значения F – критерия при проверке гипотез по критерию Фишера. 3. Доверительный интервал Доверительным интервалом называется интервал, содержащий истинное значение параметра с заданной вероятностью Р. Для оценки грубого доверительного интервала используются два утверждения. 1. Выборочное среднее удовлетворяет нормальному распределению со средним и стандартным отклонением n. 2. В нормальном распределении около 95% значений попадают в диапазон ±2 стандартных отклонения от среднего . Это значит, что выборочное среднее попадает в диапазон ±2 стандартных отклонения в 95% случаев. Например, если 4 , то выборочное среднее 50 для 25 наблюдений будет иметь стандартную ошибку 0,8 и можно на 95% быть уверенным в том, что истинное значение находится в пределах 50±2*0,8=50±1,6. Таким образом, можно с 95%-ной уверенностью утверждать, что истинное значение находится в диапазоне от 48,4 до 51,6. Для уменьшения доверительного интервала можно просто увеличить размер выборки. Если вместо выборки из 25 наблюдений используется выборка из 100 наблюдений, то доверительный интервал будет равен (49,2; 50,8). Для получения более точной меры доверительного интервала нужно использовать z-значения. Z p - это точка на кривой стандартного нормального распределения, для которой вероятность нахождения меньшего или равного значения равна p . Например, Z0,95 = 1,645, т.е. 95% всех значений стандартного нормального распределения меньше или равны 1,645. z-значения используются в тех случаях, когда задана вероятность встретить значение, меньшее или равное zзначению. Если нужно найти диапазон значений в центральной части распределения с заданной вероятностью, (например, требуется найти диапазон значений в центральной части стандартного нормального распределения с вероятностью 95%), то вводится параметр (вероятность встретить наблюдение за пределами центральной части) и вычисляются следующие значения: Z1 0,05 2 Z0,975 1,96 Иначе говоря, 95% всех значений стандартного нормального распределения лежат в промежутке между –1,96 и 1,96 (что близко использованной ранее грубой оценке ±2) Степень приближения выборочного распределения к нормальному распределению зависит от размера выборки и распределения вероятностей для отдельных наблюдений. Для больших выборок приближение к нормальному распределению может быть очень точным, а для маленьких выборок — менее точным. Если исходное распределение вероятностей очень скошено, то потребуется выборка гораздо большего размера для более точного приближения к нормальному распределению. Насколько большой должна быть выборка? Если исходное распределение не очень скошено, то достаточно 20–30 наблюдений Ключевым параметром оценки точности выборочного среднего является стандартная ошибка. Это мера точности выборочного среднего, она равна n , где — стандартное отклонение плотности вероятности; n — размер выборки. Например, выборочное среднее для 25 наблюдений, удовлетворяющих нормальному распределению, с 4 16 имеет стандартную ошибку 25 4 0,8 . Выборочное среднее удовлетворяет нормальному распределению со средним, равным , и стандартным отклонением, равным стандартной ошибке. Таким образом, если выборочное среднее вычислено для выборки из 25 наблюдений, то оно удовлетворяет нормальному распределению со средним, равным , и стандартным отклонением, равным 0,8. С помощью z-значений можно точнее оценить доверительный интервал и определить общую форму доверительного интервала. Точная формулировка доверительного интервала для выборочного среднего имеет следующий вид: x Z1 /2 n , x Z1 /2 n . Таким образом, для случайной выборки 25 наблюдений, удовлетворяющих нормальному распределению, с 4 доверительный интервал выборочного среднего имеет следующий вид: 4 4 , x Z1 0.5 / 2 25 25 x 1.96 0.8 , x 1.96 0.8 x 1.568 Таким образом, на 95% можно быть уверенным, что значение лежит в пределах ±1,568 единицы от выборочного среднего. С помощью такого же метода можно определить, что 99%-ный доверительный интервал лежит в пределах ±2,0608 единицы от выборочного среднего. x Z1 0.5 / 2 4. Проверка статистических гипотез Гипотеза — это утверждение или теория, которая пытается объяснить наблюдаемое явление. В статистике сначала формулируется гипотеза, затем собираются данные и выполняется проверка. Этот порядок действий имеет очень большое значение. Если сформулировать гипотезу после сбора данных, то возникает риск искаженной проверки, потому что гипотеза может быть подогнана под данные. Для исключения такого риска гипотезу следует проверить на новом наборе данных. На этом рисунке показан классический алгоритм создания и проверки теории. Проверка гипотезы включает четыре основных элемента. 1. Формулировка нулевой гипотезы H0 . 2. Формулировка альтернативной гипотезы H a . 3. Вычисление статистики теста. 4. Определение области непринятия гипотезы. 17 Наблюдение явления Формулировка гипотезы Сбор данных Анализ данных Поддерживает ли анализ данную гипотезу? нет Формулировка новой гипотезы да Выводы Нулевая гипотеза, или нуль-гипотеза (null hypothesis) H0 , представляет используемую по умолчанию или общепринятую теорию изучаемых явлений. Нулевая гипотеза считается истинной, если только нет убедительных контраргументов. Альтернативная гипотеза (alternative hypothesis) H a представляет альтернативную теорию, которая автоматически считается истинной, если отвергается нулевая гипотеза. Часто альтернативная гипотеза — это именно та гипотеза, которую нужно проверить и принять. Допустим, требуется оценить способность нового лекарства снижать кровяное давление. Нулевая гипотеза состоит в том, что данное лекарство не влияет на кровяное давление. Альтернативная гипотеза заключается в том, что лекарство влияет на кровяное давление (в положительном или отрицательном смысле). Статистика теста (test statistic) — это статистика, вычисленная после анализа данных, которые используются для принятия или непринятия нулевой гипотезы. Область непринятия гипотезы (rejection region) — это набор значений статистики теста, для которых нулевая гипотеза отвергается (или принимается). Во время проверки гипотез может возникнуть два типа ошибок. 1. 2. Ошибка первого типа заключается в отказе от нулевой гипотезы, которая на самом деле является истинной. Ошибка второго типа заключается в принятии нулевой гипотезы, тогда как на самом деле истинной является альтернативная гипотеза. Вероятность возникновения ошибки первого типа обозначается греческой буквой , а вероятность возникновения ошибки второго типа — буквой . Вообще говоря, в статистике чаще всего возникают ошибки первого типа, потому отказ от нулевой гипотезы часто приводит к некоторым фундаментальным изменениям общепринятых представлений. В примере с новым лекарством для понижения кровяного давления неправильное принятие альтернативной гипотезы может привести к тому, что неэффективное лекарство будет прописано тысячам людей. Устранение ошибок второго типа имеет особенно большое значение при планировании статистических исследований, когда во время исследования нужно обеспечить условия обнаружения разницы между гипотезами, если таковая имеется. Анализ эффективности лекарства для понижения кровяного давления нужно проводить с достаточно большой выборкой во избежание возникновения ошибки второго типа. В статистике используется предельное значение, которое называется уровнем значимости и является самым высоким допустимым значением вероятности возникновения ошибки первого 18 типа. Чаще всего для уровня значимости используется величина 0,05. Это значит, что вероятность ошибочного отказа от нулевой гипотезы не превышает 5%. Рассмотрим в качестве примера производство по сборке телевизоров. Согласно предварительным исследованиям, количество дефектных телевизоров в партии соответствует нормальному распределению со средним 50 и стандартным отклонением 15. Допустим, что на фабрике предлагается внедрить новый технологический процесс, который позволяет сократить количество дефектных телавизоров с экономией материалов. В результате внедрения нового технологического процесса оказалось, что после анализа выборки из 25 партий среднее количество дефектных телевизиров в партии равно 45. Можно ли на основании этих данных утверждать, что новый технологический процесс позволяет сократить количество дефектных резисторов или число 45 является результатом допустимого случайного отклонения, а внедренный технологический процесс ни на что не влияет? Итак, в данном примере есть две гипотезы: - нулевая гипотеза H0 : новый технологический процесс позволяет сократить - количество дефектных резисторов; альтернативная гипотеза H a : среднее количество дефектных резисторов изменилось. Эти гипотезы можно сформулировать следующим образом: - нулевая гипотеза H0 : среднее количество дефектных резисторов в новом - технологическом процессе равно 50; альтернативная гипотеза H a : среднее количество дефектных резисторов в новом технологическом процессе не равно 50. Непараметрические тесты: критерий Хи- квадрат Часто для проверки соответствия эмпирического ряда распределения нормальному закону 2 mT используют , основанный на сравнении эмпирических частот mi с теоретическими i , которые можно ожидать при принятии определенной нулевой гипотезы. Значение 2 H наблюдаемое значение критерия, полученное по результатам наблюдений, равно k (mi miT ) 2 2 H miT i 1 где k- число интервалов (после объединения), miT - теоретические частоты. Все вспомогательные расчеты, необходимые для вычисления H2 сведем в таблицу 5.1 2 Таблица 5.1 Вычисление критерия при проверке нормальности распределения H стоимости мест на рынках. Интервалы mi miT (mi miT ) 2 (mi miT ) 2 / miT 4,97-5,08 5,08-5,19 5,19-5,30 5,30-5,41 5,41-5,52 5,52-5,63 5,63-5,74 5,74-5,85 2 3 12 19 29 18 3 4 1 3 11 21 27 22 11 4 Итого 100 100 4 0,267 4 4 16 0,190 0,148 0,727 4 0,267 2 H = 1,599 Правило проверки гипотезы заключается в следующем. Определяем по таблице 2 распределения хи-квадрат критическое значение крит ( , ) для числа степеней свободы ν=k-3 и заданного уровня значимости α. Затем сравниваем 19 2 H и 2 крит ( , ). 2 ( , ) , то выдвинутая гипотеза о законе распределения не отвергается (не Если H2 ≤ крит противоречит опытным данным). 2 ( , ) , то выдвинутая гипотеза о нормальном законе распределения отвергается Если H2 > крит с вероятностью ошибки α. Для нашего примера: 2 H =1,599; α = 0,05 (число интервалов после объединения стало равным 5) 2 6,00 крит (0,05;2) 2 ( , ) , то согласно критерию Пирсона выдвинутая гипотеза о нормальном Так как H2 < крит законе распределения не отвергается. Можно сделать вывод, что распределение стоимости торговых мест на 100 рынках является нормальным. Тема 3. Дисперсионный анализ 1. Однофакторный дисперсионный анализ. Интерпретация результатов 2. Дисперсионный анализ и анализ регрессии 3. Двухфакторный дисперсионный анализ с помощью инструментов Excel 1. Однофакторный дисперсионный анализ. Интерпретация результатов Дисперсионный анализ (ANOVA) позволяет проверить гипотезу о равенстве средних для нескольких групп : y= I + , где: I -среднее i группы, - случайная ошибка, удовлетворяющая стандартному нормальному распределению . Для применения модели средних дисперсионного анализа необходимо выполнение условий: ­ ошибки нормально распределены; ­ ошибки независимы; ­ ошибки характеризуются постоянными дисперсиями. Для проверки выполнения этих предположений создаются диаграммы с отображением распределений по каждой исследуемой группе. Предположение о равенстве дисперсий ошибки выполняется, если распределения на графиках примерно одинаково. Дисперсионный анализ достаточно стабилен по отношению к предположению о нормальном распределение данных, поэтому только значительные отклонения могут вызвать проблемы при применении. Для проведения дисперсионного анализа применяется инструмент «Дисперсионный анализ» модуля Пакет Анализа. Для применения этого инструмента данные должны находиться в разных столбцах. Для проведения дисперсионного анализа в Excel необходимо выполнить: 1. Сервис, Анализ данныъх, Однофакторный дисперсионный анализ; 2. В поле «Входной интервал задайте адрес месторасположения данных (сравниваемые данные в разных столбцах); 3. В элементе «Группирование» выберите переключатель «по столбцам» или по «строкам», в зависимости от расположения данных; 4. Установите флажок «Метки в первой строке», если при указании диапазона, выделены названия переменных - Выберите переключатель «Новый рабочий лист» и дайте названия отчету о результатах анализа - Щелкните по кнопке OK Интерпретация результатов дисперсионного анализа 20 При выполнении дисперсионного анализа следует определить, какая часть изменчивости объясняется случайностью, а какая — другими факторами. Для этого сумма квадратов разбивается на две части, одна объясняется разницей между группами, а другая — случайной ошибкой. Сначала вычисляется сумма квадратов отклонений от среднего в первой группе, затем сумма по второй группе и т.д., после чего суммы по каждой группе складываются для получения общей суммы. Затем вычислим выборочное среднее для каждой i-ой группы. С помощью выборочных средних для групп можно вычислить общую сумму отклонений внутри каждой группы. Она равна сумме квадратов отклонений, где отклонение вычисляется как разница между средним для группы и значением наблюдения. Сумма квадратов отклонений называется суммой квадратов ошибок Эта сумма иногда называется внутригрупповой суммой квадратов так как в ней сумма квадратов подсчитывается отдельно внутри каждой группы. Заключительной частью дисперсионного анализа является вычисление суммы квадратов отклонений групповых средних от общего среднего. Эта величина называется- межгрупповой суммой квадратов или суммой квадратов по условиям испытаний. Все виды сумм квадратов связаны следующей формулой: Общая сумма квадратов = внутригрупповой сумме квадратов + межгрупповая сумма квадратов Если средние существенно отличаются, то межгрупповая_ сумма квадратов будет большой, а если они практически одинаковы — будет близка к нулю. И наоборот большая величина межгрупповой суммы квадратов означает существенную разницу средних, а малая величина — небольшую разницу. Большая величина межгрупповой суммы квадратов также может объясняться большим количеством групп, поэтому в таких случаях рекомендуется настроить количество групп в наборе данных, т.е. количество степеней свободы в столбце df в таблице Дисперсионный анализ. Количество степеней свободы для фактора (который в данном случае является условием разделения на группы) равняется количеству групп минус 1. А количество степеней свободы для обшей суммы квадратов равняется общему количеству наблюдений минус 1. Среднее внутригрупповой суммы квадратов также дает оценку 2 , т.е. дисперсии ошибки i, которая входит как слагаемое в модель средних. Если изменчивость для разных выборок выше изменчивости по одной выборке можно предположить, что среднее по выборкам не однородны. Для проверки этого предположения вычисляется отношение двух дисперсий. Согласно нулевой гипотезе, это значение должно удовлетворять F-распределению с п-степенями свободы межгрупповой дисперсии и т степенями свободы внутригруппой дисперсии Пример применения однофакторного дисперсионного анализа Сравним цены на гостинцы одного класса по 4 городам : Москве, Сант-Петербургу , Алматы, Астане. (Данные представлены в приложении). Таким образом, нулевая гипотеза H0 – средняя цена проживания в одноместном номере отелях одного класса одинакова в разных городах, альтернативная гипотеза H1 - средняя цена проживания в отелях одного класса неодинакова в разных городах (данные –гипотетические в условных ед) Результаты дисперсионного анализа, произведенного в Excel показаны в таблицах:. ИТОГИ Группы Счет Сумма Среднее Дисп Санкт-Пб 8 1083 135,375 1771,13 Алматы 8 1083 135,375 980,839 Москва 8 1585 198,125 1649,55 Астана 8 1211 151,375 3414,84 Дисперсионный анализ (ANOVA)) Источник вариации SS df MS F Между группами 21145,38 3 7048,458 3,607 Внутри групп 54714,5 28 1954,089 Итого 75859,88 31 P-Знач 0,02549 F крит 2,94669 Анализ таблицы « Дисперсионный анализ» показывает, что межгрупповая сумма квадратов большая, это уже говорит о том, что средние цены проживания различны по городам. Столбец MS 21 = сумме квадратов/степени свободы, т.е. эти величины можно рассматривать как дисперсии. Первое значение 7048,458 -это дисперсия цен между городами, а второе1954,089 – это дисперсия цен в одном городе. Так как изменчивость цен в разных городах выше изменчивости в одном городе, можно предположить, что средняя стоимость проживания в разных городах различна. Для проверки этого предположения сравним вычисленное отношение двух дисперсий, согласно нулевой гипотезе оно должно удовлетворять F –распределению с степенями свободы межгрупповой дисперсии ( 3 - столбец df, равно число групп -1) и степенями своды внутригрупповой дисперсии (это 28 = степени свободы для общей суммы (число наблюдений-1 =31) - 3 (степенями свободы межгрупповой дисперсии). По таблице вычисленное F=3,607. F(3,28) = 2,95. F> F(3,28), p –значение = 0,025<0,05 Таким образом, можно опровергнуть нулевую гипотезу и принять альтернативную, что средние цены проживания в отелях одного класса разные в разных городах. 2. Дисперсионный анализ как особая форма анализа регрессии Дисперсионный анализ можно представить как особую форму анализа регрессии, но с дискретными, а не с непрерывными предикторами. С помощью этой аналогии можно получить дополнительное представление о данных, но для этого нужно переформулировать модель.: y= I + Способ выражения взаимосвязи средних можно представить собой модель влияния (effects model):у = + i + , где — среднее; —влияние i-й группы; -случайная ошибка, удовлетворяющая нормальному распределению со средним 0 и дисперсией 2. Допустим, имеются данные, разбитые на четыре группы. Каждая группа содержит данные об одном объекте, поэтому согласно модели влияния у нас имеется среднее и четыре члена: а 1 , а 2 , а3 и а 4. Однако в данном случае возникает проблема перепараметризации (overparametrizet model), поскольку модель содержит пять неизвестных параметров при наличии только четырех известных средних. В результате уравнению модели влияния удовлетворяет бесконечное множество решений. Для исправления этого недостатка обычно сокращают количество параметров одним из двух способов. Первый заключается в ограничении значений членов влияния i, так, чтобы их сумма равнялась нулю. Второй состоит в задании нулевого значения для одного из членов влияния Для выполнения дисперсионного анализа с помощью анализа регрессии можно создать переменные-индикаторы для данных. Переменные-индикаторы (indicator variables) принимают значения 1 или 0 в зависимости от того, относятся данные к определенной группе или нет. Например, можно создать переменную-индикатор, которая принимает значение 1, если наблюдение относится к определенному объекту , или значение 0, если наблюдение не относится к этому объекту. Затем для построения регрессионной модели, выражающей зависимость среднего значения от индикаторных переменных, используется процедура «Регрессия» из меню Сервис, Анализ данных 3. Двухфакторный дисперсионный анализ с помощью инструментов Excel В однофакторном дисперсионном анализе сравнивается несколько групп, связанных с одной категориальной переменной или фактором. В двухфакторном дисперсионном анализе (two-way analysis of variance) сравнивается несколько групп, связанных двумя категориальными переменными. Например, агронома может заинтересовали влияние калия и азота на урожай риса, Выше рассматривалось уравнение модели средних для однофакторного дисперсионного анализа. Для двухфакторного дисперсионного анализа также можно применить аналогичное уравнение модели средних: у ijk = ij + ijk , (1) 22 где у ijk — переменная отклика; ij — среднее на i-м уровне одного фактора и на уровне другого фактора. Для каждой комбинации двух факторов может быть несколько наблюдений, которые называются повторениями (replicates). Кроме того, ijk -случайная ошибка на i-м уровне одного фактора и j-м уровне другого факторе k-го повторения, удовлетворяющая нормальному распределению со средним 2. Обычно для двухфакторного дисперсионного анализа применяется следующая модель влияния у ijk = + α I + j + ij + ijk , (2) где: у ij - переменная отклика; - общее среднее; α I –влияние i обработки; j- влияние j обработки; ij - степень взаимодействия двух факторов, т.е. степень их взаимного влияния. Например, разные средства массовой информации могут по - разному или одинаково влиять на объем продаж рекламируемого товара.. Если увеличение объема продаж не зависит от средств массовой информации, то взаимодействие факторов равно 0, в противном случае есть взаимодействие. B модуле Анализ данных программы Ехсеl предусмотрено два инструмента двухфакторного дисперсионного анализа. Один предназначен для анализа данных без повторов комбинаций факторов, а другой - с повторами. Количество повторов во всех ячейках должно быть одинаковым, данные с одинаковым количеством повторов называются сбалансированными. Для того, чтобы использовать для двухфакторного анализа инструмент модуля Анализ данных программы Ехсе1, нужно представить данные в виде двухфакторной таблицы (two-way наЫе), Т.е. данные должны быть отформатированы таким образом, что значения первого фактора располагаются по столбцам, a значения второго фактора Повторы занимают последовательно расположенные строки. Чтобы осуществить двухфакторный дисперсионный анализ с повторами, выполните перечисленные ниже действия: 1. Выберите в меню Сервис, Анализ данных процедуру Двухфакторный дисперсионный анализ с повторениями , а затем щелкните по кнопке ОК 2. В диалоговом окне «Двухфакторный дисперсионный анализ с повторениями» введите диапазон в поле «Входной интервал» 3. В поле «Число строк» вводится число повторов 4. В поле Параметры вывода укажите область вывода 5. Щелкните по кнопке ОК 23 ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ Тема 5: Применение элементов линейной алгебры в моделировании экономических процессов 1. Применение векторов и матриц в экономических исследованиях 2. Системы линейных уравнений и неравенств в описании экономических задач Элементы линейной алгебры часто используются для решения многих задач экономики. Особенно сейчас при развитии компьютерных технологий, для выполнения операции над матрицами используются функциональные возможности EXCEL. Далее рассмотрим типичные экономические задачи, использующие элементы матрицы. Задача 1. Фирма выпускает ежесуточно пять видов изделий, их основные производсьтвенные показатели приведены в таблице 1. Таблица 1. Основные производственные показатели фирмы Показатели Р1 2к 2 12 2 План производства, ед Расход сырья, кг Норма времени изготовления, час/изд Цена одного изделия, тыс. тг Р2 4к 4 5 3 Изделие Р3 1к 8 7 7 Р4 3к 3 18 5 Р5 5к 7 6 6 Требуется определить следующие ежесуточные показатели фирмы: расход сырья, трудовые затраты и стоимость выпускаемой продукции фирмы. Решение рассмотрим при к=0. По данным таблицы 1 составим четыре вектора, которые состоят из пяти компонентов, характеризующих весь производственный цикл: план производства - П=(20, 40, 10, 30, 50); расход сырья Р=(2, 4, 8, 3, 7); норма времени – Т= (12, 5, 7, 18, 6); цена изделия – Ц=(2, 3, 7, 5, 6). Если расход сырья на одно изделие по видам Р известен, то соответственно умножая на их количество П, получим ежесуточный расход сырья фирмы S. Тогда S представляет скалярное произведение векторов Р и П, т.е. S=(Р*П)= (2,4,8,3,7)*(20,40,10,30,50)=(2*20+4*40+8*10+3*30+7*50)= (40+160+80+90+350)=720 кг. При выполнении операции над матрицами в EXCEL необходимо соблюдать следующий порядок выполнений команд: выделение области ячеек, где будет записан ответ; операции начинаются со знака «=», даже при вводе формул; вводимые данные, т.е. матрицы, с которыми производятся операции, выделяются как блок (диапозон) ячеек; операции сложения, вычитания, умножения матрицы на число производятся с помощью аналогичных команд с клавиатуры или мыши, а остальные – умножение матрицы, транспонирование, обращение и т.д. - с помощью матричных функций; заканчивать ввод нужно не нажатием клавиши «Enter», а комбинацией клавиш «Shift+Ctrl+Enter». Для правильного ввода данной команды необходимо при нажатых клавишах «Shift+Ctrl» нажать и отпустить клавишу «Enter». Сложение матриц. При сложении матриц вводятся две матрицы, выделяется блок ячеек под ответ и вводится команда, например: «=A2:B4+D2:E4», затем одновременно нажимаем «Shift+Ctrl+Enter». Пример показан на рисунке 1. 24 Рисунок 1- Сложение матриц Вычитание матриц. При вычитании матриц вводятся две матрицы, выделяется блок ячеек под ответ и вводится команда, например: «=A2:В4-D2:E4» затем одновременно нажимаем «Shift+Ctrl+Enter». Пример показан на рисунке 2. Рисунок 2- Вычитание матриц Умножение матрицы на число. При умножении матрицы на число также выделяется блок ячеек под ответ и вводится команда умножения на число, которая заканчивается нажатием «Shift+Ctrl+Enter». Например: «=3*(А2:В4)» и «Shift+Ctrl+Enter». Пример показан на рисунке 3. Рисунок 3- Умножение матрицы на число 25 Умножение матрицы на матрицу. В данном случае используется матричная функция МУМНОЖ (MMULT). Порядок действий следующий: вводится данные в виде матриц, выделяется область ячеек под ответ с числом строк, как у первой матрицы, и числом столбцов, как у матрицы 2. Вызывается функция МУМНОЖ (Мастер функции, категория Все). В поле Массив 1 вводятся данные первой матрицы, в поле Массив 2 – данные матрицы 2. Затем нажимает команду «Shift+Ctrl+Enter». Транспонирование матрицы. Для выполнения этой операции имеется функция ТРАНСП (MTRANS). Ввод нужно заканчивать также командой «Shift+Ctrl+Enter». Пример. Чтобы умножить матрицу А на матрицу В, нужно матрицу В транспонировать, чтобы количество столбцов матрицы А было равно количеству строк матрицы В. затем их переумножаем. В результате получим матрицу с размером (2х2). Транспонируем матрицу В (рисунки 4 и 5) Рисунок 4. Выполнение функции ТРАНСП Рисунок 5. - Транспонированная матрица В После этого умножаем матрицу А на ВТ получим матрицу А*В размерностью (2х2) (рисунки 6 и 7). 26 Рисунок 6 - Выполнение операции МУМНОЖ Рисунок 7 - Умножение матриц 6. Обратная матрица. Это операция выполняется с помощью функции МОБР(MINVERSE). Ввод нужно заканчивать также командой «Shift+Ctrl+Enter». Пример показан на рисунках 8 и 9. 27 Рисунок 8- Выполнение операции МОБР Рисунок 9. - Обратная матрица А Редактирование матричных формул. Поскольку матричные формулы действуют на все ячейки матрицы, то изменять часть матрицы нельзя. При таких случаях выводится сообщение: «Нельзя изменять часть массива». Чтобы выполнить операцию по изменению части массива необходимо активизировать любую ячейку в матрице и шелкнуть мышью в строке формул. При этом пропадут фигурные скобки. После этого выполняется редактирование, которое нужно закончить комбинацией клавиш «Shift+Ctrl+Enter». Тема 5 : Модели линейной оптимизации 1.Постановка задачи линейного программирования в общем виде Каноническая и стандартная формы записи задачи линейного программирования 2.Примеры постановок задач линейного программирования. Распределение ресурсов. Задача о пищевом рационе. Ассортимент продукции. Этапы решения. 3.Геометрическая интерпретация задачи линейного программирования изображение системы ограничений. Постановка задачи линейного программирования (ЗЛП) В задаче ЛП целевая функция представляет собой линейную форму вида 28 F= С1Х1 + С2Х2 +... + СпХп, (3.1) а система ограничений на переменные - систему линейных уравнений и неравенств а11 х1 а12 х 2 ... а1п в1 а 21 х1 а 22 х 2 ... .... а m1 х1 а m 2 х 2 ... а 2 п в 2 .... ... ... а mп в m (3.2) xj>=0 (j=1,2,...,n) (3.3) Каждое решение системы (3.2)-(3.3) представляет собой совокупность значений переменных Х1, Х2,...,Хn, удовлетворяющих всем неравенствам системы. Эту совокупность можно рассматривать как точку или вектор в n -мерном векторном пространстве. Задача линейного программирования может быть представлена: 1) в векторном виде F=CX, A1X1+A2X2+...+AnXn= В , X>=0, где С = (с1, с2,..., сn); X = (х1, х2,..., хn); CX— скалярное произведение; векторы а11 а12 а1п в1 а 21 а 22 а 2п в2 А1 , , …, , А2 Ап В ... ... ... ... а m1 аm2 а mп вm состоят соответственно из коэффициентов при неизвестных и свободных членах; 2) в матричном виде F = СХ, АХ = В, Х>=0. 3) с помощью знаков суммирования F= сj xj i = 1.m, j J a x j J ij j =bi j = 1.п , хj >= 0. Существующие методы решения задач линейного программирования (ЗЛП) во многом определяются видами ограничений. В связи с этим различают задачи линейного программирования в общем виде, в канонической и стандартной (симметрической) формах: 1) в общем виде F= сj xj min (max) j J при условиях: >= j J aij xj { = } bi 2) в канонической форме F= при условиях: i=1.m, <= xj>=0 сj xj j J aij xj =bi j=1.n, min (max) i = 1.m, j J xj>=0 j =1.n 3) в стандартной (симметрической) форме 29 F(min(max)) = j J при условиях: сj xj aij xj >= bi , j J aij xj <= bi , i =1.m, j J xj >=0 , j= 1.n Все три формы задач ЛП эквивалентны и легко переводятся из одной в другую. Для перехода от общей или стандартной формы к канонической нужно в каждое ограничение-неравенство ввести свою дополнительную переменную с коэффициентом (+1), если неравенство типа «<=», и с коэффициентом (-1), если неравенство типа «>=». Дополнительные переменные должны удовлетворить условию неотрицательности и входить в целевую функцию с нулевыми коэффициентами. Введем некоторые определения. Определение 1. Совокупность значений переменных Х = (х1, х2, . . . хп), удовлетворяющих всем неравенствам системы (3.2) называется решением. Определение 2 Решение Х = (х1, х2, ... хп), удовлетворяющее условиям неотрицательности (3.3) называется допустимым решением ЗЛП. Определение 3. Допустимое решение Х = (х1, х2, ... хп) называется опорным (базисным), если векторы Аi входящие в разложение А1X1+A2X2+ ... + AnXn = В c положительными коэффициентами Хj, являются линейно независимыми. Векторы Аi являются m - мерными, а из определения опорного плана следует, что число его положительных компонент не может превышать m. Определение 4. Оптимальным решением задачи ЛП (3.1)-(3.3) называется допустимое решение, обеспечивающее экстремальное значение линейной функции. Геометрическая интерпретация задачи ЛП Рассмотрим задачу ЛП, система ограничений которой задана в виде неравенств: F = с1х1 + с2х2 + . . . + сnхn (3. 4) а11 х1 а12 х 2 а 21 х1 а 22 х 2 ... .... а m1 х1 а m 2 х 2 ... а1п в1 ... а 2 п в 2 .... ... ... а mп в m (3.5) xj>=0 (j=1,2,...,n) (3.6) Совокупность чисел х1, х2, . . . хп, удовлетворяющих ограничениям (3.5) и (3.6), называется решением. Если система неравенств (3.5) при условии (3.6) имеет хотя бы одно решение, она называется совместной, в противном случае - несовместной. Рассмотрим на плоскости х1ох2 совместную систему линейных неравенств: а11 х1 а12 х 2 в1 а 21 х1 а 22 х 2 в 2 (3,7) .... .... а m1 х1 а m 2 х 2 в m x1 >= 0, x2 >=0 (3.8) Это все равно, что в системе (3.4) - (3.6) положить п=2. Каждое неравенство этой системы геометрически определяет полуплоскость с граничной прямой аi1x1+аi2x2=bi ( i=1, 2, ... m). Условия неотрицательности определяют полуплоскости соответственно с граничными прямыми х1 30 =0, х2=0. Система совместна, поэтому полуплоскости как выпуклые множества, пересекаясь, образуют общую часть, которая является выпуклым множеством и представляет собой совокупность точек, координаты каждой из которых являются решением данной системы. Совокупность этих точек (решений) будем называть многоугольником решений. Он может быть точкой, отрезком, лучом, многоугольником, неограниченной многоугольной областью. Если в системе ограничений п=3, то каждое неравенство геометрически представляет полупространство трехмерного пространства, граничная плоскость которого аi1x1+аi2x2+аi3x3=bi (i=1,2,...m), а условия неотрицательности - полупространства с граничными плоскостями соответственно хj =0, (j=1,2,...,n). Если система ограничений совместна, то эти полупространства, как выпуклые множества, пересекаясь, образуют в трехмерном пространстве общую часть, которая называется многогранником решений. Многогранник решений может быть точкой, отрезком, лучом, многогранником, многогранной неограниченной областью. Пусть в системе ограничений п>3; тогда каждое неравенство определяет полупространство пмерного пространства с граничной гиперплоскостью аi1x1 + аi2x2 + ... + аinxn = bi, (i=1,2, ... m), а условия неотрицательности - полупространства с граничными гиперплоскостями хj =0, (j=1,2,...,n). Если система ограничений совместна, то по аналогии с трехмерным пространством она образует общую часть п - мерного пространства, называемую многогранником решений, так как координаты каждой его точки являются решением. Таким образом, геометрически задача ЛП представляет собой отыскание такой точки многогранника решений, координаты которой доставляют линейной функции экстремальное значение, причем допустимыми решениями являются все точки многогранника решений. Как известно, множество решений линейных неравенств представляет собой выпуклый многогранник в п-мерном пространстве (при п=2 множество решений системы образует выпуклый многоугольник). Этот многоугольник образует область допустимых решений (область свободы решений) задачи ЛП, которая содержит все возможные решения данной задачи. Необходимо выбрать из них оптимальное, т.е. то, которое минимизирует (максимизирует) линейную форму. Разумеется, решить эту задачу простым перебором всех точек области допустимых решений практически невозможно. Выбор оптимального решения существенно облегчают теоремы. Теорема 1. Множество всех планов ЗЛП выпукло. Теорема 2. Целевая функция задачи ЛП может достигать экстремального значения только в угловой точке области допустимых решений. Таким образом, для нахождения оптимального решения задачи ЛП нет необходимости перебирать все допустимые решения, а достаточно ограничиться перебором лишь конечного числа возможных решений угловых точек многоугольника. Однако при больших значениях m и п затруднительно также исследование всех угловых точек. Для этой цели разработаны специальные вычислительные методы. Оптимальная смесь (задача о пищевом рационе) Большой и важный класс линейной оптимизации составляют так называемые задачи о смесях. Такие задачи возникают при выборе способа смешения заданных ингредиентов для получения смеси с определенными свойствами. Смесь должна содержать требуемое количество компонентов, входящих в состав исходных ингредиентов. Стоимость ингредиентов известна. Обычно требуется получить смесь с наименьшими затратами. Задачи такого типа встречаются во многих отраслях промышленности. За неизвестные управляемые переменные в модели оптимального смешения принимаются количества или доли ингредиентов, необходимые для приготовления смеси. Простейшая модель оптимального смешения имеет вид: составить смесь минимальной стоимости. F= c1x1 + c2x2 + ... + cnxn , компоненты которой удовлетворяют заданным условиям ai1x1 + ai2x2 + ... + ainxn <= bi, i= 1, 2, ... m где n - число исходных ингредиентов; m - число компонентов смеси; xj -количество j -го ингредиента, входящего в смесь; cj - стоимость единицы j -го ингредиента; aij - удельный вес i- 31 го компонента в j-м ингредиенте; bi -максимально (или минимально) допустимое количество i-го компонента в смеси; F - целевая функция, определяющая стоимость затрат. В качестве примера рассмотрим задачу о пищевом рационе. Допустим, что пищевой рацион составляется из набора продуктов питания Р1, Р2,..., Рn стоимостью с1, с2,...,сn за 1 кг соответственно. Пусть 1 кг продукта каждого вида содержит аi1 г белка, аi2 г жиров, аi3 г углеводов, аi4 микроэлементов, аi5 г витамина С, а также обладает энергетической ценностью аi6 килокалорий (i=1,2,...,m). Необходимо закупить такое количество продуктов, чтобы их стоимость была минимальна и составленный из них рацион в расчете на одного человека содержал не менее в1 г белков, не менее в2 г жиров, не менее в3 г углеводов, не менее в4 г микроэлементов, не менее в5 г витамина С и не более в6 килокалорий. Перечисленные выше условия удобно записать в виде таблицы 1 Отметим, что отдельный элемент может не входить в состав какого-либо продукта и тогда соответствующее значение аij =0. Запишем словесно сформулированную проблему в виде математической модели, т.е. составим соответствующие математические соотношения. Обозначим необходимое для одной порции покупаемое количество продуктов Р1, Р2, ... , Рn, в килограммах через Х = (х1, х2, ..., хn). Это управляемые переменные, которые надо выбрать таким образом, чтобы стоимость продуктов была минимальна. Стоимость продуктов будет F(X)= c1x1 + c2x2 +... + cnxn Таблица 1 (4.1) Параметры задачи об оптимальной смеси Продукты Р1 Р2 ... Рi ... РN Содержание в рационе (ккал/кг) а11 а21 ... аi1 ... аn1 b1 Элементы (г/кг) и энергетическая ценность белки жиры углев. микр.элемент витам. С ккал/кг а12 а13 а14 а15 а22 а23 а24 а25 ... ... ... ... аi2 аi3 аi4 аi5 ... ... ... ... аn2 аn3 аn4 аn5 b2 b3 b4 b5 Стои-мость а16 а26 ... аi6 ... аn6 c1 c2 ... ci ... cn <= b6 Рацион (согласно условию) должен содержать не менее в1 г белка, Суммарное количество белка, содержащееся в купленных продуктах, равно a11x1 + a21x2 + ... + an1xn >= b1 (4.2) Аналогично записываются ограничения для ряда остальных параметров, определяющих рацион жиры (i=2), углеводы (i=3), микроэлементы (i=4), и витамин С (i=5): a1jx1 + a2jx2 + ... + anjxn >= bj, i = 2,3,4,5 (4.3) Для выполнения требования по количеству килокалорий (i=6) соответствующее ограничение, имеющее вид a16x1 + a26x2 + ... + an6xn <= b6 в одной порции запишем (4.4) Условия (4.1)-(4.4) представляют собой систему ограничений - систему линейных неравенств, которой должно удовлетворять решение х1, х2,..., хn. В этой задаче помимо ограничений (4.1)-(4.4) возникают так называемые естественные ограничения, состоящие в том, что управляемые переменные (количество хi) должны быть неотрицательны: хj>=0, j = 1, 2, ... , n (4.5) В итоге получаем линейную модель задачи о пищевом рационе: 32 определить количество продуктов Х = (х1, х2, ... , хn), стоимость - линейная целевая функция (4.1) которых минимальна, F(X) min , при условии, что сами переменные х i удовлетворяют линейным неравенствам (4.2-4.5). Поставленная задача является типичной задачей линейного программирования. 4.2 Распределение ресурсов Допустим, для производства продукции Р1, Р2, ... , Рn, используются некоторые ресурсы (сырье, оборудование, финансы, рабочая сила) R1, R2, ..., Rm в количествах в1, в2, ... , вm. Стоимость единицы ресурса равна d1, d2, ... , dm тенге. Производство продукции Рj ограничено спросом, который оценивается в количестве Sj штук (j=1,2,.. n). Единица продукции Рi может быть продана по цене сj и для ее производства необходимо аij единиц ресурса Ri (i=1,2,..., m). В этой ситуации возникает естественный вопрос: какое количество продукции необходимо выпустить, чтобы получить максимальную прибыль при ее реализации? Для удобства запишем сформулированные условия в виде таблицы 2. Если i-й ресурс не используется для изготовления продукции Рj, то аij =0. Опишем данную ситуацию в виде математической модели. Обозначим через Х=(х1, х2,...,хn) количество единиц (управляемые переменные) выпускаемой продукции Р1, Р2,..., Рn, которое следует подобрать так, чтобы прибыль от реализации продукции была максимальна. Таблица 2 Параметры задачи о распределении ресурсов Ресурсы P1 P2 ... Pi ... Pm Количество ресурса Стоимость ресурса а21 а22 ... а2i ... а2m ... ... ... ... ... ... Ресурсы ... Rn аj1 аj2 ... аji ... аjn b1 b2 ... bj ... bm d1 d2 ... dj ... dm R1 а11 а12 ... а1i ... а1n R2 ... Rj ... ... ... ... ... ... аm1 аm2 ... аmi ... аnm Стоимость c1 c2 ... ci ... cn Спрос S1 S2 ... Si ... Sn Ясно, что не надо выпускать продукции больше, чем диктуется спросом, т.е. х1<=S1, х2<=S2, ... хn<=Sn, (4.6) Далее, например, количество ресурса R1, израсходованного на производство всех рассматриваемых видов продукции Р1, Р2, ... ,Рn, будет равно а11х1 + а12х2 + а13х3 + ... + а1nхn Учитывая, что количество ресурса R1 равно b1, получим ограничение, определяющее расход ресурса R1. а11х1 + а12х2 + а13х3 + ... + а1nхn <=b1 (4.7) Аналогично записываются ограничения, определяющие фактический расход любого из ресурсов Rj, т.е. аi1х1 + аi2х2 + аi3х3 + ... + аinхn <=bi , i=1,2, ... , m. (4.8) Таким образом, учет ограниченности ресурсов приводит к системе линейных неравенств для переменных х1, х2,...,хn. которую можно записать в более компактной форме n j=1 aij xj <= bi , i=1,2, ... , m. 33 (4.9) Очевидно, что количество единиц производимой продукции не может быть отрицательным числом, поэтому систему ограничений (4.6) и (4.9) необходимо дополнить естественными ограничениями х1>=0, х2>=0, ... хn>=0 (4.10) Найдем зависимость прибыли f от объема выпускаемой продукции Х. Прибыль F(X), получаемая от реализации продукции, определяется разностью между ценой произведенной продукции и ее себестоимостью. Цена произведенной продукции равна сjxj, ее себестоимость, зависящая от расхода и стоимости использованных ресурсов, имеет вид di aijxj (внутренняя сумма определяет объем использованного ресурса Ri) Поэтому прибыль F(X) от реализации всей продукции Х есть n F(X) = j=1 m сjxj - n i=1 di aijxj = j=1 n j=1 m ( cj - i=1 aij di)xj (4.11) где aij di имеет смысл себестоимости единицы продукции Рi. В итоге получаем математическую форму записи рассматриваемой задачи о распределении ресурсов: определить количество выпускаемой продукции х1, х2,...,хn которое удовлетворяет линейным неравенствам (4.6), (4.9)и (4.10) и обеспечивает максимум прибыли - линейной целевой функции (4.11) F(X) max. Тема 6 Методы решения задачи ЛП 1.Графический метод решения задачи ЛП. 2. Построение симплексной таблицы. Нахождение оптимального решения. 3.Анализ полученного решения. 4. Симплекс метод с искусственным базисом 5. Пакет Поиск решения Excel– инструмент для решения ЗЛП. 6.Экономическая интерпретация результатов Графический метод решения задачи ЛП Графический метод основан на геометрической интерпретации задачи ЛП и применяется в основном при решении задач двумерного пространства, так как довольно трудно построить многогранник решений, который образуется в результате пересечения полупространств. Задачу пространства размерности больше трех изобразить графически вообще невозможно. Пусть задача ЛП задана в двумерном пространстве, т.е. ограничения содержат две переменные. Найти минимальное значение функции F = С1Х1 + С2Х2 (3.9) при а11 х1 а12 х 2 в1 а 21 х1 а 22 х 2 в 2 .... .... а m1 х1 а m 2 х 2 в m (3.10) x1 >= 0, x2 >=0 (3.11) Допустим, что система при условии совместна и ее многоугольник решений ограничен. Каждое из неравенств (3.9)-(3.11), как отмечалось выше, определяет полуплоскость с граничной прямой; аi1x1 + аi2x2=bi, (i=1.m), х1=0, х2=0 Линейная функция (2.28) при фиксированных значениях F является уравнением прямой линии: С1Х1 + С2Х2 = соnst. Построим многоугольник решений системы ограничений (3.10) и 34 график линейной функции (3.9) при F=0 (рис.3.1). Тогда поставленной задаче ЛП можно дать следующую интерпретацию. Найти точку многоугольника решений, в которой прямая С1Х1 + С2Х2= соnst. является опорной и функция F при этом достигает минимума. Значения F=С1Х1 + С2Х2 возрастают в направлении вектора N=(C1, C2), поэтому прямую F=0 передвигаем параллельно самой себе в направлении вектора N. Из рисунка 3.1 следует, что прямая дважды становится опорной по отношению к многоугольнику решений в точках А и С), причем минимальное значение принимает в точке А. Координаты точки А(х1;х2) находим, решая систему уравнений прямых АВ и АЕ. Если многоугольник решений представляет собой неограниченную многоугольную область, возможны два случая. Случай 1. Прямая С1х1+С2х2 = соnst, передвигаясь в направлении вектора N или противоположно ему, постоянно пересекает многоугольник решений и ни в какой точке не является опорной к нему. В этом случае линейная функция не ограничена на многоугольнике решений как сверху, так и снизу (рис. 3.2). Рис. 3.1 Рис. 3.2 Случай 2. Прямая, передвигаясь, все же становится опорной относительно многоугольника решений (рис. 3.3) Тогда в зависимости от вида области линейная функция может быть ограниченной сверху и неограниченной снизу (рис. 3.3а), ограниченной снизу и неограниченной сверху (рис. 3.3б) либо ограниченной как снизу, так и сверху (рис. 3.3 в). а) б) в) Рис. 3.3 Итак, нахождение решения ЗЛП на основе ее геометрической интерпретации включает следующие этапы: 1) Строят прямые, уравнения, которых получаются в результате замены в ограничениях знаков неравенств на знаки точных равенств. 2) Находят полуплоскости, определяемые каждым из ограничений задачи. 3) Находят многоугольник решений. 4) Строят вектор С=(с1;с2). 5) Строят прямую с1х1+с2х2=к, проходящую через многоугольник решений 6) Передвигают прямую с1х1+с2х2=к в направлении вектора С, в результате чего либо находят точку (точки), в которой целевая функция принимает максимальное значение, либо устанавливают неограниченность сверху функции на множестве планов. 35 7) Определяют координаты точки максимума функции и вычисляют значение целевой функции в этой точке. Графический метод на примере. Решим графическим методом задачу линейного программирования. Задача. Найти минимальное значение линейной функции F=4x1+6x2 min при ограничениях 3х1+х2 9, x1+2x2 8, x1+6x2 12, x1 0, x2 0 Решение. Построим многоугольник решений (рис. 3.4). Для этого в системе координат х 1Ох2 на плоскости изобразим граничные прямые 3х1+х2=9 (L1); x1+2x2=8, (L2); x1 0, x2 0 x1+6x2=12 (L3); Построим прямую, соответствующую уравнению L1. Координаты любой точки прямой L1 удовлетворяют ее уравнению. Прямая разделяет плоскость на две полуплоскости. Если от прямой отступить в одну из плоскостей, то координаты любой точки удовлетворять уравнению не будут. Чтобы установить какой полуплоскости соответствует неравенство надо подставить в него координаты произвольной точки. Удобнее всего использовать начало координат (х1 и х2). 3*0 + 0 - 9 < 0 Следовательно, полуплоскость, содержащая начало координат, соответствует неравенству 3х1+х2 <9, а вторая полуплоскость неравенству 3х1+х2 > 9. Координаты любой точки полуплоскости являются решением соответствующего неравенства, а вся полуплоскость областью его решений. Отметим, что для нестрогого неравенства (>=, <=), в область решения включается и прямая линия. Построим на одном чертеже области решений всех четырех неравенств системы и заштрихуем их общую часть (рис. 3.5). Она представляет собой неограниченный сверху многоугольник. В область решений находятся точки, координаты которых удовлетворяют всем неравенствам системы. Из всех точек области решений надо выбрать такую, где значение целевой функции принимает максимальные значения. Причем значение целевой функции F=0. Получим 4х1+6х2=0. Геометрическим образом этого уравнения является прямая, проходящая через начало координат. При F=1 уравнение будет 4х1+6х2=1 и соответствующая прямая сдвинется от начало координат, но останется параллельна первоначальной прямой. При F=3 прямая отодвинется еще дальше и т.д. Таким образом целевой функции F= 4х1+6х2 геометрически соответствует семейство параллельных прямых с разными значениями F. При движении в одну сторону целевая функция увеличивается, в другую уменьшается. Построим вектор N = (4;6) и прямую 4х1+6х2=0 (F). Перемещаем прямую F параллельно самой себе в направлении вектора N. Из рис. 3.5 следует, что она впервые коснется многогранника решений и станет опорной по отношению к нему в угловой точке B; если прямую перемещать далее в направлении вектора N, то значения линейной функции на многограннике решений возрастут, значит, в точке B линейная функция принимает минимальное значение. Точка B лежит на пересечении прямых L1 и L2; для определения еѐ координат решим систему уравнений 3х1+х2=9, х1+2х2=8. Имеем: х1=2; х2=3. Подставляя найденные значения в линейную функцию, получаем Zmin=4 · 2+6 · 3=8+18=26. Анализ модели на чувствительность Пример. Коммерческому отделу поручили проанализировать совместную деятельность подразделений фирмы по изготовлению и продаже двух видов продукции, которая поступила в продажу по цене 3 тыс.тг и 2 тыс.тг. Для производства продукции используют два вида сырья А и 36 В, максимально возможные суточные запасы которых составили 6 т и 8 т. Расходы сырья на производство 1 т. продукции приведены в табл. 1 Изучение конъюнктуры спроса на рынке сбыта показало, что суточный спрос на вторую продукцию никогда не превышал спрос на первую более чем на 1,5 т, а спрос на вторую продукцию никогда не превышал 2 т в сутки. Какое количество продукции каждого вида необходимо производить фирме, чтобы доход от ее реализации был максимальным? Таблица 1 Сырье А В Цена 1 т, тыс.тг Расход сырья на ед. продукции продукция х1 продукция х2 1 2 2 1 2 3 Запасы сырья, т 6 8 Построение экономико-математической модели задачи. Поскольку в задаче необходимо определить объемы производства для продажи продукции, то введем обозначения переменных задач: суточные объемы производства первой продукции х1 и вторую х2 тонн соответственно. Критерием, по которому определяется степень достижения поставленной цели, является доход F от реализации продукции, который должен быть максимально возможным. Следовательно, целевая функция будет иметь вид: F(X) = (2х1 +3х2) mах. Решение любой практической задачи осуществляется в рамках ограниченных ресурсов. В данном случае необходимо учесть ограничения на расход сырья, запасы которого на фабрике не бесконечны, а также ограничения на спрос продукции. Математически эти ограничения можно записать следующим образом: х1 +2х2 <=6 запасы сырья А, 2х1 + х2 <= 8 запасы сырья В, х2 – х1<=1.5 соотношение спроса на продукции, х2<=2 Кроме того, известно, что план фирмы предусматривает обязательный выпуск продукции указанных видов, производство которых за всю историю не опускалось ниже, чем х 1>=0.25 т и х2 >= 0,5 т. Таким образом, в целом экономико-математическую модель задачи можно представить в таком виде. Определить суточные объемы производства продукции х 1 и х2 обеспечивающие заданными условиями- ограничениями: х1 +2х2 <=6 2х1 + х2 <= 8 х2 – х1<=1,5 х2 <= 2 х1>=0,25 х2 >= 0,5 Максимально возможный доход от продажи продукции в соответствии с целевой функцией F(X) = (2х1 +3х2) mах Полученная модель является задачей линейного программирования, так как все входящие в нее функции линейны. Решение данной задачи возможно с использованием геометрического метода. Решение. Построим на плоскости Х1ОХ2 многоугольник допустимых решений задачи. Для этого в неравенствах системы ограничений знаки неравенств заменим на знаки точных равенств: Х1 + 2х2 <= 6 2х1 + х2 <= 8 х2 – х1<=1,5 х1>=0,25 х2 >= 0,5 F(X) = (2х1 +3х2) х1 + 2х2 = 6 2х1 + х2= 8 х2 – х1 =1,5 х1 =0,25 х2 = 0,5 F(X) = (2х1 +3х2) = 0 37 Построив полученные граничные прямые, найдем соответствующие полуплоскости допустимых значений переменных и их пересечение (рис. 3.6). Направление стрелок от каждой граничной прямой определяется путем непосредственной подстановки в неравенство координат произвольно взятой точки, например (1;1), и при удовлетворении данного неравенства направляем стрелки в сторону контрольной точки, в противном случае - наоборот. Полученное пространство решений есть многоугольник АВNДЕK. Угловые точки многоугольника решений имеют следующие координаты: А(0,25;0,5), В(0,25; 1,75), N(0,5;2), Д(2,2), Е(3,3;1,3), K(3,75;0,5). Для нахождения минимума и максимума целевой функции строим начальную прямую и вектор ОС с С(2;3). Координатами вектора является ОС является коэффициенты целевой функции при переменных. Для построения графика функции задаем произвольное значение F(Х). Если F = 0, то прямая проходит через начало координат и перпендикулярна вектору ОС. Построенную прямую F=0 перемещаем параллельно самой себе в направлении и противоположном направлении вектора ОС до тех пор, пока она не коснется последней крайней (угловой) точки многоугольника решений. Координаты указанной точки является точкой максимума или минимума. Рис. 3.6 По графику точкой минимума является точка А с координатами х1=0,25 и х2=0,5. Затем определяем минимальное значение F(А)min = 2 *0.25 + 3* 0,5 = 2. Максимальное значение F(Х) будет в точке Е. Так как точка Е получена в результате пересечения прямых (1) и (2), то для определения ее координат решим систему уравнений: х1+ 2х2=6 2х1 + х2 = 8 х1=3,3 х2= 1,3 Тогда максимальное значение Fmax(Е)= 2* 3,3 + 3* 1,3= 10,7 Таким образом, суточной объем производства первой продукции должен быть равен 3,3 т, а второй - 1,3 т. Доход от продажи в этом случае будет максимальным и составит 10,7 тыс.тг. В условиях рынка следует предусмотреть динамический характер условий производства и продажи продукции. Например, важно знать, как повлияет на оптимальное решение увеличение или уменьшение спроса, изменение рыночных цен или запасов исходного сырья. Следовательно, после определения оптимального решения с целью учета фактической картины необходимо 38 провести анализ модели на чувствительность, позволяющий определить зоны устойчивого функционирования предприятия на рынке сбыта продукции. Анализ изменений запасов ресурсов. Рассмотрим как влияет на оптимальное решение изменение запасов ресурсов А и В. Возможны два варианта постановки этой задачи. а) насколько можно увеличить запас некоторого ресурса А и В для улучшения полученного оптимального значения дохода от продажи продукции; б) насколько можно уменьшить запас некоторого ресурса А и В при сохранении полученного оптимального значения дохода от продажи? Эти задачи называют анализом модели на чувствительность к правой части (ограничений), так как величина запаса каждого ресурса записывается именно в правой части условий-ограничений. Ограничения линейной модели делятся на связывающие (активные) и не связывающие (неактивные). Ресурс, соответствующий связывающему ограничению, являются дефицитным ресурсом, так как он используется полностью. Ресурс же, соответствующий не связывающему ограничению, является недефицитным ресурсом, так как он имеется в избытке. Поэтому при анализе модели на чувствительность к правым частям ограничений определяют: предельно допустимое увеличение запаса дефицитного ресурса, позволяющее улучшить найденное оптимальное решение; предельно допустимое уменьшение запаса недефицитного ресурса, не изменяющее найденное ранее оптимальное решение. Это особенно важно, если остатки недефицитного ресурса можно использовать для других целей. В рассматриваемой задаче используемые запасы сырья А и В являются дефицитными ресурсами, поэтому последовательно рассмотрим сначала увеличение запасов сырья (ресурса) А. а) На рисунке 3.7 видно, что при увеличении запаса этого ресурса прямая (1) перемещается вверх параллельно самой себе, при этом треугольник ДМЕ постепенно стягивается в точку М(3;2). В этом случае областью допустимых решений становится многоугольник АВNМК, а оптимальному решению соответствует точка М, а ограничения (2) и (4) становится связывающими. Рис. 3.7. Изменение области допустимых решений от величины запасов ресурса А. В точке М ограничение (1) становится избыточным, поскольку любое дальнейшее увеличение запаса ресурса А не влияет ни на область допустимых решений, ни на оптимальное решение. Именно в этом и состоит отличие недефицитности ресурса от его избыточности: исключение избыточности ограничения не изменяет ни области допустимых решений, ни самого оптимального решения, в то время как исключение исходного ограничения, соответствующего дефицитному ресурсу, всегда изменяет область допустимых решений, но не всегда - оптимальное решение. Таким образом, объем сырья А нет необходимости увеличивать сверх того предельного значения, при котором соответствующее ему ограничение (1) станет избыточным, где прямая (1) пройдет через точку М, что и указывает на новое оптимальное решение. Этот предельный уровень можно найти следующим образом. Сначала определяются координаты точки М, являющейся точкой пересечения прямых (2) и (4), которая находится из решения системы уравнений: 39 2х1 +х2 = 8 х2 = 2 Затем путем подстановки координат М(3;2) в левую часть ограничения (1) определяется максимально допустимый запас ресурса А. Следовательно, разумно увеличить запас сырья А на 0,5 т, при этом новое оптимальное значение целевой функции будет равно: Fmax(M) = 2*3 + 3*2 = 12 тыс. тг. б) Аналогично решается задача о целесообразности увеличения запасов дефицитного ресурса (сырья ) В в соответствующем ограничении (2) (рис. 3.8) Новым оптимальным решением становится точка L, где пересекаются прямые (1) и (6), т.е. и Х1 + 2х2 = 6 х2 = 0,5. Ри 3.8 Изменение области допустимых решений от величины запасов ресурсов В Очевидно, ее координаты х1 =5, и х2 = 0,5. Причем запас сырья В можно увеличить до значения, равного 2х1 + х2 = 10+0,5 = 10,5 т, т.е. на 2,5 т, тогда новое оптимальное значение целевой функции будет равно: Fmax(L) = 2*5 + 3*0,5 = 11,5 тыс.тг. в) Ограничение (3) –х1+х2<=1.5 представляет соотношение между суточным спросом на вторую и первую продукцию. В этом случае правую часть ограничения также можно уменьшить до тех пор, пока прямая ВN (3) не достигнет точки Е (рис. 3.9) Рис. 3.9 Изменение области допустимых решений от изменения соотношения спроса на продукцию При этом правая часть ограничения (3) станет равной -х1+х2=-3,3+1,3=-2 т, 40 а само решение (3) может быть записано в виде: -х1+ х2 <= -2 или х1 – х2 >= 2 Полученный результат показывает, что если суточный спрос на первую продукцию будет превышать суточный спрос на вторую не менее чем на 2 т, ранее полученное оптимальное решение также не изменится. г) Рассмотрим теперь решение задачи о возможности снижения запасов недефицитных ресурсов (т.е. об уменьшении правой части не связывающих ограничений, рис. 3.10). Ограничение (4) х2<=2 задает уровень спроса на вторую продукцию. На рис. 3.10 видно, что прямую NД (4) можно опускать параллельно вниз до пересечения с точкой Е, не изменяя оптимального решения. Таким образом, при уменьшении спроса на вторую продукцию до величины х2=1,3, т.е на 2-1,3=0,7, оптимальность полученного ранее решения сохраняется. Рис. 3.10 Изменение области допустимых решений от изменение спроса на краску Полученные результаты можно обобщить и представить в виде таблицы Таблица 3 Ресурс b1 b2 b3 b4 Тип ресурса Дефицитный Дефицитный Недефицитный Недефицитный Предельно допустимое изменение запаса ресурса bi b1 = 7-6= 1 b2 = 10,5 - 8=2,5 b3 = -2-1,5=-3,5 b4 = 1,3-2=-0,7 Предельное приращение оптимального значения Fi F1=12-10.7 = 1,3 F2 =11,5-10,7=0,8 F3=10,7-10,7=0 F4=10,7-10,7=0 Значение рi, тыс.тг/т р1 =1,3 р2=0,32 р3=0 р4=0 Определение наиболее выгодного ресурса. При решении задач анализа модели на чувствительность в условиях ограничения на затраты, связанные с дополнительным привлечением ресурсов или с инвестициями, что характерно для большинства экономических задач, возникает задача выбора предпочтения ресурсов при вложении дополнительных средств. Для этого вводится показатель ценности рi дополнительной единицы ресурса i -го вида, которую можно найти по формуле: рi = Fi/ bi где Fi - предельное приращение оптимального значения целевой функции; bi предельно допустимое изменение запаса ресурса. Используя данные таблицы для ограничения (1) соответствующего ресурса А получим: р1 = F1 / b1 = 1,3 / 1 = 1,3 тыс.тг. Аналогично можно определить ценность единицы каждого из остальных используемых ресурсов, что представлено в последнем столбце табл. 3. На основе полученных данных можно сделать вывод о том, что дополнительные вложения следует направить прежде всего на увеличение ресурса b1 (сырье А) р1 = 1,3, а затем уже на 41 увеличение ресурса b2 (сырье В) р2=0,32. Как и предполагалось ранее, увеличивать объем недефицитных ресурсов не следует (р3 = р4 =0). Определение пределов изменения коэффициентов целевой функции. Рассмотрим теперь, в каких пределах возможно изменение цен на продукции, при которых не происходит изменение оптимального решения. Цены на продукции с1 и с2 определяют наклон линии целевой функции F(х). уменьшение с1 или увеличение с2 приводит к вращению линии целевой функции против часовой стрелки относительно точки Е вплоть до совпадения с линией ДЕ графика (1) рис. 3.11. В этом случае доход от продажи изменяется, а вариантов плана получим множество на прямой ДЕ. Такое же явление наблюдается при вращении линии целевой функции по часовой стрелке относительно точке Е при изменении коэффициентов целевой функции в противоположную сторону, что и указано на рис. 3.11. В этом случае получим на линии ЕК множество альтернативных Рис. 3.11 Влияние изменения цен на доход от продажи решений х1 и х2, крайние из которых точки Е и К указывают на получение оптимальной величины дохода. Определяем допустимого интервала изменения цены с1 при постоянной цене с2=3, при котором решение остается оптимальным. Находим максимальное значение с1, увеличивая его до тех пор, пока наклон прямой целевой функции не совпадает с прямой ЕК (2), тогда это значение находится из равенства тангенсов углов наклона линий с1х1 +3х2 = F(X) и 2х1 + х2 = 8. tga = c1/c2 = с1/3 = 2/1, с1= 6. При этом доход от реализации увеличится и может составить F = 6*3,3 + 3*1,3=24. Аналогично минимальное значение сн находим, уменьшая его до тех пор, пока наклон прямой, соответствующей целевой функции, не совпадает с прямой ДЕ (1), тогда это значение находится из равенства тангенсов углов наклона линий с1х1+3х2= F(X) и х1+ 2х2= 6. tg = c1/с2 = с1/3=1/2 с1=1,5 и тогда F(X) = 1,5*3,3 +3*1,3 = 9. Таким образом, допустимый интервал изменения цены с1, в котором точка Е остается единственной оптимальной, определяется неравенством 1,5<=c1<=6. При с1 =1,5 оптимальным решением является весь отрезок ДЕ, его любая точка, включая точки Е и Д. Если с1<1.5, то оптимум смещается в точку Д. 42 Аналогично, при с1 =6 оптимальное значение целевой функции достигается в любой точке отрезка ЕК, включая точки Е и К. Если с1>6, то в этом случае оптимум смещается в точку К. Следует заметить, что при с1<1,5 ресурс b4 становится дефицитным, а ресурс b2недефицитным, т.е. если выручка от продажи 1 т продукции первого вида станет меньше 1,5 тыс.тг, то для фирме наиболее выгодно выпускать максимально допустимое количество второй продукции, х2 =2 т в сутки. При этом общее потребление сырья В снизится, что обусловит недефицитность этого ресурса в ограничении (2). Соответствующие выводы можно сделать и для случая с2>6, когда ресурс b2 становится дефицитным, а ресурс b1 - недефицитным. В этом случае доход от продажи одной тонны первой продукции будет больше 6 тыс. тг. И наиболее выгодным становится выпуск только первого вида продукции (точка К) в объеме х1=4 т в сутки. При этом общее потребление недефицитного сырья А снижается, b1 - в ограничении (1). Аналогичные вычисления можно сделать и для цены на продукции второго вида с2. tg с1/с2= 2/с2=2/1 с2=1 F(X) = 2х1+1,0х2 = 8. tg c1/c2 =2/с2 = 1/2 с2=4 F(x) =2х1 +4х2 = 12. Таким образом, допустимый интервал изменения цены для нее составит 1<cв<4, при этом единственным оптимальным решением остается точка Е. Если цена с2 =1 то оптимальной является любая точка отрезка ЕК. При дальнейшем уменьшении цены с2 продукции второго вида оптимум смещается в точку К, следовательно, выпуск фирмой вторго вида продукции становится невыгодным. Если же цена с2=4 тыс.тг, то оптимальное значение целевой функции достигается в любой точке отрезка ДЕ, а дальнейшее увеличение цены с2 смещает оптимум в точку Д. Симплекс метод Оптимальное решение ЗЛП связано с угловыми точками на границах многогранника решений. Конечная граница многогранника решений или количество опорных планов определяется числом сочетаний Сnm = п!/m!(n-m)!. Если п=50, m=25 то число базисных планов 1014. При больших m и n найти оптимальный план, перебирая все опорные планы задачи очень трудно и трудоемко. Поэтому необходимо иметь схему позволяющую переходить от одного опорного плана к другому. Такой схемой называется симплексный метод, который позволяет за конечное число шагов получить ее оптимальный план. Каждый из шагов состоит в нахождении нового плана, которому соответствует меньшее или большее значение целевой функции, чем значение этой же функции в предыдущем плане. Процесс продолжают до получения оптимального плана. Если задача не имеет оптимального решения, то симплексный метод позволяет установить это в процессе решения. Построение опорных планов. Пусть поставлена ЗЛП. Найти минимальное значение функции F = C1X1 + C2X2 + ... + CnXn (5.1) при ограничениях а11 х1 а12 х 2 ... а1n х n в1 а 21 х1 а 22 х 2 ... а 2 п х п в 2 .............................................. а m1 х1 а m 2 х 2 ... а mn х n3 в m (5.2) где хj >=0, (i=1,2,...,m). (5.3) Предположим, что система ограничений задачи m единичных векторов, причем ими являются первые m векторов. Тогда F = C1X1 + C2X2 + ... + CnXn (5.4) 43 при ограничениях х1 а11,m 1 хm 1 а11,m 2 хm 2 ... а11.n хn в11 x2 а 2,m 1 хm 1 а 2,m 2 хm 2 ... а1 2п хп в1 2 .............................................. xm а1 m,m 1 хm 1 а1 m,m 2 хm 2 ... а1 mn хn в1 m xj >=0, j = 1,2, ..., n. (5.6) Запишем систему (2.35) в векторной форме: х1А1+х2А2+... + хmAm + xm+1Am+1+ ... xnAn= В A1 1 0 A2 ... , 0 An 0 1 ... 0 a11.n a 12.n ... , a 1m.n , …, Am 0 0 Am ... , 1 B (5.5) 1 (5.7) a11.m 1 a 12.m 1 ... ,…., a 1m.m 1 в 11 в 12 ... в 1m Векторы А1, А2, ... Аm - линейно независимые единичные векторы m мерного пространства. Они образуют базис этого пространства. Поэтому в разложении (7) за базисные переменные выбираем х1,х2, ... хm, свободные неизвестные хm+1,хm+2, ... хn приравниваем нулю и, учитывая, что вi>=0 (i=1,2,...m), а векторы А1, А2, ... Аm -единичные, получаем первоначальный план: х0 = (х1=в1; х2=в2; ... хm=вm; хm+1=0; ... xn=0) (5.8) Плану (2.38) соответствует разложение х1А1+х2А2+... + хmAm = В (5.9) где векторы А1, А2, ... Аm линейно независимы, следовательно, построенный план является и опорным. Определение 1. Решение системы ограничений (5.2), соответствующее нулевым значениям свободных неизвестных, называются базисным. Рассмотрим, как, исходя из первоначального опорного плана (5.8), можно построить второй опорный план. Предположим, что для некоторого вектора, не входящего в базис, например Аm+1, является положительным хотя бы один из коэффициентов хi,m+1 в разложении х1,m+1А1+х2,m+1А2+... + хm,m+1Am = Am+1 Правую часть В разделим на положительные коэффициенты этой переменной, т.е. вi/aim+1. Таким образом, вектор хm+1 является планом или новым базисом. Задача может иметь не более m базисов, поэтому один из существующих базисов исключаем. Для этого выбираем Q= min (вi/ai,m+1). Пусть эта компонента стоит на первом месте, т.е. Q1=min (в1/a1,m+1). Тогда получим 44 новое базисное решение Х=( х2, х3,...хm,xm+1). Это означает, что х1 нужно исключить из базиса, а включить в базис хm+1 . Таким образом, процесс получения новых опорных планов заключается в выборе вектора, который подлежит включению в базис, и определении вектора, подлежащего исключению из базиса. Условия оптимальности. Предположим, что ЗЛП имеет базисное решение. В этом случае имеем х1А1+х2А2+... + хmAm = В х1С1+х2С2+... + хmСm = F (5.10) (5.11) где все хi>0, a F - значение функции, соответствующее этому плану. Если коэффициент Сj в линейной функции соответствует вектору Aj, то Fj -Cj называется критерием оптимальности или оценкой линейной функции. Критерий оптимальности равен сумме стоимостей деятельности, которые исключают из программы, минус доход от единицы продукта, вводимого в план. Fj сумма произведений коэффициентов при переменных уравнения целевой функции на коэффициенты при переменных в ограничениях, т.е. Fj= cj aij i I c j - коэффициенты при переменных уравнения целевой функции. Справедливы следующие теоремы. Теорема 1. Если для некоторого вектора Аj выполняется условие Fj -Cj>=0, то план Х0 является оптимальным для максимального значение функции. Теорема 2. Если для некоторого вектора Аj выполняется условие Fj -Cj>=0, то план Х0 является оптимальным для минимального значения функции. Таким образом, для того чтобы план задачи на отыскание максимального значения линейной функции был оптимальным, необходимо и достаточно, чтобы его оценки были положительными. А для отыскания минимального значения функции, необходимо и достаточно, чтобы его оценки были отрицательными. Таким образом, решение задачи симплексным методом проводится по следующей схеме: 1) строится базисное решение; 2) с помощью признака оптимальности проверяется, не является ли это решение оптимальным; 3) если нет, то строится другое базисное решение, более близкое к оптимальному; 4) повторяется второй пункт до тех пор пока не выполняется условие оптимальности. Доказано, что в результате конечного числа перебора вариантов можно получить наилучшее; т.е. оптимальное решение. Алгоритм симплексного метода Рассмотрим алгоритм симплексного метода в таблицах. Задачу рассмотрим на максимум. Симпекс-таблица № Базис Свободные члены, вi 1 2 … m m+1 хm+1 хm+2 … xm+n Fj-Cj в1 в2 … вm 0 Переменные х1 a11 a21 … am1 с1 х2 … хm a12 a1m a22 a2m … … am2 amn c2 cm хm+1 хm+2 ….. xn 1 0 …. 0 0 1 …. 0 … … … … 0 …. …. 1 0 0 …. 0 45 Q 1) Составление первого опорного плана. Система ограничений задачи, решаемой симплексным методом, задана в виде системы неравенств смысла <=, правые части которых bi>=0. Перейдем от системы неравенств к системе уравнений путем введения неотрицательных дополнительных переменных. Векторы-столбцы при этих переменных представляют собой единичные векторы и образуют базис, а соответствующие им переменные называются базисными: aij xj +xn+i =bi j J где xn+i - базисные переменные, xj - свободные переменные. 1) Составляем симплекс таблицу. Таблица состоит из коэффициентов системы ограничений и свободных членов. Последняя строка таблицы называется индексной и заполняется коэффициентами функции цели, взятыми с противоположным знаком. 2) Проверка плана на оптимальность. Выясняем, имеется ли хотя бы одно отрицательное число в индексной строке. Если нет, то найденный опорный план оптимален при решении задачи на максимум. Если же среди чисел индексной строки имеются отрицательные, то либо устанавливают неразрешимость задачи, либо переходят к следующему этапу алгоритма. 3) Определение ведущих столбца и строки. Находим направляющие столбец и строку. Направляющий столбец определяется наибольшим по абсолютной величине отрицательного числа индексной строки, а направляющая строка - минимальным из отношений компонентов столбца вектора свободных членов к положительным компонентам направляющего столбца min(bi/air). На пересечении направляющего столбца и строки находится главный элемент. 4) Построение нового опорного плана. Неизвестные переменные, соответствующие разрешающей строке и столбцу, меняют местами. При этом базисная переменная становится свободной переменной и наоборот. Новое значение элемента (Эн ) находящегося в i-й строке и в j-м столбце равно Старое значение элемента (Эс ) минус Элемент находящийся на пересечении j-го столбца и направляющей строки (Э1) * Элемент находящийся на пересечении i-й строки и направляющего столбца (Э2)/главный элемент (Эг). Это называется правилом прямоугольника. Э Или по формулам bi1= (bi-(br/ark)aik при i=/r ; a’ij= (aij-(arj/ark)aik при i=r ; F’0=F0 - (br/ark) Δk ; н Э Э1 * Э 2 Эг с br/ark при i=r) arj/ark при i=r) Δ’j =Δj - (arj/ark) Δk (5.12) (5.13) (5.14) определяют положительные компоненты нового опорного плана, коэффициенты разложения векторов Аj по векторам нового базиса и числа F’0 , Δ’j . Все эти числа записываются в новой симплекс таблице. 6) Проверяют найденный опорный план на оптимальность. Если план не оптимален и необходимо перейти к новому опорному плану, то возвращаются к этапу 4), а в случае получения оптимального плана процесс решения задачи заканчивается. 5.2 Симплекс метод на примере Симплексный метод является универсальным методом решения задач линейного программирования. Рассмотрим пример задачи линейного программирования. Задача. Определить посевные площади зерновых, сахарной свеклы и подсолнечника в подразделении сельскохозяйственного предприятия, располагающего следующим объемом трудовых ресурсов: 2700 чел.-дней, минеральными удобрениями в количестве 1200 ц.д.в. и под эти культуры отведено 580 га пашни. 46 Требуется определить такое сочетание посевов зерновых культур, сахарной свеклы и подсолнечника, которое обеспечивало бы фермеру прибыль. Исходные данные заданы в таблице 1. Таблица 1. Сельскохозяйственные культуры Зерновые Свекла Подсолнечник Затраты на труд, чел.-дни удобрен. ц.д.в. 1 1,7 20 4 0,9 1,6 Прибыль с 1 га тенге 200 350 300 Решение задачи начинается с составления экономико-математической модели. Для этого необходимо условие задачи сформулированное в экономических терминах, записать в математической форме. Введем следующие обозначения: Х1-количество пашни, отведенной под зерновые, га; Х2-количество пашни, отведенной под свеклу, га; Х3-количество пашни, отведенной под подсолнечника, га. Система ограничений записывается из условия, согласно которому затраты по каждому виду ресурсов не должны превышать имеющегося в наличии запаса этого ресурса Х1 + Х2+ Х3 580 Х1 + 20Х2+ 0,9Х3 2700 (5.15) 1,7Х1 + 4Х2+ 1,6Х3 1200 Целевая функция, которую требуется максимизировать, представляет собой сумму прибыли, получаемую от реализации продукции сельскохозяйственных культур. Zmax=200X1+350X2+300X3 (5.16) а также из экономического смысла задачи следует условие неотрицательности в их переменных, т.е. Х1 0, Х2 0, Х3 0 (5.17) Приведем систему ограничений (5.15)-(5.17) к каноническому виду, вводя неотрицательные дополнительные переменные Х1 + Х2 + Х3 + Х4 = 580 Х1 + 20Х2 + 0,9Х3 + Х5 = 2700 (5.18) 1,7Х1 + 4Х2 + 1,6Х3 + Х6 = 1200 Дополнительные переменные Х4, Х5, Х6 -экономически означают соответственно возможное недоиспользование пашни (Х4), трудовых ресурсов (Х5) и удобрений (Х6). Недоиспользование ресурсов не приносит никакого дохода и поэтому в целевую функцию дополнительные переменные вводятся с нулевыми коэффициентами. Zmax=200Х1+350Х2+300Х3+0Х4+0Х5+0Х6 Симплекс метод вносит определенный порядок как при нахождении первого (исходного) базисного решения, так и при переходе к другим базисным решениям. Его идея состоит в следующем. Имея систему ограничений в канонической форме, находят любое базисное решение этой системы, заботясь лишь о том, чтобы найти его как можно проще. Проверяют это решение на оптимальность. Если оно не оптимально, то осуществляется переход к другому базисному решению. Симплекс метод гарантирует, что при этом новом решении целевая функция, если не достигнет оптимума, то приблизится к нему. С новым базисным решением поступают так же, пока не находят оптимальное. Найдем первый базисный план рассматриваемой задачи. Надо искать решение, которое содержит 6-3=3 переменных, равных нулю. Обратим внимание, что коэффициенты при дополнительных переменных образуют единичную матрицу. Поэтому, если принять значения основных переменных, равными нулю (х 1=0, х2=0, х3=0), получим первый базисный план: х4=580, х5=2700, х6=1200, F=0. 47 Этот план отвечает такому положению, при котором продукция не производится, ресурсы не используются и размер прибыли равен нулю. План явно является не выгодным. Для получения прибыли необходимо последовательно ввести в план основные переменные взамен дополнительных, пока не будет получено оптимальное решение. Для удобства проведения технических расчетов модель задачи представлена в таблице в несколько преобразованном виде. Дальнейшее решение представим в виде таблицы 2. Таблица 2 № 1 2 3 4 базис х4 х5 х6 F вi х1 580 2700 1200 0 1 1 1.7 -200 х2 1 20 4 -350 х3 1 0.9 1.6 -300 х4 1 0 0 0 х5 х6 0 1 0 0 0 0 1 0 Q 580 135 300 В симплексной таблице вводится специальный столбец базисных переменных и свободные члены уравнений записываются слева от матрицы коэффициентов. Это создает удобства при чтении базисного плана. Рассмотрим порядок заполнения первой симплексной таблицы. Первая таблица получена непосредственно из канонической формы записи модели задачи. Каждая строка таблицы соответствует одному из уравнений системы. Последняя строка целевой функции соответствует записи целевой функции в форме уравнения, когда все члены с переменными перенесены в левую часть: F - 200х1 - 350х2 - 300х3 - 0х4 - 0х5 - 0х6 =0 Последняя строка является оценочной или индексной. Во втором столбце записаны наименования базисных переменных. В третьем столбце находятся сами базисные переменные, то есть план. Коэффициенты при основных переменных — это нормы расхода ресурсов. Коэффициенты при дополнительных переменных образуют единичную матрицу. Подчеркнем, что переменным входящим в базис, в матрице коэффициентов всегда соответствуют единичные векторы-столбцы. Формальным признаком оптимальности плана при решении задач на максимум является отсутствие в индексной строке отрицательных величин. При решении задач на минимум, наоборот, в индексной строке не должно быть положительных коэффициентов. В индексной строке первой симплексной таблицы имеются отрицательные коэффициенты. Следовательно, план не оптимален и его следует улучшить. Переход к новому базисному плану называется симплексным преобразованием. Поскольку задача решается на максимум прибыли, исходя из здравого смысла, целесообразно ввести в план посевы культуры, дающей наибольший размер прибыли. Для этого находим в индексной строке максимальное по абсолютной величине отрицательное число. Это число -350 и расположено в столбце х2. Оно означает, что введение в план посевов свеклы даст 350 тенге прибыли с 1га. Столбец, содержащий переменную х2, которую необходимо ввести в базис, называется направляющим (разрешающим, ведущим, генеральным, главным, ключевым и т.п.). Теперь необходимо определить, в каком максимально размере могут быть предусмотрены посевы свеклы. Это зависит от объѐмов ресурсов и нормативов затрат. Разделим величины столбца «план» (объѐмы ресурсов) на коэффициенты направляющего столбца: 580/1=580га; 2700/20=135 га; 1200/4=300 га. (5.19) Отношения (5.19) называются симплексным. Минимальное из них показывает, что посевы свеклы можно запланировать в размере, не превышающим 135га. Трудовые ресурсы являются «узким» местом, они лимитируют размеры посевов свекла. Переменную х2 надо запланировать в таком объѐме, чтобы одна из базисных переменных стала равной нулю (чтобы в базисе освободилось место для х2). Если посеять 135га свеклы, то будут полностью использованы трудовые ресурсы, х5 станет равной нулю и ее следует вывести из базиса. Таким образом минимальное симплексное отношение определяет переменную, которая станет свободной. Соответствующая ей строка называется направляющей. Выделяем направляющую строку и столбец с помощью стрелок. Элемент, стоящий на их пересечении, называется направляющим. В таблице он заключен в рамку. 48 Теперь переходим к построению второй симплексной таблицы, то есть второго базисного плана. В начале вместо х5 в число базисных переменных вводим х2, остальные базисные переменные не меняются. При переходе к новому варианту плана в базис можно ввести только одну переменную и одну вывести. Надо преобразовывать систему уравнений таким образом, чтобы у вводимой переменной х 2 был единичный вектор-столбец. Для этого вначале рассчитаем строку вводимой переменной следующим образом. Она получается из направляющей строки первой симплексной таблицы путем деления всех ее элементов на направляющий элемент, то есть на число 20. Остальные строки необходимо преобразовать так, чтобы в клетках направляющего столбца появились нули. То есть необходимо исключить х2 из других уравнений системы. Этого можно достичь с помощью метода Гаусса. Надо к каждой строке первой симплексной таблицы прибавить вновь полученную строку, умноженную на такое число, чтобы в клетке направляющего столбца появился нуль. Таким образом, первая таблица является расчетной базой для второй, вторая - для третьей и т.д., последующая таблица рассчитывается на основе предыдущей. Расчет и заполнение последующей таблицы всегда начинают со строки, которая соответствует разрешающей строке в предыдущей таблице, поэтому ее иногда называют начальной. Например заполняем строку х2, коэффициенты этой строки определяют путем деления каждого элемента предыдущей на разрешающий элемент. 2700:20=135; 1:20=0,05; 20:20=1; 0,9:20=0,045; 0:20=0; 1:20=0,05; 0:20=0. По разрешающему столбцу в последующей таблице на место разрешающего элемента ставится единица, а на место других элементов - нули. Аналогично против самой себе базисной переменной – 1, а против других -0 Все остальные коэффициенты рассчитываются следующим образом: Новое значение элемента, находящегося в i-й строке и в j -м столбце равно: старое значение элемента минус элемент матрицы, находящийся на пересечении i-й строки и разрешающего столбца и умноженное на элемент начальной строки последующей таблицы в j - м столбце. Например, строка х4 заполняется по формуле х4-х2н, получим 580- 135=445; 1-0,05=0,95; 1-1=0; 1-0,045=0,955; 1-0=1; 0-0,05= -0,05; 0-0=0. А строка х6 получим по формуле х6-4х2н, 1200-4х135=660; 1,7-4х0,05=1,5; 4-4=0; 1,6-4х0,045=1,42; 0-0; 0-4х0,05=-0,2; 1-4х0=1. Строка целевой функции заполняется по формуле F+350x2; получим 0+135х350= 47250; 200+350х0,05=-182,5; -350+350х1=0; -300+350х0,045= -284,25; 0+350х0=0; 0+350х0,05=17,5; 0-0=0. Полученные коэффициенты запишем во второй таблице 3. Таблица 3 № 1 2 3 4 базис х2 х4 х6 F вi 135 445 660 47250 х1 0.05 0.95 1.5 -182.5 х2 х3 1 0 0 0 0.045 0.955 1.42 -284.25 х4 0 1 0 0 х5 0.05 -0,05 -0.2 17.5 х6 0 0 1 0 Q 3000 465,9 464,8 После составления ее проверяют план на оптимальность. Наличие отрицательных величин в индексной строке говорит о том, что решение не оптимально - его надо улучшить. Для этого повторяется вычислительная процедура, которая была разработана при переходе от первой таблицы ко второй. Опять отыскиваются разрешающий столбец и разрешающая строка, а затем строится и рассчитывается третья симплексная таблица 4. Разрешающим столбцом является х3 (-284,25) и разрешающей строкой является х6 (464,8). Например, строка х3 вычисляется так: х6:1.42, получим 660: 1,42 =464,788; 1,5:1,42=1,06; 0:1,42=0; 1,42:1,42=1; 0:1,42=0; -0,2:1,42=-0,14; 1:1,42=0,7. 49 А строка х2 получим по формуле х2-0,045х3: 135-464,78х0,045=114,08; 0,05-1,06х0,045=0,002; 1-0х0,045=1; 0,045-1х0,045=0; 0-0х0,045=0; 0,05-0,14х0,045=0,044; 0-0,7х0,045=-0,03. Вычисляем строку х4 по формуле х4-0,955х3: получим 445-0,955х464,78=1,12; 0,95-0,955х1,06=-0,06; 0-0,955х0=0; 0,955-0,955х1=0; 10х0,955=1; -0,05-0,955х0,14=-0,18; 0-0,955х0,7=-0,67. Строка целевой функции вычисляется по формуле F+284.25x3: 47250+464,78х284,25=179366; -182,5+1,06х284,25=118,8; 0+0х284,25=0; -284,25+1х284,25=0; 0+0х284,25=0; 17,5+284,25х0,14=57,3; 0+0,7х284,25=199. Таблица 4 № 1 2 3 4 базис х3 х2 х4 F вi 464,788 114,08 1,12 179366 х1 1,06 0,002 -0,06 118,8 х2 х3 0 1 0 0 1 0 0 0 х4 0 0 1 0 х5 0,14 0,044 -0,18 57,3 х6 Q 0,7 -0,03 -0,67 199 По последней таблице оптимальное решение соответствует оптимальному плану Х1=0, Х2=114,08, Х3=464,78, Х4=1,12, Х5=0, Х6=0, Fmax=179366 тг. Отсутствие отрицательных величин в индексной строке третьей симплексной таблицы свидетельствует о том, что данный план оптимальный. В него вошли посевы под свеклу и подсолнечник, в условиях данного хозяйства посев зерновых при заданной прибыли, получаемой с 1 га -200тг, невыгоден. Базисные переменные х4 характеризуют недоиспользование пашни на 1,12 га. Коэффициенты индексной строки по столбцу х 1 имеют положительный знак. Они показывают, на сколько уменьшится сумма чистого дохода от посева одного гектара зерновых культур. Коэффициенты индексной строки по столбцам дополнительных неизвестных х5 и х6 показывают, на сколько уменьшится общая сумма чистого дохода при недоиспользовании 1 чел-дня (на 57,3 тг) и 1 ц удобрений (на 199 тг). 5.3. Симплекс метод с искусственным базисом В задачах, ограничения которых заданы неравенством типа (>=) дополнительные неизвестные вводятся с отрицательным единичным коэффициентом, поэтому они не могут образовывать естественный базис. Подобные задачи решаются при помощи искусственного базиса, который в литературе встречается также под названием М-метода. Методом искусственного базиса решаются также задачи с жесткими ограничениями, заданными равенствами. Алгоритм решения можно разобрать на примере конкретной задачи. Задача. В фирме производятся четыре вида продукции из двух видов сырья. Причем в условиях данной фирмы расход первого вида ресурса могут превышать 9,4 ед., а второго вида полностью нужно использовать. При этом количество первого вида продукции не может превышать более 2,5 ед., а четвертого вида более 5 ед. Расход ресурсов по видам продукции и себестоимость его характеризуется следующими данными таблицы 5. Таблица 5 Продукция №1 №2 №3 №4 сырье 1 1 0,2 0,12 0,5 сырье 2 100 14 9 79 Себестоимость ед. продукции 3 0,5 1,4 2,0 50 Обозначим через х1, х2, х3, х4 виды продукции. Тогда условия задачи запишутся следующей системой уравнений и неравенств: х1+0,2х2+0,12х3+ 0,5х4>= 9.4 100х1+14х2 + 9х3+ 79х4 = 987 х1 <= 2.5 х4 <= 5 Все неизвестные должны быть неотрицательными: и минимизировать линейную функцию Fmin = 3х1+0,5х2+1,4х3+2х4. Задача приводится к каноническому виду с помощью дополнительных переменных х5, х6, х7 : х1+0,2х2+0,12х3+ 0,5х4 - х5 = 9.4 100х1+14х2 + 9х3+ 79х4 = 987 х1 + х6 = 2.5 х4 + х7 = 5 Данная система не имеет естественного базиса для решения задачи, так как х 5 имеет отрицательный коэффициент и не может служить в качестве базисной неизвестной, ибо в этом случае в исходном плане (-х5) = 9,4 или х5 = -9,4, что невозможно вследствие условия не отрицательности неизвестных. Во втором уравнении нет такой неизвестной, которая бы принадлежала только этому уравнению. Для получения исходного базисного решения в эти уравнения вводят искусственные неизвестные y1 и y2 с положительным единичным коэффициентом, а в целевую функцию - с очень большой оценкой М. При решении задач на максимум она вводится с отрицательным знаком, при решении задач на минимум - с положительным. Такая оценка делает невыгодным наличие искусственных неизвестных в плане и способствует их выводу из базиса. С введением искусственных неизвестных задача примет вид. х1+0,2х2+0,12х3+ 0,5х4 - х5 + у1 =9.4 100х1+14х2 + 9х3+ 79х4 +у2 =987 х1 + х6 = 2.5 х4 +х7 = 5 Все неизвестные должны быть неотрицательными, а линейная форма записи будет иметь вид Fmin = 3х1+0,5х2+1,4х3+2х4 +0х5 + 0х6 + 0х7 + Му1 +Му2 . Составим первую симплексную таблицу. В первой таблице по строкам, ограничения которых заданы типом (>=) в базис вводятся искусственные переменные, а по строкам с ограничениями (<=) - дополнительные переменные. Для удобства индексная строка записывается в два ряда: m+1 и m+2. В верхнем ряду будут денежные оценки, а в нижнем М -оценки. В первой таблице строка m+2 определяется как сумма произведений М -оценок на соответствующие по строкам коэффициенты столбцов, а в строку m+1 заносятся денежные оценки с обратным знаком (таблица 6). Таблица 6 № 1 2 3 4 m+1 m+2 Базис у1 у2 х6 х7 F вi х1 9.4 987 2.5 5.0 0 996.4М 1 100 1 0 -3 101М х2 0.2 14 0 0 -0.5 14.2М х3 0.12 9 0 0 -1.4 9.12М х4 0.5 79 0 1 -2 79.5М х5 -1 0 0 0 0 -М х6 0 0 1 0 0 0 х7 0 0 0 1 0 0 у1 1 0 0 0 0 0 у2 0 1 0 0 0 М Q 9.4 9.87 2.5 М Алгоритм решения задачи с искусственным базисом тот же, что и с естественным базисом. Только разрешающий столбец определяется по строке m+2, т.е. по нижнему ряду индексной 51 строки. При решении задачи на максимум разрешающий столбец также определяется по наибольшему абсолютному значению среди отрицательных величин, а при решении на минимум по наибольшему положительному значению. Разрешающая строка, как и при естественном базисе, выбирается по наименьшему частному от построчного деления свободных членов на соответствующие положительные коэффициенты разрешающего столбца. Весь пересчет ведется по тем же правилам, что и при алгоритме решения с естественным базисом. Строки m+1 и m+2 рассчитываются отдельно. Проверка правильности их расчета определяется по строке m+1 по общему правилу как Fj -Cj, а по строке m+2 - как сумма коэффициентов столбца по строкам, имеющим М- оценки. Решение ведется или до полного исключения искусственных неизвестных из базиса, тогда в строке m+2 значения по всем столбцам будут равны нулю, или когда все значения строки m+2 при решении на минимум станут отрицательными, а при решении на максимум станут положительными. В этом случае задача не имеет решения. Исключенные из базиса искусственные переменные повторно вводить не имеет смысла, поэтому столбцы, представленные этими переменными, не рассчитываются и при последующих итерациях исключаются. Когда все искусственные переменные выведены из базиса и по строке m+2 получены нулевые значения, рассчитан опорный или оптимальный план. Показателем оптимальности будут элементы строки m+1 . Если при решении на минимум в строке m+1 имеются положительные значения, а на максимум - отрицательные, значит получен опорный план исходной задачи и его следует улучшать обычным методом, как и при решении задачи с естественным базисом. В том случае, когда все искусственные переменные выведены из базиса, по строке m+2 получены нули, в строке m +1 при решении на минимум получены нули и отрицательные величины, а при решении на максимум - нули и положительные величины, план оптимален. В таблице 6 разрешающим столбцом будет х 1, а разрешающей строкой - третья строка. Поэтому во второй симплексной таблице х6 выходит из базиса, а х1 входит в базис. Таблица 7 заполняется как с естественным базисом. Таблица 7 № 1 2 3 4 m+1 m+2 базис х1 х7 у1 у2 F вi 2.5 5 6.9 737 7.5 743,9М х1 1 0 0 0 0 0 х2 0 0 0.2 14 -0.5 14.2М х3 0 0 0.12 9 -1.4 9.12М х4 0 1 0.5 79 -2 79.5М х5 0 0 -1 0 0 -М х6 1 0 -1 -100 3 -101М х7 0 1 0 0 0 0 у1 0 0 1 0 0 0 у2 0 0 0 1 0 0 Q 5 13,8 9,3 Значение индексной строки m+2 таблицы 3 свидетельствует о том, что план можно улучшать дальше и что в базис надо ввести х4, а вывести х7. В симплексной таблице 8 разрешающий столбец - х2, а разрешающая строка - третья. Следовательно, из базиса должен быть выведен у1, а на его место введен х2. В связи с тем, что у1 выведен из базиса, столбец у1 в следующей таблице не рассчитывается. Таблица 8 № 1 2 3 4 m+1 m+2 базис х4 х1 у1 у2 F вi 5 2.5 4.4 342 17.5 346.4M х1 0 1 0 0 0 0 х2 0 0 0.2 14 -0.5 14.2M х3 0 0 0.12 9 -1.4 9.12M х4 1 0 0 0 0 0 х5 0 0 -1 0 0 -M х6 0 1 -1 -100 3 -101M х7 1 0 -0.5 -79 2 -79.5M у1 0 0 0.5 0 0 0 у2 0 0 0 1 0 0 Q 22 24.4 В таблице 9 также не достигнут оптимальный план. За разрешающий столбец принимается столбец х5, а за разрешающую строку - у2. В результате из базиса необходимо вывести у2, а на его место ввести х5 . Столбец у2 также не рассчитывается. 52 Таблица 9 № 1 2 3 4 m+1 m+2 базис х2 х1 х4 у2 F вi 22 5 2.5 34 28.5 34 х1 0 0 1 0 0 0 х2 1 0 0 0 0 0 х3 0.6 0 0 0.6 -1.1 0.6M х4 0 1 0 0 0 0 х5 -5 0 0 70 -2.5 70M х6 -5 0 1 -30 0.5 -30M х7 -2.5 1 0 -44 0.75 -44M у2 0 0 0 1 0 0 Q 0.5 В следующей таблице получен оптимальный план, так как все искусственные переменные из базиса выведены, по строке m+2 все значения равны нулю, а в строке m+1 все значения или отрицательны, или равны нулю. Таблица 10 № 1 2 3 4 m+1 m+2 базис x5 x1 x2 x4 F вi 0.48 2.5 24.4 5 29.7 0 x1 0 0 0 1 0 0 x2 0 0 1 0 0 0 x3 0.0085 0 0.6425 0 -1.078 0 x4 0 1 0 0 0 0 x5 1 0 0 0 0 0 x6 -0.43 0 -7.15 1 -0.57 0 x7 -0.63 1 -5.65 0 -0.82 0 Q Оптимальный план получен при следующих значениях переменных: х1=2.5; х2=24.4; х3=0; х4= 5; x5=0.48; х6=0; х7=0; у1=0; у2=0; Fmin =29.7 Следовательно, в оптимальный план вошли продукции вида №1, №2, №4. При этом минимальная себестоимость продукции 29,7 ден. ед. Экономическая интерпретация результатов. Исследования экономических процессов с помощью методов моделирования являются сложным процессом, который предусматривает выполнение этапов: анализ результатов и корректировка модели, а также принятие решений для исследуемой системы. Однако для принятия решения по планированию или управлению часто недостаточно иметь результаты решения первоначальной задачи. В практике принятия управленческих решений необходимо исследовать систему всесторонне, во взаимосвязи и зависимости между элементами ее составляющими. Этому способствует экономико-математический анализ оптимальных решений. Методы такого анализа достаточно разработаны. Экономико-математический анализ оптимального плана предусматривает вариантные расчеты, двойственную оценку эффективности ресурсов в условиях конкретной задачи, коэффициент замещения и т.д. Экономико-математический анализ на основе вариантных расчетов осуществляется при неизменной структуре самой модели, но с изменением численной величины конкретных показателей модели, как aij- коэффициенты затрат, оценки выпускаемой продукции в целевой строке - cj, а также объемов ограничений ресурсов или объемов производства- bi и при изменении элементов самой системы. Вариантные расчеты рассмотрим на условном примере. Согласно оптимальному плану необходимо под свеклу 113,29 га, а под подсолнечник 466,75 га. Посев зерновых культур в условиях данного хозяйства при заданной прибыли, получаемой с 1га -200 тг, невыгоден. При указанном сочетании посевов хозяйство получит максимальную прибыль, которая составит 179678 тг. При этом в хозяйстве останутся недоиспользованными трудовые ресурсы 14 чел.- дни. Допустим, что при постановке рассматриваемой задачи по условиям рынка площади посева подсолнечника нужно ограничить. Представим, что площадь посева подсолнечника должна быть не более 300 га. Тогда развернутая числовая математическая задача может быть представлена следующей системой 53 х1 х2 х3 580 х1 20 х2 0,9 х3 2700 1,7 х1 4 х2 1,6 х3 1200 х3 300 (5.20) Zmax = 200Х1 + 350Х2 + 300Х3 (5.21) Критерий оптимальности остается неизменным, только площадь посева одной культуры ограничили сверху. Таким образом, решая задачу по симплекс таблицы получим также оптимальный план (табл. 4) По второму оптимальному плану необходимо под зерновых отвести 156га, а под свеклы 113,7 га и под подсолнечника верхнюю границу 300 га. При такой структуре посевов хозяйство получит 160995 тг. прибыли, тогда неиспользованной остается пашня в 10,3 га. Приведенные выше примеры не исчерпывают множества возможных вариантов решения задачи. Таким образом можно изменить объемы ресурсов и их затраты и т.д. В настоящее время широко распространены персональные компьютеры и на все типы ЭВМ имеются пакеты прикладных программ по симплекс-методу, поэтому выше изложенные примеры или вариантные расчеты получаются на ЭВМ. Вариантные расчеты, таким образом, в наибольшей степени соответствуют термину «модельные эксперименты». С помощью ЭВМ исследователь может не только изучать состояние системы, но и предвидеть ее поведение при изменениях количественных характеристик, описывающих эту систему. Кроме вариантных расчетов экономико-математический анализ оптимального плана осуществляется с помощью двойственных оценок. Посредством двойственных оценок можно определить роль каждого ограничения в задаче, а также область устойчивости найденного оптимального решения. В качестве примера рассмотрим предыдущую задачу .Для любой задачи линейного программирования существует другая двойственная задача . По поводу двойственной задачи имеется достаточно литературы. Поэтому сразу напишем двойственную задачу для исходной задачи (5.20-5.21). Только отметим, что здесь переменными величинами могут быть оценки уi- приписываемые каждому виду ресурсов. Они должны быть такими, чтобы общая сумма всего имеющегося количества ресурсов была минимальной, но при условии, что суммарная оценка ресурсов, расходуемых на единицу любого вида продукции, будет не меньше, чем цена за эту единицу. Приведем двойственную задачу. У1+ У2 + 1,7 У3 200 У1+ 20У2 + 4 У3 350 (5.22) У1+ 0,9У2 + 1,6У3 300 Fmax=580У1+2700У2+1200У3 (5.23) У1 0, У2 0 , У3 0. (5.24) В задаче У1, У2, У3 обозначают условные цены соответственно 1га пашни, 1 чел.дни. и 1 ц.д.в. удобрений в условиях данного хозяйства. В литературе известно, что из двух взаимодвойственных задач достаточно решить одну и при этом будет получено решение другой. Так как у нас уже решена исходная задача, то значения двойственных переменных оптимального плана задачи (5.22-5.24) могут быть получены из последней строки симплексной таблицы 3. Тогда У1=278,7, У2=0, У3=12,3. Целевая функция двойственной задачи, согласно первой теореме двойственности принимает на оптимальном плане минимальное значение, совпадающее с максимальным значением целевой функции исходной задачи. Поэтому Fmin =179678 тг. 54 Получив решение двойственной задачи можно определить обусловленные оценки имеющихся ресурсов. Значение У1=278,7 показывает, что для данного хозяйства наиболее дефицитным является пашня. В случае неиспользования 1га пашни хозяйство недополучит прибыли в сумме 278.7 тг. И наоборот, увеличение использования пашни на 1га позволит в условиях данного хозяйства увеличить прибыль на 278,7 тг. Нулевое значение переменной У2 говорит о том, что трудовые ресурсы имеются в избытке, это естественно когда везде безработица. Увеличение наличия трудовых ресурсов не принесет прибыли и из решения видно, что недоиспользование трудовых ресурсов составит 14 чел. -дней. Значение У3=12,3 тг. показывает уменьшение прибыли, если хозяйство недоиспользует 1ц.д.в. удобрений и наоборот. Из последней таблицы видно, что ресурсы, как пашня и удобрения, используются полностью, поскольку им соответствуют отличные от нуля значения двойственных оценок. Теперь рассмотрим более подробно последнюю симплекс таблицу. Коэффициенты столбца Х1 показывают, что в случае введения в посевы 1га зерновых при сохранении неизменными всех других условий, посевы свеклы увеличиваются на 0,04га, а подсолнечника на 0,95га, при этом неиспользованных трудовых ресурсов увеличится на 0,75 чел. дней. Величина прибыли в этом случае сократится на 102,1тг. Недоиспользование 1га пашни (Х4) приводит к следующим изменениям в распределении ресурсов: на 1,75 га сокращается площадь под подсолнечник, на 0,7 га увеличится площадь под свеклу. За счет этого на 12,5 чел.дней больше используются трудовые ресурсы. Величина прибыли уменьшится на 278,7 тг. По столбцу Х6 уменьшение использования удобрения на 1ц.д.в. вызывает уменьшение общей прибыли на 12,3 тг. При этом, чтобы сохранить в данных условиях оптимальность плана, необходимо площадь свеклы уменьшить на 0,44га, а площадь подсолнечника увеличить на 0,47 га. И эти изменения повлекут за собой увеличение трудовых ресурсов на 8,37 чел. дней. Дальше рассмотрим устойчивость оптимального плана. По оптимальному плану возделывания зерновых невыгодно при получении с 1га. 200тн. прибыли. Переменная Х1 не входит в базис, ее оценка Z1-С1=Z1-200=102,1 (5.25) Для того, чтобы переменная Х1 была включена в базис, необходимо назначить С 1 так, чтобы оценка этой переменной стала величиной неположительной, т.е. Z1 -Z 1 0 Используя соотношение (5.25), получим С 1 102,1+200=302,1 Таким образом, если прибыль, получаемая с 1га зерновых будет превышать 302,1 тг., то только тогда будет выгодно возделывать зерновые. Теперь рассмотрим, как может изменяться прибыль с 1га свеклы С 2, чтобы производство этой культуры оставалось выгодным . План будет оптимальным, если Zj-C j 0 (j=1, 4, 6) 0(-0.75) +300 0.95 + С 2(-0.04)-200 0 0 12.5 +300 1.75 + С 2 (-0.7)- 0 0 (5.26) 0 (-8.37)+300 (-0.47)+ С 2 0.44-0 0 Отсюда С 2 должно удовлетворять условиям 320 С2 750 Производство свеклы будет оптимальным, если прибыль с 1га будет ниже на 30 тг., чем при первоначальном варианте. Это говорит об устойчивости оптимального плана. 55 Проверим на устойчивость оптимального плана на подсолнечнике (Х3) Z3 - С 3 0 (j= 1, 4, 6.) 0(0.75) + С 3 0.95 + 350(-0.04)-200 0 0 12.5 + С 3 1.75 +350 (-0.7) - 0 0 (5.27) 0(-8.37) + С 3 (- 0.47)+ 350 (0.44) - 0 0 Отсюда, 140 С 3 328 Аналогично границы значения прибыли с 1га подсолнечника показывают, что производство этой культуры остается выгодным Таким образом, экономико-математический анализ оптимального плана предусматривает вариантные расчеты, а также использование двойственных оценок как инструмента измерения эффективности приращения объемов ресурсов в границах устойчивости плана, т.е. в конкретных условиях данной задачи. С их помощью выявляются «узкие места», они указывают меру дефицитности или же избыточности ресурсов в отношении принятого в задаче показателя критерия оптимизации. Кроме того, с помощью коэффициентов замещения определяются как границы устойчивости плана, так и его новая структура при изменении основных условий функционирования системы. Иногда разработка моделей ограничивается теоретической стороной, недостаточно учитывается тот факт, что, как правило, математическая модель не может быть применена к решению конкретной практической проблемы в стандартной форме, и необходима ее спецификация, базирующаяся на глубоком изучении моделируемого процесса с помощью и при участии специалистов конкретной области. При этом нужно, чтобы эта специфика учитывалась на всех стадиях внедрения задач и осуществлялась непрерывная проверка и корректировка. Поэтому к оптимизационным задачам зачастую предъявляются требования однозначного, окончательного и исчерпывающего результата. В этом случае целесообразно рассматривать возможность разработки более простых моделей с приданием им адаптивных свойств- оперативного включения новых факторов, а учет связей между моделями передать подготовленному пользователю, работающему в режиме диалога. Также качественно новые модели смогут, вероятно, описать более широкий спектр реальных процессов, позволяя преодолеть излишнюю жесткость (малую вариантность предлагаемых решений) существующих постановок. В условиях функционирования в реальном масштабе времени решающей становится несходимость к оптимуму, а быстрота получения ответа с достаточной для практики точностью и возможностью оценить порядок погрешности. Использование таких моделей позволит, по видимому, успешно сочетать новые методы с традиционными процедурами планирования, технико-экономическим анализом. Таким образом, совершенствование системы планирования отрасли сельского хозяйства на основе применения математических методов и средств вычислительной техники особенно эффективно, если разработать и использовать систему математических моделей, охватывающих все стороны маркетингового исследования деятельности агробизнеса. Линейное программирование в ЕХСЕLе Аналитическое решение задачи линейного программирования - дело весьма сложное, поэтому приводим последовательность необходимых при решении задач с помощью ЕХСЕЛ. Последовательность работ рассмотрим на примере задачи оптимального использования ресурсов. Пример. Постановка задачи. Для производства трех видов продукции предприятие использует два типа технологического оборудования и два вида сырья. Нормы затрат сырья и времени на изготовление одного изделия каждого вида приведены в таблице 1. В ней же указаны общий фонд рабочего времени каждой из групп технологического оборудования, объемы имеющегося сырья каждого вида, а также цена одного изделия данного вида и ограничения на возможный выпуск каждого из изделий. 56 Таблица 11 Ограничение Сырье (кг), R1 вида R2 вида Нормы затрат на одно изделие 2 3 4 3 5 15 13,5 11,7 Производительность оборудования (станок) (норма-час.), N1 типа N2 типа Выпуск (шт): min max Цена 1-го изделия (д.е) 2,4 5,9 6 35 5 1 3,8 8,4 8 45 3 9,7 8,2 7 56 8 Общее количество ресурсов 601 1501 350 780 Цель задачи: Исходя из имеющиеся ресурсов В каком количестве надо выпускать четыре вида изделии, при этом выполнить план предприятия и учитывать спрос рына на этих изделии и получить максимум выручку. Решение состоит из этапов: 1. Составление экономико-математической модели 2. Решение задач в ЕХСЕЛе 3. Анализ оптимального решения задачи 4. Многовариантность задачи Решение. 1. Составление экономико-математической модели Для составления математической модели введем следующие обозначения: х1- количество изделии первого вида, х2-количество изделии второго вида, х3 - количество изделии третьего вида. По постановке задач ограничением является два вида сырья, два вида оборудования и заданный план выпуска изделий и спрос на них. Таким образом, система ограничений состоит из таких ограничений: на ресурсы, выполнение плана и спрос рынка. Первый блок ограничение на ресурсы. Сырье первого вида для выпуска единицы изделий первого вида требуется 4 единиц, а для выпуска всего изделии х1 требуется 4х1 единиц сырья, для второго вида 3х2, для третьего 5х3 единиц. Тогда 1) 4х1+ 3х2+ 5х3 <=601, левая часть означает потребность в сырье первого вида, правая часть показывает количество имеющегося ресурса. Аналогично можно составить ограничения для остальных ресурсов. 2) 15х1+13.5х2+11.7х3 <=1501 3) 2.4х1+3.8х2+9.7х3 <=350 4) 5.9х1+8.4х2+8.2х3 <=780 В следующим блоке количество выпускаемого изделии ограничивается сверху в зависимости от спроса на них. Поэтому используется знак 5) х1 <= 35 6) х2 <= 45 7) х3 <= 56 Следующий блок обеспечивает выполнение плана. План выполняется или перевыполняется, поэтому используем знак . 8) х1 >= 6 9) х2 >= 8 10) х3 >= 7 Целевая функция выражает общую выручку от реализации изделии Fmax = 5х1+3х2+8х3 2. Решение задач в ЕХСЕЛе состоит из таких шагов: А) Создание формы для ввода условий задачи и ввод исходных данных 57 В) Ввод зависимостей из математической модели Г) Нахождение оптимальное решение задачи А) Создание формы для ввода условий задачи Ввод условие задачи показан на экране диалоговое окно ЕХСЕЛ. Ввести исходные данные в форму (рисунок 5.1) Рисунок 5.1 В) Необходимо ввести зависимости из математической модели. Эти зависимости представляет собой левые части ограничений и целевую функцию. Данную операцию можно выполнить с помощью Мастер функции из категории Математические СУММПРОИЗ (рисунок 5.2). Рисунок 5.2 58 В первый массив вводятся коэффициенты соответствующего ограничения, а во второй массив переменные Х1, Х2, Х3, точнее ячейки, где мы им присвоили инициирующие значения (таблица. Рисунок 5.3 Во все диалоговые окна адреса ячеек удобно вводить не с клавиатуры, а протаскивая мышь по ячейкам, чьи адреса следует ввести. На этом ввод данных закончен (рисунок 5.4). Рисунок 5.4 Г) Нахождение оптимальное решение задачи. Для решения задачи используется модуль Поиск решения в меню Сервис. Из меню Сервис откроем окно Поиска решения 1. В поле Установить целевую ячейку введем ячейку, в которой находится формула для расчета целевой функций. 2. Из группы Равной выберем вид целевой функции (максимум или минимум), т.е. переключатель – максимальному значению. 3. В поле области Изменяя ячейки введем ячейки с первоначальными нулевыми значениями переменных х1, х2, х3. 59 . Рисунок 5.5 4. Нажав кнопку Добавить, откроем диалоговое окно Добавление ограничения. Через данное окно введем ограничения в соответствии со знаком, который принят в модели. В этом примере необходимо задать 10 ограничений. После того как ввели первое ограничение, нажатием кнопки Добавить можно ввести значение без закрытия диалогового окна Добавление ограничения. Рисунок 5.6 После закрытие окна Добавление ограничения в поле Ограничения окна Поиск решения появится все введенные ограничения. После того как все ограничения для программы Поиск решения заданы, можно воспользоваться кнопками Изменить и Удалить для изменения и удаления ряда ограничений из их списка. Рисунок 5.7 60 Затем открыв диалоговое окно Параметры поиска решения можно изменить параметры Максимальное время или Предельное число итерации в случае, если за данное количество итерации задача не решена. Для решения задачи линейного программирования должен быть установлен флажок Линейная модель. Рисунок 5.8 После нажатия кнопки ОК вновь появится диалоговое окно Поиск решения. Запуск на решение модели и вычисления результатов осуществляется нажатием кнопки Выполнить. После окончание поиск решения завершен, новые значения будут вставлены в таблицу, а на экране появится окно Результаты поиска решения. Рисунок 5.9 Если решение не найдено, окно выведет соответствующее сообщение. Если решение найдено, выделим все три типа отчетов Результаты, Устойчивость и Пределы, нажмем ОК, и результат решения задачи – на экране. Таким образом, программа выполнила расчет определения оптимального количества выпуска изделии. 3) Анализ оптимальное решение задачи. Из рисунка 5.10 оптимальное решение х1=35, х2=8, х3=24,3 и целевая функция – 393.3 д.е.. Очень часто на практике необходимо исследовать полученное решение, чтобы получить ответы на целый ряд возникающих при изучении решения вопросов. Например, если интересует чувствительность полученных оптимальных решений к изменению различных параметров исходной модели, то в этом могут помочь предлагаемые в окне Поиск решения отчеты: отчет по результатам, отчет по устойчивости и отчет по пределам. 61 Рисунок 5.10 Отчет по результатам включает в себя 3 таблицы. В них приводится исходное и окончательное значение целевой ячейки, в которую мы поместили целевую функцию решаемой задачи. В таблице так же мы видим исходные и окончательные значения оптимизируемых переменных, которые содержатся в изменяемых ячейках. Третья таблица отчета по результатам содержит информацию об ограничениях. В таблице 6 графа Значение - показывает фактическое выполнения ограничении (левую часть), графа Разница- показывает насколько невыпольняется система неравенств, для ресурсных ограничений определяет остаток используемых ресурсов, т.е. разность между потребным количеством ресурсов и их наличием. Статус- определяет, связанными или несвязанными являются те или другие ограничения (связанное – зависить, несвязанное – не зависить) с оптимальном решением. Если ресурс используется полностью, то в графе Статус указывается связанное, при невыполнении ресурса в этой графе указывается несвязанное. По оптимальному решению в таблице 6 расход первого ресурса R1 - 285,44 т, а неиспользованную часть составляет 315,56 т . Расход второго ресурса R2 –917,17 т, неиспользованная часть - 583,8 т. Время первого станка используется полностью (разница равна нулю), а время второго станка используется 472,867 часов, неиспользованная часть - 307,132 часов. Таблица Ячейка $E$4 $E$5 $E$6 $E$7 $E$8 $E$9 $E$10 $E$11 $E$13 $E$12 12 Имя R1-сырье R2 -сырье N1-станок N2-станок 1-изд спрос 2-изд спрос 3-издспрос 1-изд план 2-изд план 3-изд план Значение 285,44 917,177 350 472,867 35 8 24,288 35 24,288 8 Формула $E$4<=$G$4 $E$5<=$G$5 $E$6<=$G$6 $E$7<=$G$7 $E$8<=$G$8 $E$9<=$G$9 $E$10<=$G$10 $E$11>=$G$11 $E$13>=$G$13 $E$12>=$G$12 62 Статус не связан. не связан. связанное не связан связанное не связан. не связан. не связан не связан связанное Разница 315,556 583,822 0 307,132 0 37 31,711 29 17,288 0 По выполению плана и спроса на продукцию. Первая продукция выпускается по удовлетворению спроса и план на нее перевыполняется на 29 ед. Вторая продукция выпускается по минимальному, т.е. по плану, спрос не удовлетворяется, поэтому оптимальному решению это продукция невыгодная для фирмы. Третий товар на 17,288 единиц выпускается больше, чем план, но меньше спроса на 31,711ед. Отчет по устойчивости состоит из двух таблиц. В этом отчете помещается информация об изменяемых переменных и ограничениях модели. Оно позволяет оценить, насколько чувствительным является полученное оптимальное решение к возможным изменениям параметров модели. Нормированная стоимость показывает, насколько изменяется целевая функция при принудительном включении единицы этой продукции в оптимальное решение. Следующие графы показывает предельные значения приращения коэффициентов целевой функции, при которых сохраняется набор переменных, входящих в оптимальное решение. Например, оптимальное решение будет устойчивым при интервалах цен 5-3,02<C1< , 3- <C2<3+0.134, 80.34<C3<8+12.20. То есть, если цена на первую продукцию увеличивается бесконечно и уменьшается на 3,02 ед. нужно выпускать в количестве 35 ед. в остальных случаях нужно менять. Таблица13 Ячейка $B$16 $C$16 $D$16 Имя опт реш х1 опт реш х2 опт реш х3 Результ значен 35 8 24,288 Нормир стоим 0 0 0 Целевой Коэфф 5 3 8 Допуст Увел 1E+30 0,134 12,20 Допуст Умень 3,02 1E+30 0,34 В таблице 14 графа теневая цена показывает, как изменится целевая функция при изменении ресурсов на единицу. Таблица 14 Ячейка $E$4 $E$5 $E$6 $E$7 $E$8 $E$9 $E$10 $E$11 $E$13 $E$12 Имя R1-сырье R2 -сырье N1-станок N2-станок 1-изд спрос 2-изд спрос 3-изд спрос 1-изд план 3-изд план 2-изд план Результ значен 285,44 917,17 350 472,86 35 8 24,28 35 24,28 8 Тенев Цена 0 0 0,82 0 3,02 0 0 0 0 -0,13 Огранич Правая часть 601 1501 350 780 35 45 56 6 7 8 Допуст Увел 1E+30 1E+30 307,6 1E+30 48,22 1E+30 1E+30 29 17,28 37 Допуст Умень 315,55 583,82 167,7 307,13 29 37 31,71 1E+30 1E+30 80,94 Теневая цена показывает выгодность ресурсов. Если теневая цена принимает нулевое значение, то изменение объема данного ресурса не приносит не дохода и не убытки. Когда теневая цена принимает положительное значение, то изменение объема ресурса на одну единицу приносит сколько дохода или целевая функция увеличивается на сколько. Если теневая цена принимает отрицательное значение - то изменение объема на одну единицу изменяет значение целевой функции на столько. Например, первый станок рабочие время продливается на 1 час, то целевая функция увеличивается на 0,82 д.е. Следующие графы показывают значения приращения ресурсов, при которых сохраняется оптимальный набор переменных, входящих в оптимальное решение. Отчет по пределам показывает, в каких пределах может изменяться выпуск продукции, вошедшей в оптимальное решение, при сохранении структуры оптимального решения. Кроме этого, в отчете указаны значения целевой функции, при выпуске данного типа продукции на нижнем и верхних пределах. 4) Многовариантность задачи. Если фирма хочет получить дополнительных доход, то нужно увеличивать рабочее время первого станка. Поэтому для получения следующего варианта, мы рабочее время первого станка не ограничиваем сверху. Математическая запись показан ниже, третье ограничение знак «меньше равно» меняем на «больше равно». При этом рабочее время первого станка по ходу решения задачи определяется. 63 3) 2.4х1+3.8х2+9.7х3 >= 350 Задачу еще раз решаем. Получим второе оптимальное решение Таблица 15 Изделие F-коэфф х1 5 х2 3 х3 8 Лев часть Знак Прав часть R1-сырье R2-сырье N1-станок N2-станок 1-изд спрос 2-изд спрос 3-изд спрос 1 изд план 2-изд план 3-изд план 4 15 2,4 5,9 1 3 13,5 3,8 8,4 5 11,7 9,7 8,2 1 460,8 1363,9 678,9 780,0 35,0 13,6 56,0 35,0 13,6 56,0 <= <= >= <= <= <= <= >= >= >= 601 1501 350 780 35 45 56 6 8 7 х3 56,0 цель функ 663,8 1 1 1 1 х1 35 Опт реш х2 13,61 max Таблица 16 Изменяемые ячейки Ячейка Имя Оптр реш х1 $B$16 Опт реш х2 $C$16 Опт реш х3 $D$16 Исходно 35 8 24,3 Результат 35 13,61 56,0 Таблица 17 Ограничения Ячейка $E$4 $E$5 $E$12 $E$7 $E$8 $E$9 $E$10 $E$11 $E$13 $E$6 Значение 460,8 1363,9 13,6 780,0 35,0 13,6 56,0 35,0 56,0 678,9 формула $E$4<=$G$4 $E$5<=$G$5 $E$12>=$G$12 $E$7<=$G$7 $E$8<=$G$8 $E$9<=$G$9 $E$10<=$G$10 $E$11>=$G$11 $E$13>=$G$13 $E$6>=$G$6 Имя R1-сырье R2-сырье 2-изд план N2-станок 1-изд спрос 2-изд спрос 3-изд спрос 1-изд план 3-изд план N3-станок Статус не связан. не связан. не связан. связанное связанное не связан. связанное не связан. не связан. не связан. Разница 140,178 137,103 5,6 0 0 31,392 0 29,0 49,0 328,9 Таблица 18 Изменяемые ячейки Ячейка $B$16 $C$16 $D$16 Имя опт реш х1 опт реш х2 опт реш х3 Результ. значен 35 13,607 56,0 Нормир. стоим 0 0 0,0 64 Целевой Коэфф 5 3 8 Допуст Увелич 1E+30 4,118 1E+30 Допуст Уменьш 2,892 3 5,071 Таблица 19 Ограничения Ячейка $E$4 $E$5 $E$12 $E$7 $E$8 $E$9 $E$10 $E$11 $E$13 $E$6 Имя R1-сырье R2-сырье 2-изд план N2-станок 1-изд спрос 2-изд спрос 3-изд спрос 1-изд план 3-изд план N1-станок Результ. значен 460,8 1363,9 13,6 780,0 35,0 13,6 56,0 35,0 56,0 678,9 Теневая Цена 0,0 0,0 0,0 0,4 2,9 0,0 5,1 0,0 0,0 0,0 Правая часть 601 1501 8 780 35 45 56 6 7 350 Допуст Увелич 1E+30 1E+30 5,607 85,309 7,983 1E+30 5,7444 29 49 328,907 Допуст Уменьш 140,178 137,103 1E+30 47,1 29 31,393 32,158 1E+30 1E+30 1E+30 Второе оптимальное решение (таблица 16) зависит от использования рабочего времени второго станка. В таблице 17 графе Статус по второму станку показывает связанное, это означает, что второй станок работает на полную мощность. Для этого первый станок должен допольнительно отработать на 328,9 часов. Тогда изделий первого и третьего вида выпускаются по полному объему спроса. Таким образом, меняя условия задачи можно получить несколько вариантов оптимального решения, из многих вариантов для каждого случая можно выбирать соответствующий, более приемлимый для фирмы вариант. В таблице 20 показаны сравнительные данные по вариантам. Таблица 20 Ресурсы Сырье R1 R2 Станки N1 N2 Изделие P1 P2 P3 Общая выручка, тыс. тенге Исходные Оптимальное решение 601 1501 350 780 6-35 8-45 7-56 Вариант 1 285,4 917,2 350 472,9 35 8 24,3 393,3 Вариант 2 460,8 1363,9 678,9 780 35 13,6 56 663,87 Задания. 1. С вокзала Алматы ежедневно отправляются скорые и пассажирские поезда. Пассаражировиестимость и количество вагонов железнодорожного депо станции отправления указаны в таблице 21. Таблица 21 Тип вагона Количество вагонов Скорой в поезде пассажирский Пассажиро-вместимость, чел Парк вагонов Багажный 1 2 10 Жесткий 1 7 58 80 Купейный 8 4 36 120 Мягкий 4 1 18 30 Определите оптимальное количество пассажирских и скорых поездов, обеспечивающих максимальное количество ежедневно отправляемых пассажиров в вокзала. 2. Фирма производит и продает столы и шкафы из древесины хвойных и лиственных пород. 65 Расход каздого вида в кубометрах на каждое изделие задан в таблице 22. Изделие Расход древесины, м.куб хвойные 0,21 0,41 80 Стол Шкаф Запасы древесины Цена изделия, тыс.тг лиственные 0,35 0,54 45 5,7 12,6 Определите оптимальное количество столов и шкафов, которое следует поставлять на продажу для получения максимального дохода фирмы. 5.6. Математические методы решения транспортной задачи Транспортная задача является одной из важнейших частных задач ЛП. Если условия транспортной задачи и ее опорный план записаны в виде таблицы, то клетки, в которых находятся отличные от нуля перевозки, называются занятыми, остальные - незанятыми. Занятые клетки соответствуют базисным неизвестным, и для невырожденного опорного плана их количество равно m+n-1. Всякий план транспортной задачи, содержащий более m+n-1 занятых клеток, не является опорным, так как ему соответствует линейно зависимая система векторов. При таком плане в таблице всегда можно построить замкнутый цикл, с помощью которого уменьшают число занятых клеток. Как и для других задач ЛП, итерационный процесс по отысканию оптимального плана транспортной задачи начинают с опорного. Первоначальный опорный план транспортной задачи решается несколькими методами: методом северо-западного угла, минимальной стоимости и двойного предпочтения и т.д. От того, как построен первый план, зависит количество шагов, необходимых для получения оптимального решения. Рассмотрим транспортную задачу на примере. На четыре магазина доставляется товары из трех пунктов хранения. В первом пункте имеется 400, во втором-700 и в третьем -1200 т товара. В магазины товары должны быть доставлено в следующих количествах: на первый -700, на второй -200, на третьий -600 и четвертый -800 т. Расстояние между пунктами хранения и магазинами приведены в таблице 23. Таблица 23. Пункты хранения 1 2 3 1 18 17 15 М а г а 3 2 12 10 11 з и н ы 4 13 11 10 7 13 9 Требуется составить такой план транспортировки товара, который обеспечит наименьший объем грузоперевозок в т-км. В рассматриваемой задаче суммарный запас товара в пунктах хранения равен суммарной потребности магазинов, т.е. задача называется закрытой. Обозначим хij - количество товара, перевозимого из i -го пункта хранения на j-й магазин. Исходные данные задачи можно представить в виде транспортной таблицы, строки которой соответствуют пунктам хранения, а столбцы - магазинам. В правых верхних углах клеток таблицы представлены расстояния от пунктов хранения до магазинов, в левых нижних углах- искомые размеры перевозок. Таблица 2 Пункт хранения 1 1 2 18 х11 х12 2 х21 х22 х31 х23 13 х24 700 10 х33 200 400 11 11 х32 700 7 х14 10 15 Запасы 4 13 х13 17 3 Потребность 3 12 9 х34 600 66 800 1200 2300 Рассмотрим решение задачи потенциальным методом. Алгоритм потенциального метода состоит из следующих этапов: 1) Нахождение первого базисного (опорного) плана. 2) Проверка полученного плана на оптимальность. 3) Последовательное улучшение плана до получения оптимального. Для построения первого опорного плана рассмотрим метод северо-западного угла (таблица 25). Построение начинаем с северо-запада, то есть с клетки(1.1). Записываем в нее максимально возможную перевозку груза- 400т., то есть наименьшую из величин (400, 700). Таким образом, товар хранимый в первом пункте, полностью вывозится, а потребность первого магазина остается неудовлетворенным на величину 700-400=300. Таблица 25 Пункт хранения 1 1 2 3 Запасы 4 18 12 13 7 17 10 11 13 10 9 400 400 2 300 200 3 200 15 700 11 400 Потребность 700 200 800 600 800 1200 2300 Теперь сравниваем эту разность с запасом товара во втором пункте (700). Меньшую из этих величин записываем в клетку (2.1). Теперь полностью удовлетворена потребность первого магазина. Во втором пункте остается не вывезенными 400 т товара (700-300=400). Сравниваем эту величину с потребностью второго магазина (200) и наименьшую из них записываем в клетку (2.2). Теперь во втором пункте остаются не вывезенными 200 т товара. Сравниваем эту величину с потребностью третьего магазина (600) и наименьшую из них записываем в клетку (2.3). Далее в клетку (3.3) записываем 400 т и в клетку (3.4)-800 т товара. Полученный план является базисным, так как число загруженных клеток в нем равно m+n-1 =6. Сумма стоимости перевозимого товара на расстояния равна: F= 18х400+17х300+10х200+11х200+10х400+9х800=27000 т-км. Теперь необходимо определить является ли полученный план оптимальным. Для этого используем метод потенциалов. Потенциалы -это числа, приписываемые каждой строке и каждому столбцу. Значит потенциалов m+n. Обозначим потенциалы строк U1, U2, U3, а столбцов V1, V2, V3, V4. Расстояния между пунктами хранения и магазинами- Сij . Из теоремы следует, для того чтобы первоначальный план был оптимальным, необходимо выполнение следующих условий: а) для каждой занятой клетки сумма потенциалов должна быть равна стоимости единицы перевозки, стоящей в этой клетке: Ui +Vj = Cij , при хij >0 б) для каждой незанятой клетки сумма потенциалов должна быть меньше или равна стоимости единицы перевозки, стоящей в этой клетке: Ui +Vj <= Cij , при хij >0 Если хотя бы одна незанятая клетка не удовлетворяет условию б), то опорный план является не оптимальным и его нужно улучшить. Для проверки плана на оптимальность необходимо сначала построить систему потенциалов. Систему потенциалов можно построить только для невырожденного опорного плана. Такой план содержит m+n-1 занятых клеток, поэтому для него можно составить систему из m+n-1 линейно независимых уравнений вида а) с n+m неизвестными. 67 Таблица 26 Пункт Vj хранения Ui 1 U1 2 U2 3 U3 Потребность 1 V1 2 V2 18 3 V3 12 Запасы 4 V4 13 7 400 - + 17 300 + 10 200 - 11 + 10 200 15 11 700 400 700 400 13 200 - 9 800 600 1200 2300 800 Уравнений на одно меньше, чем неизвестных, поэтому система является неопределенной, и одному неизвестному придают нулевое значение. После этого остальные потенциалы определяются однозначно. Рассчитаем потенциалов для занятых клеток. U1+V1=18; U2+V1=17; U2+V2=10; U2+V3=11; U3+V3=10; U3+V4=9 и полагаем U1=0, тогда V1=18, U2=17-18=-1, V2=10+1=11, V3=11+1=12; U3=10-12=-2; V4=9+2=11. После определения потенциалов план исследуется на оптимальность. Для не занятых клеток U1+V2<=12, 0+11<=12, 11<=12 - верно; U1+V3<=13, 0+12<=13, 12<=13 - верно; U1+V4<=7, 0+11<=7, 11<=7 - неверно; U2+V4<=13, -1+11<=13, 10<=13 - верно; U3+V1<=15, -2+18<=15, 16<=15 - неверно; U3+V2<=11, -2+11<=11, 9<=11 - неверно. План не оптимален и его надо улучшать. Для улучшения среди неверных значений берут клетку с наибольшим по абсолютной величине значением и строят из нее замкнутый контур или цепочку. В данном случае берем клетку (1.4). Одна вершина контура должна лежать в этой свободной клетке, остальные- только в занятых клетках. Число вершин всегда должно быть четное. Контур, построенный из клетки (1.4), обозначен пунктиром. В вершине свободной клетки ставится знак (+), в остальных клетках знаки (+) и (-) чередуются. В клетках с отрицательными вершинами выбирается наименьший объем перевозок, который вычитается из всех объемов перевозок по клеткам, имеющим отрицательные вершины контура, и прибавляется к объемам перевозок по клеткам с положительными вершинами контура. Отрицательные вершины контура расположены в клетках (1-1) с объемом перевозок, равным 400т, (2-3) -200т и (3-4) с объемом перевозок, равным 800т. Следовательно, меньший объем перевозок в клетках с отрицательными вершинами контура равен 200 т. Этот объем вычитаем из клеток (1-1) и (3-4), и прибавляем к клеткам (1-4), (2-1) и (3-3) и записываем в новую таблицу 27. Объем груза 200т как бы переместился по контуру в свободную клетку (1-4) с наибольшей по абсолютному значению величиной. Таблица 27 Пункт Vj хранения Ui 1 U1 2 U2 3 U3 Потребность 1 V1 2 V2 18 3 V3 12 13 200 - 7 200 17 500 Запасы 4 V4 + 400 10 11 13 11 10 9 200 700 15 + 700 600 200 600 600 800 1200 2300 В таблице 27 вновь проверяется объем ограничений по строкам и столбцам. Суммарные издержки на перевозку при таком плане равны F= 200х18+200х7+500х17+200х10+600х10+600х9=26900 т-км. Или на 100 т-км меньше, чем в первоначальном плане. 68 Составленный план опять принимается за исходный, и вся вычислительная процедура повторяется снова. Для занятых клеток составим уравнения потенциалов. U1+V1=18; U1+V4=7; U2+V1=17; U2+V2=10; U3+V3=10; U3+V4=9, полагаем U1=0, тогда V1=18, V4=7, U2 =-1, V2=11, U3 =2, V3=8. Затем проверяем план на оптимальность путем проверки условия б) U1+V2 <=12, U1+V3 <=13, U2+V3 <=11, U2+V4 <=13, U3+V1<= 15, U3+V2 <=11, 0+11<=12, 0+8<= 13, -1+8<=11, -1+7<= 13, 2+18<=15, 2+11<=11, 11<=12 8<=13 7<=11 6<= 13 20<=15 13<=11 - верно. - верно. - верно. - верно. - неверно. - неверно. План не оптимален. Для улучшения среди неверных значений берут клетку с наибольшим по абсолютной величине значением и строят из нее замкнутый контур или цепочку. В данном моменте можно взять клетку (3-1). Одна вершина контура должна лежать в этой свободной клетке, остальные - только в занятых клетках. Отрицательные вершины контура расположены в клетках (1-1) с объемом перевозок, равным 200т и (3-4) - 600т. Следовательно, меньший объем перевозок в клетках с отрицательными вершинами контура равен 200 т. Этот объем вычитаем из клеток (1-1) и (3-4), прибавляем к клеткам (3-1) и (1-4) и записываем в новую таблицу 28. Таблица 28 Пункт Vj хранения Ui 1 U1 2 U2 3 U3 Потребность 1 V1 2 V2 18 3 V3 12 Запасы 4 V4 13 7 400 17 500 - 10 200 13 10 9 + 15 200 + 700 400 11 11 600 600 200 700 400 800 1200 2300 Суммарные издержки на перевозку при таком плане равны: F= 400х7+500х17+200х10+200х15+600х10+400х9=25900 т-км или на 1000 т-км меньше, чем в предыдущим плане. Составленный план опять принимается за исходный, и вся вычислительная процедура повторяется снова. Составим уравнения потенциалов для занятых клеток. U1+V4=7; U2+V1=17; U2+V2=10; U3+V1=15; U3+V3=10; U3+V4=9; Полагаем, что U1=0, тогда V4=7, U3 =2, V1 =13, U2=4, V2=6, V3=8. Для незанятых клеток проверяем условия оптимальности. U1+V1<=18, 0+13<=18, 13<=18 - верно U1+V2<=12, 0+6<=12, 6<=12 - верно U1+V3<=13, 0+8<=13, 8<=13 - верно U2+V3<=11, 4+8<=11, 12<=11 - неверно U2+V4<=13. 4+7<=13, 11<=13 - верно U3+V2<=11 2+6<=11, 8<=11 - верно Условие не выполняется в клетке (2-3). Построим контур. Отрицательные вершины контура расположены в клетках (2-1) и (3-3) с перевозками соответственно 500 и 600т. Таким образом, заполняем следующую таблицу 29. 69 Таблица 29 Пункт Vj хранения Ui 1 U1 2 U2 3 U3 Потребность 1 V1 2 V2 18 3 V3 12 Запасы 4 V4 13 7 400 17 10 200 13 10 9 500 15 700 11 700 100 700 400 11 200 400 600 800 1200 2300 Суммарные издержки на перевозку при таком плане равны F= 400*7+200*10+500*11+700*15+100*10+400*9 =25400 или на 500 т-км меньше, чем в предыдущем плане. Составленный план опять принимается за исходный, и вся вычислительная процедура повторяется снова. Затем проверяют план на оптимальность. Условие оптимальности выполняется и план оптимален. По оптимальному плану с первого пункта хранения в четвертый магазин должны поступить 400т товара, со второго пункта во второй магазин -200т, а в третий - 500т, таким образом, все товары из пункта №2 будет вывезены. С третьего пункта хранения в первый магазин должен поступить -700т, в третий -100 т и в четвертый магазин - 400т товара. Тема 7: Двойственные задачи и их свойства 1.Взаимно двойственные задачи линейного программирования и их свойства. 2. Объективно обусловленные оценки и их смысл Компоненты оптимального решения двойственной задачи называются оптимальными оценками исходной задачи. Л.В. Канторович называл их объективно обусловленными оценками. Объективно обусловленные оценки ресурсов определяют степень дефицитности ресурсов: по оптимальному плану производства не дефицитные ресурсы получают ненулевые оценки, а дефицитные – нулевые оценки. В оптимальный план производства могут попасть только неубыточные виды продукции. Значения оптимального решения двойственной задачи характеризуют устойчивость по отношению к изменениям правых частей ограничений. Это определяет их важную роль в экономическом исследовании при анализе последствий изменения правых частей задачи. Можно сказать, что условные оценки ресурсов показывают, на сколько денежных единиц изменится максимальная прибыль (выручка) от реализации продукции при изменении запаса соответствующего ресурса на одну единицу. Двойственные оценки могут служить инструментом анализа и принятия правильных решений в условиях постоянно меняющегося производства. Так, например, с помощью объективно обусловных оценок ресурсов возможно сопаставление оптимальных затрат и результатов производства. Посредством двойственных оценок можно определить роль каждого ограничения в задаче, а также область устойчивости найденного оптимального решения. В качестве примера рассмотрим предыдущую задачу .Для любой задачи линейного программирования существует другая двойственная задача . По поводу двойственной задачи имеется достаточно литературы. Поэтому сразу напишем двойственную задачу для исходной задачи (5.20-5.21). Только отметим, что здесь переменными величинами могут быть оценки уi- приписываемые каждому виду ресурсов. Они должны быть такими, чтобы общая сумма всего имеющегося количества ресурсов была минимальной, но при условии, что суммарная оценка ресурсов, расходуемых на единицу любого вида продукции, будет не меньше, чем цена за эту единицу. Приведем двойственную задачу. У1+ У2 + 1,7 У3 200 70 У1+ 20У2 + 4 У3 У1+ 0,9У2 + 1,6У3 350 300 (5.22) Fmax=580У1+2700У2+1200У3 (5.23) У1 0, У2 0 , У3 0. (5.24) В задаче У1, У2, У3 обозначают условные цены соответственно 1га пашни, 1 чел.дни. и 1 ц.д.в. удобрений в условиях данного хозяйства. В литературе известно, что из двух взаимодвойственных задач достаточно решить одну и при этом будет получено решение другой. Так как у нас уже решена исходная задача, то значения двойственных переменных оптимального плана задачи (5.22-5.24) могут быть получены из последней строки симплексной таблицы 3. Тогда У1=278,7, У2=0, У3=12,3. Целевая функция двойственной задачи, согласно первой теореме двойственности принимает на оптимальном плане минимальное значение, совпадающее с максимальным значением целевой функции исходной задачи. Поэтому Fmin =179678 тг. Получив решение двойственной задачи можно определить обусловленные оценки имеющихся ресурсов. Значение У1=278,7 показывает, что для данного хозяйства наиболее дефицитным является пашня. В случае неиспользования 1га пашни хозяйство недополучит прибыли в сумме 278.7 тг. И наоборот, увеличение использования пашни на 1га позволит в условиях данного хозяйства увеличить прибыль на 278,7 тг. Нулевое значение переменной У2 говорит о том, что трудовые ресурсы имеются в избытке, это естественно когда везде безработица. Увеличение наличия трудовых ресурсов не принесет прибыли и из решения видно, что недоиспользование трудовых ресурсов составит 14 чел. -дней. Значение У3=12,3 тг. показывает уменьшение прибыли, если хозяйство недоиспользует 1ц.д.в. удобрений и наоборот. Из последней таблицы видно, что ресурсы, как пашня и удобрения, используются полностью, поскольку им соответствуют отличные от нуля значения двойственных оценок. Теперь рассмотрим более подробно последнюю симплекс таблицу. Коэффициенты столбца Х1 показывают, что в случае введения в посевы 1га зерновых при сохранении неизменными всех других условий, посевы свеклы увеличиваются на 0,04га, а подсолнечника на 0,95га, при этом неиспользованных трудовых ресурсов увеличится на 0,75 чел. дней. Величина прибыли в этом случае сократится на 102,1тг. Недоиспользование 1га пашни (Х4) приводит к следующим изменениям в распределении ресурсов: на 1,75 га сокращается площадь под подсолнечник, на 0,7 га увеличится площадь под свеклу. За счет этого на 12,5 чел.дней больше используются трудовые ресурсы. Величина прибыли уменьшится на 278,7 тг. По столбцу Х6 уменьшение использования удобрения на 1ц.д.в. вызывает уменьшение общей прибыли на 12,3 тг. При этом, чтобы сохранить в данных условиях оптимальность плана, необходимо площадь свеклы уменьшить на 0,44га, а площадь подсолнечника увеличить на 0,47 га. И эти изменения повлекут за собой увеличение трудовых ресурсов на 8,37 чел. дней. Дальше рассмотрим устойчивость оптимального плана. По оптимальному плану возделывания зерновых невыгодно при получении с 1га. 200тн. прибыли. Переменная Х1 не входит в базис, ее оценка Z1-С1=Z1-200=102,1 (5.25) Для того, чтобы переменная Х1 была включена в базис, необходимо назначить С 1 так, чтобы оценка этой переменной стала величиной неположительной, т.е. Z1 -Z 1 0 Используя соотношение (5.25), получим 71 С 1 102,1+200=302,1 Таким образом, если прибыль, получаемая с 1га зерновых будет превышать 302,1 тг., то только тогда будет выгодно возделывать зерновые. Теперь рассмотрим, как может изменяться прибыль с 1га свеклы С 2, чтобы производство этой культуры оставалось выгодным . План будет оптимальным, если Zj-C j 0 (j=1, 4, 6) 0(-0.75) +300 0.95 + С 2(-0.04)-200 0 0 12.5 +300 1.75 + С 2 (-0.7)- 0 0 (5.26) 0 (-8.37)+300 (-0.47)+ С 2 0.44-0 0 Отсюда С 2 должно удовлетворять условиям 320 С2 750 Производство свеклы будет оптимальным, если прибыль с 1га будет ниже на 30 тг., чем при первоначальном варианте. Это говорит об устойчивости оптимального плана. Проверим на устойчивость оптимального плана на подсолнечнике (Х3) Z3 - С 3 0 (j= 1, 4, 6.) 0(0.75) + С 3 0.95 + 350(-0.04)-200 0 0 12.5 + С 3 1.75 +350 (-0.7) - 0 0 (5.27) 0(-8.37) + С 3 (- 0.47)+ 350 (0.44) - 0 0 Отсюда, 140 С 3 328 Аналогично границы значения прибыли с 1га подсолнечника показывают, что производство этой культуры остается выгодным Таким образом, экономико-математический анализ оптимального плана предусматривает вариантные расчеты, а также использование двойственных оценок как инструмента измерения эффективности приращения объемов ресурсов в границах устойчивости плана, т.е. в конкретных условиях данной задачи. С их помощью выявляются «узкие места», они указывают меру дефицитности или же избыточности ресурсов в отношении принятого в задаче показателя критерия оптимизации. Кроме того, с помощью коэффициентов замещения определяются как границы устойчивости плана, так и его новая структура при изменении основных условий функционирования системы. Иногда разработка моделей ограничивается теоретической стороной, недостаточно учитывается тот факт, что, как правило, математическая модель не может быть применена к решению конкретной практической проблемы в стандартной форме, и необходима ее спецификация, базирующаяся на глубоком изучении моделируемого процесса с помощью и при участии специалистов конкретной области. При этом нужно, чтобы эта специфика учитывалась на всех стадиях внедрения задач и осуществлялась непрерывная проверка и корректировка. Поэтому к оптимизационным задачам зачастую предъявляются требования однозначного, окончательного и исчерпывающего результата. В этом случае целесообразно рассматривать возможность разработки более простых моделей с приданием им адаптивных свойств- оперативного включения новых факторов, а учет связей между моделями передать подготовленному пользователю, работающему в режиме диалога. Также качественно новые модели смогут, вероятно, описать более широкий спектр реальных процессов, позволяя преодолеть излишнюю жесткость (малую вариантность предлагаемых решений) существующих постановок. В условиях функционирования в реальном масштабе времени решающей становится несходимость к оптимуму, а быстрота получения ответа с достаточной для практики точностью и возможностью оценить порядок погрешности. Использование таких моделей позволит, по видимому, успешно сочетать новые методы с традиционными процедурами планирования, технико-экономическим анализом. Таким образом, совершенствование системы планирования отрасли сельского хозяйства на основе применения математических методов и средств вычислительной техники особенно 72 эффективно, если разработать и использовать систему математических моделей, охватывающих все стороны маркетингового исследования деятельности агробизнеса. Тема 8: Транспортная задача 1.Постановка транспортной задачи, закрытые, открытые задачи. Алгоритм приведения окрытой задачи к закрытой. 2. Построение начального опорного плана: Метод северо-западного угла. Метод наименьшего элемента. Решение транспортной задачи методом потенциалов Цель задачи транспортной задачи – минимизация транспортных затрат при перевозках товаров из пунктах хранения на магазины. Требуется принять решение по объемам перевозки товаров из пунктов хранения по каждому магазину, с учетом цели задачи. Постановка экономико-математической модели. 1. В качестве переменных хij взять количество перевозимых товаров в день из трех пунктах хранения на 4 магазинах. Модель транспортной задачи состоит из целевой функции и из двух типов ограничений. Первый тип ограничений связан с запасами пунктов хранения, а второй тип связан с потребностями в товарах магазинов. Составим математическую модель. 2.Математическая запись. Целевая функция; Fmin= 18х11+12х12+13х13+7х14+17х21+10х22+ 11х23+13х24+15х31+11х32+10х33+9х34 Ограничение по вывозимому товаров из пунктов хранения. х11 х12 х13 х14 400 х21 х22 х23 х24 700 х31 х32 х33 х34 1200 Ограничение по потребности в товарах магазинов. х11 х12 х13 х14 х 21 х 22 х 23 х 24 х31 х32 х33 х34 700 200 600 800 Для решение задачи на компьютере переменных обозначаем по сквозной номерации. Тогда х11=х1, х12=х2, х13=х3, х14=х4, х21=х5, х22=х6, х23=х7, х24=х8, х31=х9, х32=х10, х33=х11, х34=х12. Напишем модель с новыми обозначениями переменных. Математическая модель Fmin=18х1+12х2+13х3+7х4+17х5+10х6+11х7+13х8+15х9+11х10+10х11+9х12 х1 х2 х3 х4 400 х5 х6 х7 х8 700 х9 х10 х11 х12 1200 Ограничение по потребности в товарах магазинов. 73 х1 х2 х3 х4 х5 х6 х7 х8 х9 х10 х11 х12 700 200 600 800 Затем на основании исходных данных математической задачи построим электронную таблицу для решения задачи используя процедуру Поиск решения. Форма записи приведена на рисунке 5.11 Рисунок 5.11 Необходимо ввести зависимости из математической модели. Эти зависимости представляют собой левые части ограничений и целевую функцию. Данную операцию можно выполнить с помощью Мастер функции из категории Математические СУММПРОИЗ (рисунок 5.12-5.13). 74 Рисунок 5.12 Рисунок 5.12 По процедуре Поиск решения введем необходимые значения целевой функции, изменяемых ячеек, ограничений в поле Равной и установим минимальное значение целевой функции (рисунок 5.13). 75 Рисунок 5.13 Нажав на клавишу Параметры, выберем Линейную модель, нажмем ОК и Выполнить. Результат оптимизации показан в таблице 5.14. Рисунок 5.14 Таким образом, математическая постановка данной транспортной задачи состоит в нахождении такого неотрицательного решения системы линейных неравенств, при котором целевая функция принимает минимальное значение. 76 Финансовая математика Тема 9: Понятия сложных процентов, наращивание и дисконтирования в финансовых расчетах 1. Простые учетные ставки и ставки ссудных процентов 2. Сложные учетные ставки и ставки ссудных процентов 3. Принцип эквивалентности процентных ставок 4. Учет инфляционного обесценения денег При изложении материала далее используются следующие термины и обозначения: Процентные деньги (англ. interest money), называемые часто коротко "проценты", представляют собой абсолютный доход от предоставления долга. Этот доход принято исчислять в сотых долях от размера вложенной суммы, то есть в процентах (от лат. pro centum – за сто). PV – текущая стоимость (англ. present value) – исходная сумма долга или оценка современной величины денежной суммы, поступление которой ожидается в будущем, в пересчете на более ранний момент времени. FV – будущая стоимость (англ. future value) – сумма долга с начисленными процентами в конце срока. R – ставка процента (англ. rate of interest) является относительным показателем эффективности вложений (норма доходности), характеризующим темп прироста стоимости за период. N – срок погашения долга (англ. number of periods) – интервал времени, по истечении которого сумму долга и проценты нужно вернуть. Срок измеряется числом расчетных периодов – обычно равных по длине подынтервалов времени, в конце которых регулярно начисляются проценты. Процентная ставка R = (FV – PV) / PV измеряет уровень доходности отнесением абсолютного эффекта (полученного дохода в виде суммы процентных денег, начисленных за весь срок) к исходной сумме долгового обязательства PV. Интересно, что до социалистической революции в России слово "интерес" употреблялось как финансовый термин для обозначения суммы процентного дохода. Если соотнести сумму процентов (FV – PV) не с PV, а с будущей стоимостью FV, наращенной по мере присоединения процентов, то получится другая мера эффективности – темп снижения D = (FV – PV) / FV, называемый в финансах учетной ставкой (англ. discount rate), или нормой банковского дисконтирования. Дисконтом в данном случае называется скидка в цене при продаже долгового обязательства (ценной бумаги) ниже номинала. Задание Выразите процентную ставку R через учетную ставку D, используя соотношение R= Пример. Вы заняли сегодня 4 руб., дав обязательство вернуть к указанной дате 5 руб. Оценим доходность этой сделки для кредитора показателями нормы процента R и учетной ставки D, приняв весь период между двумя моментами времени за полный срок договора, приняв его за единицу времени N=1. PV = 4 руб., FV = 5 руб., FV – PV = 5 – 4 = 1 руб., R = 1/4 = 25%, D = 1/5 = 20%. Пример. Банк привлек денежные средства клиента в сумме 376 000 руб., в обмен на вексель (долговое обязательство) по предъявлении номиналом 509 500 руб., который через 6 дней был погашен. Процентный доход клиента за 6 дней составляет 509 500 – 376 000 = 133 500 руб. Процентная ставка за 6 дней 133 500 / 376 000 = 35,51%. За 1 день 35,51% / 6 = 5,9%. Учетная ставка за 6 дней 133 500 / 509 500 = 26,20%. За 1 день 26,20% / 6 = 4,4%. 77 Простые проценты начисляются по ставке R на одну и ту же постоянную базу - исходную сумму долга PV, что за счет многократного прибавления постоянной величины процентного дохода за один период приводит к росту за полный срок N периодов по закону арифметической прогрессии. Множитель наращения по правилу простых процентов равен . Он показывает будущую стоимость одной денежной единицы, вложенной сроком на N периодов при начислении в конце каждого из них процентного дохода по ставке R без капитализации начисленных ранее процентов. Таблица 1 Наращение и изъятие дохода при начислении простых процентов Год Сумма вклада в начале года (руб.) Будущая стоимость (сумма на счете в конце года) при по ставке R = 15% годовых (руб.) Процентный доход (снят со счета в конце года) (руб.) Остаток на счете (руб.) 1 10 000 11 500 = (1+0,15) 1 500 10 000 2 10 000 11 500 = (1+0,15) 1 500 10 000 3 10 000 11 500 = (1+0,15) 1 500 10 000 Номинальные процентные ставки традиционно объявляются на период, равный одному календарному году N = 1, а срок более короткой финансовой операции измеряется обыкновенной дробью – долей года , 0 < N < 1, которую получают как отношение срока операции t к длине целого года. Если учитывается точное число дней в году (T=365 или 366), то говорят о начислении точных процентов. При расчете обыкновенных процентов год округляется до 360 = 12 месяцев по 30 дней. Срок операции t можно рассматривать точно или приблизительно. Пример. Денежные средства в сумме 20 тыс.руб. приняты Банком в срочный вклад на 3 месяца. Найдем будущую стоимость вклада при начислении процентов по ставке R = 29% годовых. обыкновенные проценты с приближенным числом дней тыс. руб. обыкновенные проценты с точным числом дней тыс. руб. точные проценты с точным числом дней тыс. руб. 78 Для точного расчета срока финансовой операции необходимо знать порядковые номера всех дней в году. Тогда срок t находится как разность номеров дней заключения и окончания договора (в расчет процентов по вкладам добавляется еще один день, то есть полностью включаются все дни срока). Например, если долг образовался сегодня, а погашаться будет завтра, то следующие друг за другом даты отличаются на 1, а срок долгового обязательства, используемый при начислении процентов, при включении в него дат начала и окончания договора составляет 2 дня. При докомпьютерной технологии организации расчетов для ускорения вычислений используют справочную таблицу, подобную табл. 2. Таблица 2 Порядковые номера дней в невисокосном году Месяц 1 2 3 4 5 6 7 8 9 10 11 12 1 1 32 60 91 121 152 182 213 244 274 305 335 2 2 33 61 92 122 153 183 214 245 275 306 336 3 3 34 62 93 123 154 184 215 246 276 307 337 4 4 35 63 94 124 155 185 216 247 277 308 338 5 5 36 64 95 125 156 186 217 248 278 309 339 6 6 37 65 96 126 157 187 218 249 279 310 340 7 7 38 66 97 127 158 188 219 250 280 311 341 8 8 39 67 98 128 159 189 220 251 281 312 342 9 9 40 68 99 129 160 190 221 252 282 313 343 10 10 41 69 100 130 161 191 222 253 283 314 344 11 11 42 70 101 131 162 192 223 254 284 315 345 12 12 43 71 102 132 163 193 224 255 285 316 346 13 13 44 72 103 133 164 194 225 256 286 317 347 14 14 45 73 104 134 165 195 226 257 287 318 348 15 15 46 74 105 135 166 196 227 258 288 319 349 16 16 47 75 106 136 167 197 228 259 289 320 350 17 17 48 76 107 137 168 198 229 260 290 321 351 18 18 49 77 108 138 169 199 230 261 291 322 352 19 19 50 78 109 139 170 200 231 262 292 323 353 20 20 51 79 110 140 171 201 232 263 293 324 354 21 21 52 80 111 141 172 202 233 264 294 325 355 22 22 53 81 112 142 173 203 234 265 295 326 356 23 23 54 82 113 143 174 204 235 266 296 327 357 24 24 55 83 114 144 175 205 236 267 297 328 358 25 25 56 84 115 145 176 206 237 268 298 329 359 26 26 57 85 116 146 177 207 238 269 299 330 360 27 27 58 86 117 147 178 208 239 270 300 331 361 28 28 59 87 118 148 179 209 240 271 301 332 362 29 29 88 119 149 180 210 241 272 302 333 363 30 30 89 120 150 181 211 242 273 303 334 364 31 31 90 212 243 число 151 79 304 365 Пример. Вы заняли 21 февраля 40 тыс.руб., обязавшись вернуть 23 августа сумму долга с точными простыми процентами по ставке 50% годовых. По табл. 2 определяем номера дней. 21 февраля – это 52 день года, а 23 августа – 235 по счету день, если год невисокосный. Тогда t = (235 – 52) + 1 = 183 + 1 = 184 дня. 23 августа следует вернуть кредитору сумму тыс. руб. Пример. 27 сентября 2000 года молодая семья разместила временно свободные денежные средства в сумме 40 тыс. руб. во вклад сроком 120 дней по ставке 9% годовых (см. табл. 3), предпочтя этот вариант двум индивидуальным вкладам по 20 тыс. руб. каждый. Когда заканчивается срок вклада? Дата 27 сентября внутри года имеет порядковый номер 270. До конца года пройдет (365 – 270) + 1 = 96 дней. В 2001 г. вклад пролежит в Банке 120 – 96 = 24 дня. 24 января можно снять сумму срочного вклада с процентами. До момента явки вкладчика за деньгами средства переводятся на счет до востребования. Множитель наращения по ставке 8% = Множитель наращения по ставке 9% = Выигрыш от инвестирования 40 тыс. руб. по более высокой ставке = 131 руб. 51 коп. = Увеличение процентной ставки при удлинении срока депозита связано с тем, что, доверяя Банку свои сбережения на длительное время, клиенты ожидают получить компенсацию за повышение риска невозврата долга за счет повышения доходности сделки. Графическое представление зависимости доходности вложений от их срока принять называть "кривой доходности"3. Форма кривых доходности, построенных на рис.1 по данным табл. 3 о ставках вкладов в сумме свыше 30 тыс. руб. с начислением процентов в конце срока указывает на то, что в данном случае, привлекая средства на более длительное время, Банк меньше платит за риск, связанный со сроком, чем по более коротким депозитам. Таблица 3 Срок 20 марта 2000 года 25 сентября 2000 года Порядок начисления От 15 до 30 тыс. От 15 до 30 Свыше 30 тыс. процентов Свыше 30 тыс. руб. руб. тыс. руб. руб. 31 день в конце срока 10,0 11,0 4,5 5,0 60 дней в конце срока 18,0 20,0 5,5 6,0 91 день ежемесячно 20,5 21,5 7,4 7,9 91 день в конце срока 21,0 22,0 7,5 8,0 120 дней ежемесячно 22,0 23,0 7,9 8,9 120 дней в конце срока 23,0 24,0 8,0 9,0 80 Рис. 1. Кривая доходности. Пример. Иван Спиридонович сделал 3 августа 1999 г. депозитный вклад в сумме 50 тыс. руб. на срок 365 дней по ставке 36% годовых, а Василий Семенович, ожидая роста процентных ставок по вкладам физических лиц в коммерческих банках, разместил такую же сумму на срок 120 дней, и затем дважды оформлял через 120 дней новый вклад, реинвестируя полностью исходную денежную сумму вместе с начисленными за 4 месяца процентами. Используя табл. 2, определите дату окончания срока последнего (третьего) вклада Василия Семеновича на 120 дней? Иван Спиридонович 3 августа 2000 г. может получить 50 тыс. руб., так как снижение Банком процентных ставок не распространяется на ранее заключенные срочные договора. Решение Василия Семѐновича привело к такому финансовому результату (см. табл. 4). Таблица 4 Реинвестирование вклада под простые проценты Дата Процентная ставка Множитель наращения Будущая стоимость 03/08/99 34% 1,11333 55,667 01/12/99 32% 1,23209 61,604 30/03/00 24% 1,33066 66,533 В данном случае за 360 дней средняя процентная ставка как годовой темп прироста в данном случае составила (66,533 – 50,000) / 50,000 = 33% годовых. Ожидаемая вкладчиком выгода реинвестирования процентного дохода не была получена как в результате изменения условий приема вкладов, так и за счет более низкой ставки привлечения средств Банком на короткий срок. Задание Оцените результат реинвестирования в условиях данного примера при сохранении процентной ставки по вкладам сроком на 120 дней на постоянном уровне R = 120% годовых. 81 Реинвестирование процентного дохода по постоянной ставке R является ступенчатым приближением к показательному росту по правилу сложных процентов обозначено число моментов реинвестирования. , где буквой M При заключении между должником и кредитором финансового договора на срок, превышающий один расчетный период (N > 1) выбор базы для дальнейшего начисления процентов имеет принципиальное значение. Применение постоянной ставки начисления к постоянной базе дает рост по правилу простых процентов – арифметическую прогрессию с постоянной разностью, равной процентному доходу за период. В краткосрочных операциях на срок до года (N < 1) чаще используется правило простых процентов. Сложные проценты характеризуются тем, что база начисления растет в результате регулярного присоединения к ней процентных денег, причитающихся кредитору за предыдущие расчетные периоды. Получается геометрическая прогрессия с постоянным знаменателем, равным множителю наращения (1 + R) за один период по ставке процентов R. Таблица 5 Наращение и присоединение дохода при начислении сложных процентов Год Сумма вклада в Будущая стоимость (сумма в конце года) начале года при по ставке R = 15% годовых (руб.) (руб.) Процентный доход (присоединен к сумме вклада в конце года) (руб.) Остаток на счете (руб.) 1 10 000 1 500 11 500 2 11 500 1 725 13 225. 3 13 225 1 984 15 209 11 500 = 13 225 = 15 209 = Множитель наращения сложных процентов за полный срок N периодов по процентной ставке R за каждый является основным финансовым коэффициентом и показывает будущую стоимость 1 денежной единицы, вложенной на N периодов под сложные проценты, начисляемые в по ставке R. Для обозначения данного финансового коэффициента используется стандартная аббревиатура FVIF (от англ. Future Value Interest Factor – процентный множитель будущей стоимости). Будущая стоимость определяется умножением размера первоначально инвестированной суммы на этот коэффициент . 82 Рис. 2. Рост при начислении простых и сложных процентов по одинаковой ставке R. Геометрический рост по правилу сложных процентов при N > 1 обгоняет арифметическую прогрессию простых процентов. Так, трижды заработав на вложенные 10 тыс. руб. проценты по 1,5 тыс. руб. в год, вкладчик имеет в конце срока = 14,5 тыс. руб., тогда как а наращение сложными процентами приносит ему будущую стоимость 15,209 тыс. руб. При удлинении срока вклада эта тенденция усиливается (см. рис. 2). Эффективным годовым процентом называется процентный доход, получаемый инвестором за один год в результате вложения одной денежной единицы по номинальной годовой ставке сложных процентов R при частоте начисления m раз в год. . Абсолютная величина эффективного процента, отнесенная к одной целой денежной единице, дает годовую эффективную норму процента. Эффективная доходность вложений является инструментом приведения условий финансовых контрактов к сопоставимому виду. В современных условиях в связи с развитием систем электронных платежей проценты могут начисляться даже чаще, чем один раз в день. При бесконечно частом ( ) дроблении года на малые процентные периоды, то есть при непрерывном наращении сложных процентов получается показательный закон роста , так как при Номинальную годовую процентную ставку R, являющуюся показателем степени в формуле множителя непрерывного наращения, называют интенсивностью, или силой роста. Она связана с годовой эффективной нормой процента соотношением начисления сложных процентов за N лет . Будущая стоимость после непрерывного 83 Конечный случай называют дискретным начислением процентов. На реальную доходность вложений существенно влияет изменение покупательной способности денег за период, охватываемый финансовой операций. Процесс падения покупательной способности бумажных денег вследствие дополнительной эмиссии или по причине сокращении товарной массы при сохранении неизменного количества денег в обращении называется инфляцией (от лат. influtio – вздутие). Инфляция проявляется в повышении стоимости жизни и росте цен. Рис. 4. Сравнительная динамика индекса цен и валютного курса в 2000 г.4 Одним из подходов к измерению реальной покупательной способности фиксированной денежной суммы по прошествии срока N является соотнесение ее с уровнем инфляции за N периодов. В каждом последующем инфляционном периоде обесцениваются уже ранее обесцененные деньги, поэтому реальная величина будущей стоимости , независимо от правила начисления процентов, применяемого для ее наращения, находится делением на цепной темп роста . С учетом инфляции реальная эффективная доходность I определяется по эффективной годовой ставке R и уровню инфляции h из условия как и в странах с низкой инфляцией знаменатель этой дроби в расчетах принимают иногда равным единице. Уровнем инфляции h называется темп прироста индекса цен5 за выбранный период. Другим методом измерения инфляции, широко использовавшимся в России до 2000 г, является учет колебаний валютного курса (покупательная способность на один товар – иностранную валюту). Как видно выше на рис.4, к концу 2000 г. индекс потребительских цен заметно обогнал курс доллара США, который был стабилизирован и перестал быть индикатором инфляции. Тема 10: Кредитные расчеты (потоки платежей) 1. Основные понятия 2. Финансовые ренты (аннуитет) 3. Погашение долга равными суммами Нерегулярные потоки платежей 84 Аннуитетом называется поток платежей одинакового размера, поступающих через равные промежутки времени. Период времени между двумя последовательными платежами является расчетным при начислении процентов. Рис. 49. Тип аннуитета задает распределение n платежей одинакового размера по границам процентных периодов внутри срока аннуитета. В зависимости от момента поступления первого платежа различают два типа потоков платежей – пренумерандо (первый платеж в начале первого периода) и постнумерандо (в конце). За счет более раннего поступления денежных средств и удлиненного на один период срока начисления процентов в случае пренумерандо можно достигнуть больших финансовых результатов по сравнению с потоком платежей, вносимых в конце периода. Пример. Пять платежей по три рубля каждый нужно внести по схеме пренумерандо. Получатель аннуитета использует эти средства с доходностью R = 8% за период между платежами. Какова будущая стоимость FV этого срочного аннуитета (срок n = 5) в конце пятого периода в результате начисления процентов на все поступившие платежи? Обозначим размер одного платежа буквой A. Тогда В условиях нашего примера поток платежей пренумерандо позволяет их получателю накопить сумму 19,01 руб., а в случае аннуитета постумерандо она бы составила только 17,60 руб. (см. рис. 50) . Рис. 50. Вычисление будущей стоимости каждого платежа и аннуитета пренумерандо в конце срока. Формула текущей стоимости срочного аннуитета постнумерандо для n < выводится как разница текущей стоимостей двух бессрочных аннуитетов. Из текущей стоимости на момент времени 0 вечной ренты постнумерандо вычитается текущая стоимость такой же вечной ренты, начинающейся на n периодов 85 позже. Вторая стоимость численно равна первой, но относится к моменту времени n, поэтому перед вычитанием еѐ необходимо дисконтировать по той же ставке R на n периодов в прошлое. Эквивалентная ей в конце срока будущая стоимость срочного аннуитета постумерандо есть Процентный множитель будущей стоимости аннуитета FVIFA(R,n) – Future Value Interest Factor of Annuity является основным финансовым коэффициентом, который показывает, какую сумму можно накопить, постоянно получая выплаты единичного размера в течение срока n при начислении R % сложных за каждый период на уже аккумулированные денежные средства. Процентный множитель текущей стоимости аннуитета PVIFA(R,n) – Present Value Interest Factor of Annuity также является финансовым коэффициентом, и показывает, какую сумму достаточно инвестировать в начальный момент времени, чтобы потом регулярно в течении срока, состоящего из n процентных периодов получать платежи единичного размера с учетом начисления на оставшиеся денежные средства R% сложных за период. Знакомство с условностями автоматизации финансовых расчетов в среде процессора электронных таблиц начнем со встроенной функции =FV(rate; nper; pmt; pv; type) =БЗ(норма; число_периодов; выплата; нз; тип) в исходной русификации =БС(ставка; кпер; плт; пс; тип) в новейшей русификации. Пример. Господин Иванов в конце каждого месяца переводит 1000р. за счет в банк, начисляющий ежемесячно сложные проценты по номинальной ставке 9% годовых. Какая сумма накопится на счете за два года, при сохранении на это время всех указанных условий без изменения? Рис. 51. Применение функции БЗ=FV для расчета будущей стоимости аннуитета. Таблица 13 Аннуитетные финансовые функции в исходной русификации Показатель Встроенная функция Excel 86 Будущая ценность БЗ(норма;число_периодов;выплата;нз;тип) Future value FV(rate;nper;pmt;pv;type) Сегодняшняя ценность ПЗ(норма;кпер;выплата;бс;тип) Present value PV(rate;nper;pmt;fv;type) Периодический платеж ППЛАТ(норма;кпер;нз;бс;тип) Payment PMT(rate;nper;pv;fv;type) Количество периодов КПЕР(норма;выплата;нз;бс;тип) Number of periods NPER(rate;pmt;pv;fv;type) Процентная ставка НОРМА(кпер;выплата;нз;бс;тип;предположение) Interest rate RATE(nper;pmt;pv;fv;type;guess) Таблица 14 Аннуитетные финансовые функции в новейшей русификации Показатель Встроенная функция Excel 2002 Будущая ценность БС(ставка;кпер;плт;пс;тип) Future value FV(rate;nper;pmt;pv;type) Сегодняшняя ценность ПС(ставка;кпер;плт;бс;тип) Present value PV(rate;nper;pmt;fv;type) Периодический платеж ПЛТ(ставка;кпер;пс;бс;тип) Payment PMT(rate;nper;pv;fv;type) Количество периодов КПЕР(ставка;плт;пс;бс;тип) Number of periods NPER(rate;pmt;pv;fv;type) Процентная ставка СТАВКА(кпер;плт;пс;бс;тип;предположение) Interest rate RATE(nper;pmt;pv;fv;type;guess) Выполним расчет будущей стоимости аннуитета поэтапно. Ниже, на рис. 52, в восьмой строке таблицы рабочего листа дан формат вызова функции =БЗ, возвращающий то же самое числовое значение, которое в ячейке седьмой строки найдено по рекуррентным формулам. 87 Рис. 52. "Аннуитетный треугольник" постнумерандо. В зависимости от выбора пользователем из полного списка аргументов встроенной функции =БЗ(норма; число_периодов; выплата; нз; тип) подмножества тех аргументов, значения которых известны в задаче, можно с помощью одной и той же функции посчитать и наращенную сумму вклада, и будущую стоимость аннуитета, причем с переключением формул между типами потоков платежей постнумерандо и пренумерандо. Рассмотрим полностью возможные варианты. 1,46 р. = FV(0,1;4;0;-1;0) =FV(0,1;4;0;-1;0) =FV(0,1;4;;-1) – будущая стоимость одного вложенного рубля (нз=-1) после четырех раз (число_периодов=4) присоединения к нему процентных денег, начисляемых в конце периода по ставке сложных процентов 10% (норма=0,1) без дополнительных поступлений и выплат. В связи с полным отсутствием в течение срока промежуточного потока платежей нет смысла уточнять и момент их поступления в нулевом размере (тип=0, значение используется по умолчанию). 1,61 р. =FV(0,1;5;0;-1;0) =FV(0,1;5;0;-1;0) =FV(0,1;5;;-1) – будущая стоимость одного вложенного рубля (нз=-1) после пяти раз (число_периодов=5) присоединения к нему процентных денег, начисляемых в конце периода по ставке сложных процентов 10% (норма=0,1) без дополнительных поступлений и выплат (выплата=0, тип=0). 6,11 р. = FV(0,1;5;-1;0;0) = FV(0,1;5;-1;0;0) =FV(0,1;5;-1) – будущая стоимость потока пяти периодических платежей (число_периодов=5) единичного размера, вносимых (выплата=-1) регулярно в конце периода (потоку постнумерандо соответствует тип=0, значение используется по умолчанию) при начислении 10% сложных (норма=0,1) за период между моментами внесения платежей на поступившие ранее средства. 6,72 р. = FV(0,1;5;-1;0;1) FV(0,1;5;-1;0;1) =FV(0,1;5;-1;;1) – будущая стоимость потока пяти периодических платежей (число_периодов=5) единичного размера (выплата=-1), поступающих в начале периода (потоку пренумерандо соответствует тип=1) при начислении за каждый период между платежами 10% сложных (норма=0,1). Пример. Молодой человек c пятнадцатилетнего возраста в конце каждого месяца регулярно вносит по 15 долл. на сберегательный счет в банк, начисляющий на всю растущую сумму сложные проценты по номинальной ставке 15% годовых. В каком возрасте этот человек может стать миллионером? Выразим срок (число периодических платежей) из формулы будущей стоимости аннуитета: 88 Рис. 55. Поведение заданного многочлена шестой степени от ставки R на интервале [0%; 10%]. Глядя на график этой функции, построенный на рис. 55 в зависимости от значений квартального процента R, можно предположить, что искомый ответ находится в районе 7–8% и подобрать его итеративно. Выявив графически интервал значений ставки, внутри которого находится ответ, например, [6%;11%], необходимо проверить подстановкой в условия задачи какую-нибудь внутреннюю точку, и по результатам проверки сузить область поиска, сдвинувшись левее или правее. Так постепенно с заданной точностью подбирается процент аннуитета. Встроенная функция финансовая функция RATE работает не по аналитической формуле (в общем случае ее не существует!), а обращается к процедуре итеративного подбора корней многочлена методом Ньютона3. Применение функции НОРМА=RATE для нахождения доходности аннуитета. 89 Сравнение графиков погашения долга. Сначала по аннуитетной формуле (здесь это сделано при помощи функции PMT) определяется сумма платежа – 75 137 тыс. руб. Затем каждый платеж разбивается на части следующим образом: PMT = PPMT + IPMT. Меньшая и постоянно уменьшающаяся часть платежа IPMT (от англ. interest payment): 24000, 19909, 15491, 10719 и 5566 соответствует процентам на остаток долга, который постепенно погашается. Долг уменьшается каждый раз не на всю сумму платежа, а только на его растущую часть PPMT (от англ. principal payment), остающуюся после уплаты процентов за непогашенный долг предыдущего периода: 1 кв.: 8%*300000=24000, погашение 75137–24000=51137, остаток 300000–51137=248863 2 кв.: 8%*248863=19909, погашение 75137–19909=55228, остаток 248863–55228=193635 3 кв.: 8%*193635=15491, погашение 75137–15491=59646, остаток 193635–59646=133989 4 кв.: 8%*133989=10719, погашение 75137–10719=64418, остаток 133989–64418= 69571 5 кв.: 8%* 69571= 5566, погашение 75137– 5566=69571, остаток 69571–69571= 0. Сумма всех частей платежа PPMT, погашающих долг, равна 300 тыс.руб. Дисконтированная же по ставке кредитования (процентная ставка в данном примере R = 8%) сумма платежей PMT также равна исходной сумме долга. Для расчета частей периодического платежа, размер которых зависит от текущего периода k, в Excel также имеются встроенные функции PPMT и IPMT (см. табл. 16). 90 Таблица 16 Функции для расчета двух переменных составляющих частей постоянной суммы платежа Показатель Встроенная функция Excel Часть платежа, идущая в зачет погашения основного долга ОСНПЛАТ(норма;период;кпер;тс;бс;тип) в исходной русификации ОСПЛТ(ставка;период;кпер;пс;бс;тип) в новейшей русификации Principal Payment PPMT(rate;k;nper;pv;fv;type) в оригинальной версии Часть платежа,равная процентной плате за остаток долга в данном периоде ПЛПРОЦ(норма;период;кпер;тс;бс;тип) в исходной русификации ПЛПРОЦ(ставка;период;кпер;пс;бс;тип) в новейшей русификации Interest Payment IPMT(rate;k;nper;pv;fv;type) в оригинальной версии Так, например, можно получить разбиение второго платежа на погашение основного долга – 55,228=PPMT(0,08;2;5;300) и процентную часть –19,909=IPMT(0,08;2;5;300). Можно предложить бесконечно много других способов разбиения во времени выплаты основного долга и процентов по нему на несколько частей. Одной из наиболее распространенных простых и стандартных схем, используемых в российской практике является равномерное погашение, при котором одинаковы не общие суммы платежей, а их только части, погашающие долг. Сумма нескольких равных частей, погашающих долг, равна исходной сумме долга. Тогда процентная часть считается по ставке за период умножением на равномерно убывающий долг, а размер каждого отдельного платежа выводится как сумма двух частей. Дисконтированная по ставке кредитования сумма платежей по-прежнему равна исходной сумме долга. Рис. Эквивалентность потоков платежей погашения долга по разным схемам. Обе рассмотренные схемы погашения долга: и равными платежами, и неравными, эквивалентны друг другу по начальной стоимости кредита. Это обстоятельство иногда используют в анализе инвестиционных проектов, вычисляя аннуитет (размер годового платежа), эквивалентный исходному денежному потоку в смысле равенства чистого дисконтированного дохода. При простом арифметическом суммировании всех платежей без дисконтирования эти потоки друг от друга отличаются, но с точки зрения экономической теории процента, такое "измерение дохода" за несколько периодов не имеет смысла, поскольку полагает цену денег во времени равной нулю, что на финансовом рынке невозможно. 91 Тема 11: Финансовые расчеты на рынке ценных бумаг 1. Доходность ценных бумаг. Курсы ценных бумаг 2. Расчет дивидендов и процентов по ценным бумага Рассмотрим пример: Акция номинальной стоимостью 300 тенге ежегодно приносит дивиденд в размере 60 тенге, а уровень ссудного процента — 6. По какому курсу эта акция будет котироваться на бирже? 1. Алгоритм Определяется процент дивиденда по акции 2. Определяется ссудный процент 3. Определяется курс акции по формуле: 100% Дивиденд * Курс акции = --------------------------Ссудный процент Акция номинальной стоимостью 1000 тенге ежегодно приносит дивиденд в размере 100 тенге, а уровень ссудного процента — 10. По какому курсу эта акция будет котироваться на бирже? 1. Определяется процент дивиденда по акции 2. Определяется ссудный процент 3. Определяется курс акции по формуле: Дивиденд * 100% Курс акции = --------------------------Ссудный процент Определите дисконтированную стоимость, если известно, что стоимость капитала на втором шаге расчета 100$, коэффициент дисконтирования на втором шаге 0,69, шаг расчета 2 1. Определение стоимости капитала на t – шаге расчета 2. 2. Расчет коэффициента дисконтирования 3. 3. Определение шага расчета 4. Расчет дисконтированной стоимости по формуле: К =Кt * dt Тема 12: Модели массового обслуживания в экономике и управлении 1. Одноканальные системы массового обслуживания с отказами. Примеры применения в экономике 2. Одноканальные системы массового обслуживания с ожиданием в описании бизнес процессов 3. Многоканальные системы массового обслуживания и их применение для анализа систем управления бизнес-процессов Теория массового обслуживания – область прикладной математики, занимающаяся анализом процессов в системах производства, обслуживания, управления, в которых однородные события повторяются многократно, например, на предприятиях бытового обслуживания; в системах приема, переработки и передачи информации; автоматических линиях производства и др. Предметом теории массового обслуживания (ТМО) является установление зависимостей между характером потока заявок, числом каналов обслуживания, производительностью отдельного канала и эффективным обслуживанием с целью нахождения наилучших путей управления этими процессами. Задачи ТМО носят оптимизационный характер и в конечном итоге включают экономический аспект по определению такого варианта системы, при котором будет обеспечен минимум суммарных затрат от ожидания обслуживания, потерь времени и ресурсов на обслуживание и от простоев каналов обслуживания. В ТМО нужно обслуживать кого-либо или что-либо, что определяется понятием «заявка (требование) на обслуживание», а операции обслуживания выполняется кем-либо или чем-либо, называемыми каналами (узлами) обслуживания. Заявки в силу массовости поступления на 92 обслуживание образуют потоки, которые до выполнения операций обслуживания называются входящими, а после возможного ожидания начала обслуживания, т.е. простоя в очереди, образуют потоки обслуживания в каналах, а затем формируется выходящий поток заявок. В целом совокупность элементов входящего потока заявок образует простейшую одноканальную систему массового обслуживания – СМО, структурная модель которой представлена на рис. 1. ВХОД СМО ВЫХОД Элементы Входной поток заявок, Ротк Очередь Роч Канал обслуживания Робс Выходной поток заявок Рисунок 7.1. Под системой понимается совокупность взаимосвязанных и целенаправленно взаимодействующих частей. Процедура обслуживания считается завершенной, когда заявка на обслуживание покидает систему. Продолжительность интервала времени, требуемого для реализации процедуры обслуживания, зависит в основном от характера запроса заявки на обслуживание, от состояния самой обслуживающей системы и канала обслуживания. Например, продолжительность пребывания покупателя в супермаркете зависит, с одной стороной, от личностных качеств покупателя, его запросов, от ассортимента товаров, который он собирается приобрести, а с другой – от формы организации обслуживания и обслуживающего персонала, что может значительно сократить пребывание покупателя в супермаркете и повысить интенсивность обслуживания. Например, внедрение единого узла расчета в универмаге дает следующие ощутимые преимущества покупателю. Так, если при традиционной форме расчетов время обслуживания одного покупателя составляло в среднем 1,5 мин, то при введении единого узла расчета –67 сек. из них 44 сек. уходят на оформление покупки в секции и 23 сек. непосредственно на расчеты за покупки при выходе из магазина. Если покупатель делает несколько покупок в разных секциях, то потери времени сокращаются при приобретении двух покупок в 1,4 раза, трех – в 1,9, пяти – в 2,9 раза. Любой запрос на удовлетворение какой либо потребности будем называть заявкой. Под обслуживанием заявок будем понимать удовлетволрение потребности. Обслуживание производится одним человеком, группой людей или техническими устройствами (автоматы). Совокупность средств, которые осуществляет обслуживание заявок, называется каналом обслуживания. По числу каналов СМО подразделяют на одноканальные и многоканальные. Заявки поступают в СМО не регулярно, а случайно, образуя так называемый случайный поток заявок. В качестве показателей эффективности СМО используются: среднее число заявок, обслуживаемых в единицу времени; среднее число заявок в очереди; среднее время ожидания обслуживания; вероятность отказа обслуживании без ожидания; вероятность того, что число заявок в очереди превысит определенное значение и т.п. СМО делят на два основных типа: СМО с отказами и СМО с ожиданием. СМО с ожиданием подраделяются на разные виды в зависимости от того, как организована очередь: с ограниченной и неограниченной длиной очереди. Для СМО с отказами характерно: время ожидания заявок в очереди Точ =0, поскольку по своей природе в таких системах существование очереди невозможно, то Lоч=0 и вероятность ее образования Роч =0. По числу заявок к определяется режим работы системы, ее состояние: при к=0 простой каналов, при 1<k<n обслуживание заявок, при к>n обслуживание и отказ. Показателями таких СМО являются вероятность отказа в обслуживании Ротк, вероятость обслуживания Робс, среднее время простоя канала tпр, среднее число занятых пз и свободных каналов псв, среднее время обслуживания tобс, абсолютная пропускная способность А. Для СМО с неограниченным ожиданием характерно, что вероятность обслуживания заявки Робс=1, Lоч, Точ бесконечно. В таких системах возможны следующие режимы работы: при 93 к=0 простой каналов, при 1<k<n обслуживание заявок, при к>n обслуживание и очередь. Показателями эффективности таких СМО являются среднее число заявок в очереди Lоч, среднее число заявок в системе к, среднее время пребывания заявки в системе Тсмо, абсолютная пропускная способность А. Для СМО с ожиданием с ограничением на длину очереди характерно, если число заявок в системе к=0, то простой каналов, при 1<k<n -обслуживание заявок, при n<к<=n+m - обслуживание и очередь, при к>n+m- обслуживание, очередь и отказ в ожидании обслуживания. Показателями эффективности таких СМО являются вероятность отказа в обслуживании Р отк, вероятость обслуживания Робс, среднее число заявок в очереди Lоч, среднее число заявок в системе Lсмо, среднее время пребывания заявки в системе Тсмо, абсолютная пропускная способность А. Таким образом, перечень характеристик СМО можно представить следующим образом: tобс - среднее время обслуживания; Точ - время ожидания в очереди; Тсмо- среднее время пребывания в СМО; Lоч –средняя длина очереди; Lсмо –среднее число заявок в СМО; п- количество каналов обслуживания; - интенсивность входного потока заявок; -интенсивность обслуживания; - интенсивность нагрузки; - коэффициент нагрузки; - относительная пропускная способность; А- абсолютная пропускная способность; Р0- вероятность простоя СМО; Роч - вероятность образования очереди; Ротк -вероятность отказа в обслуживании; Робс -вероятость обслуживания заявок; tпр - среднее время простоя канала; пз - среднее число занятых каналов; псв – среднее число свободных каналов; Кз - коэффициент загрузки каналов; Рассмотрим пример. 1. СМО – одноканальная система с отказами. Пример 1. Известно, что заявки на телефонные переговоры в справочном бюро поступают с интенсивностью =90 заявок в час, а средняя продолжительность разговора по телефону tобс =2 мин. Определить показатели эффективности работы СМО при наличии одного телефонного номера. Решение. В качестве показателей эффективности СМО с отказами будем рассматривать: - относительную пропускную способность или среднюю долюпришедщих заявок, обслуживаемых системой; А- абсолютную пропускную способность СМО или среднее число заявок, обслуживаемых в единицу времени; Ротк -вероятность отказа в обслуживании или долю заявок необслуженных системой. Определим интенсивность обслуживания =1/ tобс =1/2=0,5 заявок в минуту или 30 за 1 час. Относительная пропускная способность = /( + )= 30/(90+30)=1/4=0,25 т.е в среднем только 25% поступающих заявок принимается. Вероятность отказа в обслуживании Ротк= /( + )=90/120=0,75 т.е 75% заявок получат отказ. Абсолютную пропускную способность СМО или среднее число заявок, обслуживаемых в единицу времени А= /( + )=90*0,25=22,5 т.е в среднем в час будут обслужены 22,5 заявок. Многоканальная СМО с отказами Пример 2. В примере 1. можно определить оптимальное число телефонных номеров, если условием оптимальности считать удовлетворение в среднем из каждых 100 заявок не менее 90 заявок. 94 Решение. Интенсивность нагрузки канала = / =90/30=3 т.е за время среднего телефонного разговора tобс поступают в среднем 3 заявки. Будем постепенно увеличивать число каналов п=2, 3, 4, 5, 6,… Предельные вероятности определяется по формулам Р0= (1+ + 2/2!+…+ к/к!+…+ п/п!)-1 Р1= Р0, Р2= Р0* 2/2!, Р3= Р0* 3/3!, Рк= Р0* к/к!, Рп= Р0* п/п!, Вероятность отказа, что все п каналов системы будут заняты Ротк= Р0* п/п! Относительная пропускная способность – вероятность того, что заявка будет обслужена пропускная способность А= Среднее число занятых каналов =1-Ротк. Абсолютная К=А/ Например для п=2 Р0= (1+3+9/2)-1=0,118, =1-Ротк=1-0,118*32/2=0,471, А=90*0,471=42,4 Для п=3 Р0=(1+3+32/2+33/6)-1= 0,077, Ротк= Р0* п/п!= 0,077*33/6=0,35, =1-Ротк=1-0,35=0,65 =0,65*90=58,5 А= Значение характеристик для п=4, 5, 6, приведено в таблице 1. Характеристика обслуживания Р0 Ротк Робс пз Кз А 1 0,25 0,75 0,25 0,75 0,75 0,25 22,5 Число каналов 2 0,118 0,54 0,46 1,38 0,69 0,47 42,4 3 0,077 0,35 0,65 1,95 0,65 0,65 58,8 4 0,06 0,21 0,79 2,37 0,59 0,79 71,5 5 0,05 0,1 0,9 2,7 0,54 0,90 80,1 6 0,05 0,05 0,95 2,85 0,47 0,95 85,3 По условию оптимальности >0.9. следовательно необходимо установить 5 телефонных номеров. При этом в час будут обслуживаться в среднем 80 заявок. А среднее число занятых телефонных номеров К=А/ = 80/30=2,7 , т.е три телефона из пяти будут постоянно заняты. Одноканальная СМО с ограниченной длиной очереди. Пример 3. Специализированный пост диагностики представляет собой одноканальную СМО. Число стоянок для автомобили ожидающих проведения диагностики, ограниченно и равно 3. Если все стоянки заняты, т.е. в очереди уже находится три автомобиля, то очередной автомобиль, прибывший на диагностику, в очередь на обслуживание не становится. Интенсивность потока автомобилей, прибывающих на диагностику =0,85 (автомобиля в час) Время диагностики одного автомобиля t=1,05 Требуется определить вероятностные характеристики поста диагностики. Решение. 1) Интенсивность обслуживаний автомобилей =1/ tобс=1/1,05=0,952 2) Интенсивность нагрузки = / =0,85/0,952=0,893 3) Р0 = (1- )/(1- N+1)= (1-0.893)/(1-0.8935)=0.248 - вероятность простоя 4) Pотк =Р4= 4Р0=0,158- вероятность отказав обслуживаний 95 5) =1- Pотк =1-0,158=0,842 – относительная пропускная способность поста 6) А= =0,842*0,85= 0,716 – абсолютная пропускная способность поста за 1 час. Lср=( ( 1-(N+1) N+ N N+1)/(1- )(1- N+1)= = 0.893*(1-(4+1)*0.8934+4*0.8935)/(1-0.893)(1-0.8935)=1.77-среднее число автомобилей, находящихся на обслуживании и в очереди. 8) Среднее время пребывания автомобиля в системе: Ws=Ls/( (1-PN))=1.77/(0.85(1-0.158))=2.473 часа 9) Средняя продолжительность пребывания заявки в очереди на обслуживание: Wq = Ws-1/ =2.473-1/0.952=1.423 10) Среднее число заявок в очереди (длина очереди) Lq= (1-PN)* Wq=0.85(1-0.158)1.423=1.02 Работу рассмотренного поста диагностики можно считать удовлетворительной, так как пост диагностики не обслуживает автомобили в среднем в 15,8% случаев (Ротк=0,158). 7) Одноканальная СМО с ожиданием без ограничения на вместимость блока ожидания. Пример 4. Рассмотрим пример 3 с неограниченным количеством площадок для стоянки прибывающих на обслуживание автомобилей, т.е. длина очереди не ограничена. Требуется определить следующие характеристики: 1) вероятности состояний системы; 2) среднее число автомобилей, находящихся в системе (на обслуживании и в очереди); 3) среднюю продолжительность пребывания автомобиля в системе (на обслуживании и в очереди); 4) среднее число автомобилей в очереди на обслуживании; 5) среднюю продолжительность пребывания автомобиля в очереди. Решение. 1) Параметр потока обслуживания и приведенная интенсивность потока автомобилей определены в примере 3. Интенсивность обслуживаний автомобилей =0,952 и интенсивность нагрузки =0,893. Предельные вероятности системы вычислим по формулам Р0=1- = 1- 0,893=0,107; Р1=(1- ) = (1- 0,893)*0,893=0,096 Р2=(1- ) 2=(1- 0,893)*0,8932=0,085 Р3=(1- ) 3=(1- 0,893)*0,8933=0,076 Р4=(1- ) 4=(1- 0,893)*0,8934=0,068 Р5=(1- ) 5=(1- 0,893)*0,8935=0,061 и т.д. Следует отметить, что Р0 определяет долю времени, в течение которого пост диагностики вынужденно бездействует. В нашем примере она составляет 10,7%, так как Р0=0,107. 2)Среднее число автомобилей, находящихся в системе Ls= /(1- )=0.893/(1-0.893)= 8.346 3) Среднее время пребывания автомобиля в системе: Ws= Ls/ =9.817 час 4) Среднее число автомобилей в очереди (длина очереди) Lq= Ls - / = 7,453 5) Средняя продолжительность пребывания заявки в очереди на обслуживание: Wq = /((1- )* ) = 8,766 час 6) Относительная пропускная способность поста q=1, т.е. каждая заявка будет обслужена. 7) Абсолютная пропускная способность поста за 1 час А = q* = 0.85 При наличии всего трех мест для стоянки, количество автомобилей не имеющихся возможности присоединиться к очереди m = PN= *P0* 4= 0.85*0.248*0.8934 = 0.134 автомобиля в час. При 12 часовом режиме работы поста за смену 12*0,134=1,6 автомобиля будет теряться. 96