АЛГОРИТМЫ УЧЁТА НЕОПРЕДЕЛЁННОСТИ ИНФОРМАЦИИ ПРИ ТОЧЕЧНОМ ОЦЕНИВАНИИ ПОТОКОВ В СЕТЯХ Ю.Е. Гагарин (к.т.н., доцент, КФ МГТУ им. Н.Э. Баумана) Многочисленные территориально распределённые системы – транспортные, информационные, энергетические и т.п. – обладают сетевой структурой. Для описания таких коммуникационных сетей служит взвешенный граф, рёбрам и вершинам которого приписывают "веса", соответствующие пропускным способностям и потребностям. Формулируемые задачи для взвешенных графов позволяют оценить значения функционалов, заданных на этих графах, и при фиксированных весах вершин синтезировать такие веса на рёбрах графа, чтобы реализовывалось решение между истоками и стоками графа при достижении экстремума функционала, заданного на множестве рёбер этого графа. Подобные задачи формулируются в терминах линейного программирования, но удобнее формулировать задачи линейного программирования в терминах распределения потоков на графах. Методы линейного программирования являются наиболее эффективными и известными методами решения моделей исследования операций и широко применяются в различных областях. Широкое использование этого метода подкрепляется высокоэффективными компьютерными алгоритмами линейного программирования, на которых базируются алгоритмы более сложных типов моделей и задач исследования операций, включая целочисленное, нелинейное и стохастическое программирование. Условия, в которых определяется оптимальное решение задачи линейного программирования, находят отражение в момент формирования модели. В действительности условия, формирующие модель, не остаются неизменными. Поэтому особое значение приобретает анализ устойчивости, т.е. возможность оценить изменения в оптимальном решении, вызванные изменениями в параметрах исходной модели: коэффициентах целевой функции, элементах матрицы, составленной из коэффициентов при неизвестных, и правой части условий-ограничений. Особенно важно знать, при каких изменениях параметров задачи оптимальное решение этой задачи остаётся неизменным. Параметры задачи линейного программирования можно варьировать за счёт изменения условий функционирования описываемых объектов. Например, в транспортных моделях может меняться количество транспорта, который перемещается из одного пункта в другой пункт, или пропускная способность между узлами транспортной сети. Эти изменяющиеся параметры влекут неопределённость параметров задачи [1]. В других случаях параметры задачи линейного программирования являются случайными величинами, и тогда важно знать, как может изменяться решение задачи в зависимости от изменения исходных данных. При этом необходимо иметь, по крайней мере, сведения о математическом ожидании и дисперсии этих случайных величин, если нет возможности оценить их функции распределения. В таком случае неопределённостям значений параметров необходимо указать соответствующую им доверительную вероятность. Как правило, в подобных случаях для получения оптимального решения рассматривают серию прямых близких задач, изменяя значения параметров. В задаче о максимальном потоке [2] каждая дуга сети характеризуется некоторой пропускной способностью. Пусть узел s – источник, узел t – сток, v – внешний поток, входящий в сеть в узле s и выходящий из сети в узле t . Задачу о максимальном потоке можно записать как задачу линейного программирования: найти максимум v при ограничениях f k f k 0 , i N s, t ; kM Oi kM Oi kM Oi kM Ti fk fk fk v 0; fk v 0; kM Ti kM Ti 0 v vr ; 0 f k ck , k M , где N – множество узлов; M – список дуг; Oi и Ti – набор начальных и конечных узлов; f k – поток по дуге k ; ck – пропускная способность дуги k , определяет верхнюю границу потока по дуге. В стандартной постановке задачи о максимальном потоке поток сохраняет свою величину при прохождении по дугам сети. Если f k является потоком в начале дуги k , а f k' – поток в её конце, то f k' f k . В различных сетевых структурах величина потока f k или пропускная способность ck дуги может меняться в некоторых пределах. Например, в транспортных системах в разное время суток может меняться величина потока: в часы пиковой нагрузки поток возрастает. В то же время пропускная способность в часы пиковой нагрузки уменьшается. Таким образом, величина потока и пропускная способность не будут определяться однозначно, а будут иметь некоторую погрешность: f k f k и ck ck . Учёт погрешности f k может привести к тому, что величина потока по дуге сети уменьшится практически до нуля или даже станет отрицательной величиной, т.е. поток поменяет своё направление. При учёте погрешности ck пропускная способность может также снизиться до нуля. Учёт неопределённости исходной информации приводит к изменению условий ограничений, что, в свою очередь, может изменить множество допустимых решений задачи линейного программирования и в результате изменится оптимальное решение задачи. Для оценивания погрешностей f k и ck существует ряд статистических подходов, которые основаны на разных моделях "измерения с ошибками". Наиболее часто [3] ставится задача определения оценок параметров модели: yi f xi , i , i 1, n , где i – случайная ошибка, имеющая нормальное распределение с параметрами M i 0 , D i i2 I , D i , j 0 , i, j 1, n . Данная постановка является классической регрессионной задачей, которая решается методом максимума правдоподобия или методом наименьших квадратов (МНК). Если i2 2 , i 1, n и значение 2 не задано, то оценку параметра 2 можно найти по формуле: ˆ 2 n где s yi f xi , ˆ i 1 2 s , n p , p – число параметров. Регрессионный анализ предполагает, что переменные x являются детерминированными. На практике это требование очень часто не выполняется, поэтому возникает необходимость учёта погрешностей аргумента x . Рассмотрим пассивный эксперимент определения оценок параметров функции f , , где – вектор неизвестных параметров. В процессе наблюдения получаем набор значений xi и yi , определяемых как yi i i , i 1, n , xi i i где i и i – ошибки значений функции и аргумента. Предположим, что ошибки измерений i и i – нормально распределённые случайные величины с нулевыми средними значениями, с дисперсиями 2 yi и 2 xi соответственно и коэффициентом корреляции i 0 . Рассмотрим несколько алгоритмов к решению данной задачи. I. Один из алгоритмов подразумевает использование вместо истинных значений i , наблюдаемых xi при оценивании параметров МНК. При этом ошибка i игнорируется, и в результате имеем следующую модель: y f x, ошибка . В основном, как показано в [4, 5], этот подход даёт несостоятельную оценку с большим асимптотическим смещением. В [5] рассмотрен случай, когда – случайная величина, выбранная независимо от i и i , с характеристиками E , cov . Значения i аппроксимируются результатами измерений xi и при нормальном законе распределения случайной величины i E x x I , где 2 x I 1 Получаем модель: . y f x I , ошибка . Когда и неизвестны, то, используя исходную выборку xi , i 1, n , определяют оценки ̂ , ̂ и в итоге получают модель: ˆ ˆ I ˆ , ˆ ошибка f ˆ , ˆ ошибка . y f x Оценки параметров полученной модели могут быть определены МНК. II. Поставленная задача может быть решена итеративным методом наименьших квадратов с уточняемыми весами [6, 7]. Предполагается, что xi является выборкой из некоторой генеральной совокупности с функцией плотности распределения f xi x0i . При этом первые моменты функции f xi x0i известны и конечны. В этом случае для построения минимизируемого функционала F необходимо знать вид функции плотности распределения f yi x0i или её моменты. Для их определения в [7] предлагается использовать разложение функции f xi , в ряд Тейлора в окрестности точки x0i . Тогда первый и второй моменты функции плотности распределения f yi x0i будут определяться по формулам: E yi x0i f x0i , , f xi , 2 2 yi x0i 2 yi xi . xi x x i 0 i Итерационный процесс нахождения оценок параметров следующим образом: 1. Составляется функционал 2 n строится F0 yi E yi x0i wi0 , где wi0 2 yi . i 1 2 Находятся оценки параметров 0 , при которых достигается минимум F0 , т.е. решается регрессионная задача. 2. Подсчитываются величины w1i 2 yi x0i . n 3. Составляется сумма F1 yi E yi x0i wi1 и определяются оценки i 1 1 . 2 Операции 2 и 3 повторяются до тех пор, пока относительные изменения параметров на соседних итерациях не будут меньше некоторой малой величины : max 0j 1j 0j , j 1, m . III. В [8] предложен алгоритм, позволяющий учитывать ошибки переменных xi для линейных моделей: yi ai b i i 1, n , x i i i где i и i – ошибки измеренных значений функции и аргумента. Традиционными методами, например МНК, определяют оценки параметров â и b̂ модели, считая, что xi – детерминированные величины. При этом получаем модель с известными параметрами: yi bˆ aˆi i i 1, n , xi i i В матричном виде получим регрессионную модель: yi bˆ aˆ i i , xi 1 i где i – неизвестный параметр, подлежащий оцениванию. IV. Возможность оценивания параметров функций любого вида с учётом погрешностей исходных данных дают методы конфлюентного анализа [1]. Доказано, что в методах конфлюентного анализа итерационные процедуры нахождения оценок сходятся, а получаемые оценки параметров являются несмещёнными. При таком подходе исходная модель имеет вид: yi i i i 1, n , x i i i где xi , yi – наблюдаемые значения, i , i – точные значения, i , i – ошибки измеренных значений. Оценки параметров находятся из условия минимума функционала: 2 2 xi i 1 n yi i . F 2 2 2 i 1 yi x i Сложность определения оценок параметров заключается в том, что неизвестны истинные значения i , а известны лишь их доверительные интервалы. Поэтому перед тем, как определять оценки параметров , необходимо оценить значения i . Истинные значения i будут определяться из условия: F 0 , i 1, n . i i ˆ i Задача минимизации функционала F эквивалентна решению системы уравнений: n y i2 ( y )i i 0, t 1, s , t i 1 i xi i yi i i 0, i 1, n . 2 ( xi ) 2 ( yi ) i Решение системы уравнений представляет собой итерационный процесс, который заканчивается при выполнении одного из следующих условий: 1) на очередном шаге значение функционала F меньше заданного числа ; 2) на соседних итерациях значение функционала F и значения оценок параметров ̂ отличаются незначительно, т.е. F F1 t t1 1 ; max 2 , t 1, s , F t где 1 и 2 – заданные числа; 3) исчерпан лимит итераций. Анализ рассмотренных алгоритмов учёта погрешностей исходных данных показывает, что при моделировании транспортных сетей оценивание параметров линейных функций с учётом погрешностей в исходных данных сложностей не вызывает. Для нелинейных функций возникает проблема вычислительного характера, поскольку для получения оценок параметров в этом случае необходимо применять итерационные процедуры. Исследования проведены при финансовой поддержке Российского фонда фундаментальных исследований и правительства Калужской области (проект № 12-01-97528). Список литературы 1. Грешилов А.А. Математические методы принятия решений. – М.: Изд-во МГТУ им. Н.Э. Баумана, 2006. – 584 с. 2. Йенсен П., Барнес Д. Потоковое программирование. – М.: Радио и связь, 1984. – 392 с. 3. Бард Й. Нелинейное оценивание параметров. – М.: Статистика, 1979. – 349 с. 4. Успенский А.Б., Фёдоров В.В. Вычислительные аспекты МНК при анализе и планировании регрессионных экспериментов. – М.: Изд-во МГУ, 1975.– 168 с. 5. Gleser L.J. Improvements of the naive approach to estimation in nonliner errors-invariables regression models // Statist. Anal. Meas. Error Models and Appl.: Proc. AMS-IMS-SIAM. It Summer Res. Conf. Arcata Calif. June 10–16, 1989. – Providence, 1990. – P.99–114. 6. Фёдоров В.В. Теория оптимального эксперимента. – М.: Наука, 1971. – 312 с. 7. Schater D.W. Measurement error model estimation using iteratively weighted teast squares // Statist. Anal. Meas. Error Models and Appl.: Proc. AMS-IMS-SIAM. It Summer Res. Conf. Arcata. Calif. June 10–16, 1989. – Providence, 1990. – P.129–138. 8. Fuller W.A. Measurement error models. – New York ect.: Wiley, 1987. – 440 p.