УДК 519.862.8 А.В. Жариков ПРИМЕНЕНИЕ ПРИНЦИПА СЖАТЫХ ОТОБРАЖЕНИЙ В ЗАДАЧЕ УПРАВЛЕНИЯ ИГРЫ ДВУХ ЛИЦ ПРИ РАЗНОЙ ИНФОРМИРОВАННОСТИ ИГРОКОВ В данной статье рассмотрено применение принципа сжатых отображений при решении задачи управления игры двух лиц при разной информированности игроков. Рассмотрим оператор управления состояниями субъекта, который функционирует в динамической случайной среде. Управление проводится с использованием принципа осреднения входных переменных [2]. Предположим, что управление выбрано из условий максимизации некоторого критерия. Пусть x ( x1, x2 ,..., xn ) – случайный вектор с функцией распределения ( x1 ,..., xn ) , а множество S {1,2,..., n} – индексы всех компонент вектора Si S – множество совокупность индексов, определяющих x; информационную структуру i - й управляющей переменной, i 1,2,..., m . Введём также вектор управления (стратегии игроков) v (v1, v2 ,..., vm ) , где vi vi (di ), di ( x j ) jS , i I {1,2,..., m} , I – множество игроков. Таким образом, задача примет вид (1) J i M Fi x,V (di ) max, i I , i vi где символ M означает операцию вычисления математического ожидания, функционал Fi x, v – критерий максимизации, J i – интегральный выигрыш i - го игрока. Формализация условий разной информированности приводит к равенству нулю частной производной по соответствующей переменной [7]: vi (di ) (2) 0. x j Рассмотрим задачу (1) при n m 2 . Тогда задача примет вид M F1 x, y, u ( y ), v( x) max, u (3) M F2 x, y, u ( y ), v( x) max, v при условиях u v (4) 0, 0 . x y Возьмём конкретный вид функционалов F1 A(u, v, x, y),(u, v, x, y) , 44 , F2 B(u, v, x, y),(u, v, x, y) , где A AT aij B BT bij 44 , т.е. F1 , F2 – квадратичные формы с переменными u, v, x, y . Пусть информационный 1 вектор ( x, y) распределён на квадрате [a, b] [a, b] с плотностью ( x, y ) . Считаем, что ( x, y ) обладает стандартными свойствами плотности распределения. Задача (3) при условиях (4) примет вид bb J1 a11u 2 2a12uv 2a13ux ... a44 y 2 ( x, y )dxdy max, aa bb uU (5) J 2 b11u 2 2b12uv 2b13ux ... b44 y 2 ( x, y )dxdy max. aa vV Задача (3) при условиях (4), по сути, является игрой двух лиц, где J1 (u, v), J 2 (u, v) – функции выигрыша, а u, v – стратегии игроков. Множество допустимых стратегий U , V будут произведением пространств 1 1 C ([a, b] [a, b]) C ([a, b] [a, b]) . Нахождение решения игры зависит от понимания рациональности и оптимальности поведения игроков. Предположим, что игроки имеют непротивоположные интересы. Одной из распространённых концепций решения некооперативных игр является ситуация равновесия по Нэшу [6,7,9], суть которой заключается в невозможности увеличения выигрыша игрока при его отклонении от данного равновесия. Определение 1. Ситуация x* ( x1* , x2* ,..., xn* ) называется ситуацией равновесия по Нэшу, если для всех xi X i , i {1,..., n} справедливо неравенство Ki ( x1* , x2* ,..., xn* ) Ki ( x1* ,..., xi*1 , xi , xi*1,..., xn* ) . Для задачи (5) определение 1 представится в виде неравенств J1 (u , v ) J1 (u , v ) ; J 2 (u , v) J 2 (u , v ) , где u* , v* – ситуация равновесия по Нэшу. Был найден в [3,4] конкретный вид решения задачи (5),(4) в концепции равновесии по Нэшу, когда входные переменные x и y являлись независимыми случайными величинами. Наряду со случаем независимых x и y можно рассматривать и общий случай зависимости x и y . Необходимые условия существования решений, согласно [1,3,4], при этом не изменятся. Тогда нахождение u и v будет зависеть от разрешимости системы интегральных уравнений b b b b a11u ( x, y )dx a12 v( x)( x, y )dx a13 x( x, y )dx a14 y ( x, y )dx 0, a a a a (6) b b b b b22v ( x, y )dy b12 u ( y )( x, y )dy b23 x ( x, y )dy b24 y( x, y )dy 0. a a a a Вопрос существования решения (6) не является очевидным и требует 2 некоторых пояснений. Для начала определим тип данной системы. Путём несложных преобразований система (6) сводится к виду b b u ( y ) v( x) K1 ( x, y )dx f1 ( y ), u ( y ) v( x) K1( x, y )dx f1( y ), a a (6) b b v ( x ) u ( y ) K ( x , y ) dy f ( x ), 2 2 v( y ) u ( x) K 2 ( y, x)dx f 2 ( y ), a a b ( x, y ) a11( x, y ) где , , K1 ( x, y ) b22 K 2 ( x, y ) b b21 ( x, y )dx a12 ( x, y )dy a b f1 ( y ) a b a13 x ( x, y )dx a14 y ( x, y )dx a a b a11 ( x, y )dx b , f 2 ( x) b23x ( x, y )dy b24 y( x, y )dy a a , b b22 ( x, y )dy a b a a12 b12 . Данное преобразование допустимо в силу свойств ( x, y ) . a11 b22 0 K ( x, y ) u( y) Введём обозначения: K ( x, y ) 1 , ( y) , 0 K ( y , x ) v ( y ) 2 f1 ( y ) , тогда система (6) может быть записана в векторной форме f2 ( y) ( y) b ( y ) K ( x, y ) ( x)dx ( y ) . (7) a Уравнение (7) является уравнением Фредгольма второго рода, записанное в векторной форме. Согласно существующей теории, можно выделить несколько путей для доказательства условий существования и единственности решения интегральных уравнений. ПРИНЦИП СЖАТЫХ ОТОБРАЖЕНИЙ Большое достоинство этого принципа состоит в том, что он не только гарантирует при определённых условиях однозначную разрешимость уравнения, но и может служить для получения приближённых решений [5,6,10]. Пусть есть пространство C [a, b],R 2 . Предположим, что ядро K ( x, y) непрерывно в замкнутом квадрате D {( x, y) : ( x, y) [a, b] [a, b], a, b R} и, следовательно, ограничено на нём, т.е. K ( x, y) f M f f , где M – норма оператора K ( x, y) . Тогда 3 K sup Kx x 1 sup ( K1x1, K 2 x2 ) , где x – непрерывная на квадрате D x 1 вектор-функция. Напомним, что x max x12 ( x, y ) x22 ( x, y ) . Зафиксируем x, y x1 и x2 , в силу непрерывности x на прямоугольнике D . Тогда условие x 1 примет вид x12 x22 1 . Таким образом, K sup ( K1x1, K 2 x2 ) x x 1 2 1 2 2 sup max K12 ( x, y ) x12 K 22 ( y, x) x22 x x 1 x , y 2 1 2 2 sup max K12 ( x, y ) x12 K 22 ( y, x)(1 x12 ) max K1 ( x, y ) , K 2 ( y, x) x, y x x 1 x , y (8) K max K1 ( x, y) , K 2 ( y, x) . 2 1 2 2 x, y Полученное выражение (8) опирается на следующую лемму. f ( x, y) Лемма 1. Пусть определена на множествах x ( x1, x2 ) K1, y ( y1, y2 ) K 2 , где sup sup f ( x, y ) sup sup f ( x, y) . xK1 yK 2 K1 , K 2 – компакты в R 2 . Тогда yK 2 xK1 Доказательство. Рассмотрим функцию g ( y ) sup f ( x, y ) . Очевидно, xK1 что f ( x, y) является равномерно непрерывной функцией, т.к. K1 , K 2 – компакты в R 2 . Покажем, что g ( y ) является непрерывной функцией по y . Запишем условие равномерной непрерывности f ( x, y) : 0, 0 : x x , y y f ( x, y) f ( x, y) / 2 для любых x, x, y, y . Пусть x x x , тогда неравенство перепишется в виде f ( x, y) f ( x, y) / 2 f ( x, y) / 2 f ( x, y) f ( x, y) / 2 . Возьмем от обеих частей имеем sup , xK1 g ( y) / 2 g ( y) g ( y) / 2 g ( y) g ( y) / 2 . Из последнего g, неравенства следует непрерывность функции значит, sup g ( y ) sup sup f ( x, y) N . Обозначим через M sup f ( x, y ) . Ясно, y yK 2 xK1 x , yK1K 2 что M f ( x, y) M N . По определению M f ( x, y) , следовательно M f ( x, y ) sup f ( x, y ) sup sup f ( x, y) N M N . Из последнего xK1 yK 2 xK1 неравенства следует, что M N . Аналогично sup f ( x, y ) sup sup f ( x, y) . Лемма доказана. x , yK1K 2 показывается, что xK1 yK 2 Пусть ( x) . Тогда решение (7) будем искать среди элементов пространства . При этом, как и в одномерном случае, решением интегрального уравнения (7) будем называть произвольную функцию 0 ( y ) , подстановка которой в уравнение (7) обращает его в истинное 4 тождество для любого y [a, b] : b 0 ( y ) K ( x, y ) 0 ( x)dx ( y) . (9) a Ясно, что при 0 уравнение (9) имеет единственное непрерывное решение 0 ( y ) ( y ) . Покажем, что уравнение (7) однозначно разрешимо для всех , достаточно малых по абсолютной величине. Введём следующий оператор A , определённый в пространстве , b A K ( x, y ) ( x)dx ( y) . (10) a Оператор (10) переводит функцию ( y) в некоторую функцию ( y ) , определённую на том же отрезке [a, b] . Тогда существование решения 0 ( y ) уравнения (7) сводится к вопросу о наличии у оператора A неподвижной точки, т.е. такой функции 0 ( y ) , которая при действии оператором A переходит в саму себя: A 0 0 . Покажем, что оператор A , действует из полного пространства опять в , т.е., если g ( y) A ( y) , где ( y) , то и g ( y) . Для этого возьмём произвольную точку y [a, b] , и пусть y – любое, лишь бы выполнялось y y [a, b] . Имеем g ( y y ) g ( y ) ( y ) b b a a K ( x, y y ) ( x)dx ( y y ) K ( x, y ) ( x)dx b K ( x, y y) K ( x, y) ( x) dx ( y y) ( y) . a (11) Из условия ( x) C [a, b],R 2 следует, что для любого 0 , 1 0 такое, что при y : y 1 . (12) 2 Ядро K ( x, y) непрерывно в замкнутом квадрате D и, значит, равномерно непрерывно в D . Следовательно, по выбранному 0 найдётся 2 0 такое, что ( y y) ( y) K ( x, y y ) K ( x, y ) 2 ( y) (b a) (13) при y 2 и любом x [a, b] . Возьмём min{1, 2} . Тогда при y таких, что y , будут одновременно выполняться неравенства (12) и (13) и, учитывая неравенство (11), получим, g ( y y ) g ( y ) y : y , 5 что и доказывает непрерывность функции g ( y ) в любой точке y [a, b] . Итак, A C [a, b],R 2 C [a, b],R 2 . Выясним теперь, при каких условиях оператор A будет сжимающим. Для этого определим расстояние между двумя элементами как норму разности данных элементов, т.е. x, y C [a, b],R 2 , ( x, y ) x y . Данное определение уместно в силу нормированности пространства C [a, b],R 2 . Имеем ( A1, A 2 ) A1 A 2 b b K ( x, y)1 ( x)dx K ( x, y) 2 ( x)dx a a b K ( x, y)(1 ( x) 2 ( x))dx M (b a) 1 ( x) 2 ( x) M (b a) (1, 2 ) . a Перепишем данное неравенство в следующем виде: ( A1, A 2 ) M (b a) (1, 2 ) , (14) 1 откуда видно, что при оператор A будет сжимающим. M (b a) Из принципа сжатых отображений заключаем, что для любого такого, что M (b a) 1 , (15) уравнение Фредгольма в векторной форме (7) с непрерывным ядром K ( x, y) и непрерывным свободным членом ( y ) имеет единственное решение. С другой стороны, из уравнения (9) следует, что a12 ( x, y ) b12 ( x, y ) M (b a) 1 (b a) max b , b 1 . (15') x, y a11 ( x, y )dx b22 ( x, y )dy a a Последовательные приближения 0 ( y ),..., n ( y ),... к этому решению определяются из соотношений b n1 ( y ) K ( x, y ) n ( x)dx ( y ), n 0,1,... , a где в качестве 0 ( y ) можно взять любую непрерывную вектор-функцию на [a, b] . Данный итерационный процесс является сходящимся к некоторой функции, которая и будет являться решением уравнения (9). Также можно найти решение, используя резольвенту ядра. Для этого приведём вспомогательные сведения . 6 Теорема 1. Пусть А – линейный ограниченный оператор, отображающий банахово пространство E в себя, и A q 1. Тогда оператор ( I A) , где I – единичный оператор, имеет обратный линейный ограниченный оператор. Доказательство теоремы можно найти, например в работе [6]. В результате получим, что ( I A) 1 – линейный ограниченный оператор. При этом ( I A) 1 I A A2 A3 ... (1) n An ... (16) Применим результат теоремы к интегральному уравнению (9). Положим b A K ( x, y ) ( x)dx . a Тогда уравнение (9) перепишем в виде (17) A ( I A ) . Используя приведённую теорему, получим, что если A 1, то уравнение (9) имеет единственное решение, которое определяется равенством ( I A ) 1 A 2 A 2 3 A 3 ... n A n ... (18) Полученный нами ряд называется рядом Неймана. Выясним, при каких значениях ряд (18) сходится. Для этого рассмотрим неравенство A 1. Учитывая изложенный выше результат (8) оценки нормы ядра K , получим условие (15). Далее, будем считать, что выполняется условие (15) для . Выясним, что представляют в рассматриваем случае степени оператора A . Имеем b b b b 2 A A ( A ) K (t , s) K ( s, ) ( )d ds K (t , s) K ( s, )d ( )ds . a a a a Обозначим b K (t , s) K (s, )hds K 2 (t, )h , a где вектор h является пробным вектором из C [a, b],R 2 . Оператор K 2 (t , ) называется повторным ядром, или второй итерацией ядра K (t , s) . b Следовательно, A K 2 ( x, y ) ( x)dx . 2 Аналогично проделывая a процедуру для произвольной степени оператора, имеем b A K n ( x, y ) ( x)dx, n (19) a где K n ( x, y ) – n-я итерация ядра K ( x, y) , определяемая формулой 7 b K n ( x, y )h K ( x, ) K n1 ( , y )hd . a Заметим, что все итерированные ядра непрерывного ядра K ( x, y) также непрерывны. Решение уравнения (7) запишем в следующем виде: b ( y ) ( y) K1 ( x, y) ( x)dx ... a b n K n ( x, y) ( x)dx ... (20) a Причём, данный ряд сходится равномерно при выполнении условия a ( x , y ) b ( x , y ) 1. 12 M (b a) 1 (b a) max b12 , b x, y a11 ( x, y )dx b22 ( x, y )dy a a Запишем полученное решение в более компактной форме. Рассмотрим ряд K1 ( x, y ) K 2 ( x, y ) ... n1K n ( x, y ) ... Этот ряд также равномерно сходится при условии M (b a) 1 . Действительно, предположим, что h (21) 1 , получим b K 2 ( x, y ) K ( x, ) K ( , y ) d M 2 (b a ) ; a b K3 ( x, y ) K ( x, ) K 2 ( , y ) d M 3 (b a) 2 , и вообще, a b K n ( x, y ) K ( x, ) K n1 ( , y ) d M n (b a) n1 . a Отсюда n1K n ( x, y) n1 M n (b a)n1 Mq n1, где q M (b a) 1 . Таким образом, члены ряда (21) по абсолютной величине не превосходят членов сходящегося числового ряда qn , откуда следует n1 сходимость ряда (21). Введём новый оператор R( x, y, ) : R( x, y, ) K1 ( x, y ) K 2 ( x, y ) ... n1K n ( x, y ) ... Умножим обе части на и, интегрируя ряд почленно, получим (22) b ( x) ( x) R( x, y, ) ( y )dy . (23) a 8 В результате приведённых выкладок пришли к существованию решения задачи (5), при условии a12 ( x, y ) b12 ( x, y ) (b a ) max , b b 1. x, y a11 ( x, y )dx b22 ( x, y )dy a a Сформулируем данный результат в виде утверждения. Утверждение 1. Решение задачи (5) при условиях (4) в концепции равновесия Нэша существует и единственно, если выполняются условия: 1. a11 , b22 0 . a12 ( x, y ) b12 ( x, y ) , 2. (b a ) max b b x, y a11 ( x, y )dx b22 ( x, y )dy a a 1. 9 ЛИТЕРАТУРА 1. Гельфанд И.М., Фомин С. В. Вариационное исчисление. – М., 1961. 2. Гермейер Ю.Б. Введение в теорию исследования операций. – М., 1973. 3. Жариков А.В. О решении задачи управления в концепции теории игр при разной информированности игроков // Материалы девятой региональной конференции по математике «МАК–2006». – Барнаул, 2006. 4. Жариков А.В., Максимов А.В. О решении частной задачи управления в случае разной информированности субъектов // Известия АлтГУ. N1. – Барнаул, 2006. 5. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. – М., 1968. 6. Краснов М.Л. Интегральные уравнения. (Введение в теорию). – М.,1975. 7. Максимов А.В., Оскорбин Н.М. Многопользовательские информационные системы: основы теории и методы исследования. – Барнаул 2005. 8. Оуэн Г. Теория игр. – М., 1971. 9. Теория игр. Петросян Л.А., Зенкевич Н.А., Семина Е.А. – М., 1998. 10.Полянин А.Д., Манжиров А.В. Справочник по интегральным уравнениям. – М., 2003. 10