ОБЗОРЫ СОВРЕМЕННОЙ ФИЗИКИ, ТОМ 74, ЯНВАРЬ 2002

advertisement
ОБЗОРЫ СОВРЕМЕННОЙ ФИЗИКИ, ТОМ 74, ЯНВАРЬ 2002
Статистическая механика сложных сетей.
Réka Albert* и Albert-Lászlό Barabási
Отдел физики, университет , Notre Dame, Notre Dame, Indiana 46556
(опубликовано 30 января, 2002)
Сложные сети описывают большое разнообразие природных и социальных систем. Часто
приведенные примеры включают ячейку, сеть химических веществ, связанных химическими
реакциями, и интернет, сеть маршрутизатор и компьютеры, соединенные физическими связями. В
то время как по традиции эти системы моделировались как случайные графы, широко признано, что
топология и эволюция реальных сетей управляются прочными организационными принципами. Эта
статья просматривает последние продвижения в области сложных сетей, фокусирующиеся на
статистической механике сетевой топологии и динамики.
После просмотра эмпирических данных, которые мотивировали недавний интерес к сетям,
авторы обсуждают основные модели и аналитические средства, покрывающие случайные графы,
сети, без окалины и small-world сети, возникающую теорию развивающихся сетей, и
взаимодействие между топологией и устойчивость сетей к сбоям и атакам.
I. Введение.
Сложные сетевые структуры описывают широкий спектр систем высокотехнологической и
интеллектуальной важности. Например, клетка наилучше описывается как сложная сеть
химических элементов, связанных химическими реакциями; интернет _ сложная сеть
маршрутизаторов и компьютеров, соединенных различными физическими и беспроводными
связями; причуды и идеи, распространенные в социальных системах, узлами которых являются
люди, а ребра представляют различные социальные связи; всемирная паутина есть огромная сеть
веб-страниц, связанных гиперссылками. Эти примеры лишь несколько из того множества, которое
подсказало научной общественности исследовать механизмы, которые определяют топологию
сложных сетей. Желание понять такие переплетенные системы столкнулось со значительными
трудностями. В физике разработан целый арсенал успешных средств для предсказания поведения
системы в целом исходя из свойств ее составляющих. Мы теперь понимаем, как магнетизм
возникает из коллективного поведения миллионов частиц, или как квантовые частицы приводят к
такой выдающейся феномене как конденсация Бозе-Эйнштейна или сверхтекучести. Успех таких
попыток моделирования основан на простоте взаимодействий между элементами; нет никаких
неясностей о том, какой элемент с каким взаимодействует, а сила взаимодействия одинаково
определяется исходя из физического расстояния. Тем не менее, для нас затруднительно описать
системы, для которых физическое расстояние неуместно или неясно, взаимодействуют ли два
компонента. В то время как для сложных с нетривиальными топологиями сетей такая неясность
естественно присутствует, в последние несколько лет мы осознали, что средства статистической
механики предлагают идеальный каркас для описания таких переплетенных систем. Такие развития
представили новые проблемы для статистической физики и неожиданные связи с главными темами
в физике конденсированных сред, от процеживания до конденсации Бозе-Эйнштейна. Традиционно
изучение сложных сетей являлось делом теории графов. В то время как теория графов изначально
специализировалась на регулярных графах, с 1950-х обширные сети с отсутствием явных
принципов построения были описаны как случайные графы, которые предлагались как самая
простая и непосредственная реализация сложных сетей. Случайные графы были впервые изучены
венгерскими математиками Полом Эрдосом и Алфредом Ренйи. Согласно модели Эрдоса-Ренйи,
мы начинаем с N вершин и соединяя каждую пару вершин с вероятностью 𝑝, создавая граф
приблизительно с 𝑝𝑁(𝑁 − 1)/2 случайно выбранными ребрами. Со времени своего представления
эта модель была путеводительной для нашего представления сложных сетей в течение десятилетий.
Однако растущий интерес к сложным сетям подсказал многим ученым пересмотреть эту парадигму
моделирования и задать единственный простой вопрос: действительно ли реальные системы за
такими разнообразными сложными сетями, как клетка или интернет, являются абсолютно
случайными? Наша интуиция подсказывает о том, что сложные системы должны демонстрировать
некоторые принципы организации, которые в какой-то степени должны быть зашифрованы в их
топологии. Но если топология этих систем на самом деле отклоняется от случайного графа, то нам
нужно развить средства и системы мер для фиксирования лежащих в основе организационных
принципов в количественных терминах.
В последние годы мы засвидетельствовали существенное продвижение в этом направлении,
вызванное несколькими параллельными развитиями. Во-первых, компьютеризация процесса
приобретения информации во всех сферах привело к появлению больших баз данных о топологии
различных реальных сетей. Во-вторых, увеличившиеся вычислительные возможности позволили
нам исследовать сети, содержащие миллионы узлов, анализируя вопросы, которые раньше
невозможно было затронуть. В-третьих, медленное, но видимое стирание границ между
дисциплинами дало ученым доступ к разнообразным базам данных, тем самым давая им
возможность раскрыть характерные свойства сложных сетей. И напоследок, есть возрастающая
надобность перейти за границы редукционистических подходов и попробовать понять поведение
системы как целого. Если придерживаться такой стратегии, понимание топологии взаимодействий
между компонентами, т. е. сетями, неизбежно. Исходя из этих стремительных развитий и
обстоятельств, многие новые концепции и меры были предложены и тщательно исследованы в
последние годы. Как бы то ни было, три концепции занимают важнейшее место в современном
представлении сложных систем. Ниже мы определим и вкратце обсудим их, с более подробным
обсуждением в последующих разделах.
Маленькие миры: Концепция маленьких миров, в простых терминах, описывает тот факт,
что, несмотря на частые большие размеры, в большинстве сетей путь от одного узла к другому
сравнительно небольшой. Расстояние между узлами определяется как количество ребер в
наикратчайшем пути, соединяющем их. Самым распространенным примером маленького мира
является концепция “шесть градусов разделения”, обнаруженная социальным психологом Стэнли
Милграмом (1967). Последний пришел к выводу, что между любыми двумя людьми, живущими в
США (Кочен, 1989) есть путь знакомств с типичной длиной примерно в шесть человек. Многие
сложные сети характеризуются свойством маленьких миров: актеры в Голливуде находятся друг от
друга в среднем в пределах трех человек, или химические элементы в клетке обычно разделены
тремя химическими реакциями. Концепция маленьких миров, будучи очень занимательной, не
является индикатором определенного принципа организации. В самом деле, как показали Эрдос и
Ренйи, типичная дистанция между любыми двумя вершинами в случайном графе оценивается как
логарифм количества вершин. Таким образом, случайные графы также являются маленькими
мирами.
Кластерация: Клики, представляющие круг друзей или знакомых, в котором каждый член
знает любого другого, являются распространенным свойством социальных сетей. Эта неотъемлемая
тенденция образовывать группы измеряется коэффициентом кластерации (Уоттс и Строгатс, 1998).
Данная концепция исходит из социологии, где имеет название “разрыв транзитивных троек”
(“fraction of transitive triples”) (Вассерманн и Фауст, 1994). Рассмотрим фиксированную вершину 𝑖,
имеющую 𝑘𝑖 ребер, которые соединяют ее с 𝑘𝑖 вершинами. Если ближайшие соседи этой вершины
были бы частью клики, то между ними было бы 𝑘𝑖 (𝑘𝑖 − 1)/2 ребер. Соотношение между
количеством ребер 𝐸𝑖 , которые реально существуют между этими 𝑘𝑖 вершинами и общее число
𝑘𝑖 (𝑘𝑖 − 1)/2 дает нам значение коэффициента кластерации вершины 𝑖,
𝐶𝑖 =
2𝐸𝑖
𝑘𝑖(𝑘𝑖−1)
(1)
Коэффициент группирования всей сети есть среднее всех отдельных 𝐶𝑖 . Альтернативное
определение коэффициента кластерации, которое часто используется в литературе, обсуждено в
Sec. VI.B.2 (Баррат и Уэйт, 2000; Ньюман, Строгатс и Уоттс, 2000).
В случайном графе, т. к. ребра распределены случайным образом, коэффициент кластерации
имеет величину 𝐶 = 𝑝 (Sec. III.F). Тем не менее, в большинстве, если не во всех, реальных сетях
коэффициент кластерации намного больше чем в соизмеримой случайной сети (т. е. имеющей то же
количество вершин и ребер, что и реальная сеть).
Распределение степеней: Не все узлы в сети имеют то же самое число ребер (степень узла).
Разброс степеней узлов характеризуется функцией распределения 𝑃(𝑘), которая дает вероятность
того, что случайно выбранный узел имеет ровно 𝑘 ребер. Т. к. в случайном графе ребра
распределяются случайным образом, большинство узлов имеет приблизительно ту же степень,
которая близка к средней для всей сети степени ⟨𝑘⟩. Распределение степеней случайного графа
является распределением Пуассона с пиком 𝑃(⟨𝑘⟩). Одним из самых интересных развитий нашего
понимания сложных сетей является открытие того, что для доминирующей части больших сетей
распределение степеней значительно отступает от пуассоновского. В частности, для большого
количества сетей, в том числе и всемирной сети (Альберт, Йонг и Барабаси, 1999), интернета
(Фалоутсос, 1999), или метаболических сетей (Йонг и другие, 2000) распределение степеней имеет
хвост со степенным законом,
𝑃(𝑘) ~ 𝑘 −𝜆 .
(2)
Такие сети называются свободными от масштаба (Барабаси и Альберт, 1999). В то время как
некоторые сети имеют экспоненциальный хвост, функциональная форма 𝑃(𝑘) все же значительно
отступает от Пуассоновского распределения, ожидаемого для случайного графа.
II. Топология реальных сетей: эмпирические результаты.
Изучение большинства сложных сетей было вызвано желанием понять различные реальные
системы, от коммуникационных сетей до экологических. Таким образом, доступные для
исследования базы данных обхватывали несколько дисциплин. В этой части мы кратко обозрим те
сети, которые были изучены исследователями с целью раскрыть общие свойства сложных сетей.
Помимо описания баз данных, мы также обратим внимание на три сильные меры топологии сети:
средняя длина пути, коэффициент кластерации, и распределение степеней. Другие числовые
значения, как обсуждено в последующих частях, будут также тестированы на этих базах данных.
Свойства исследуемых баз данных, а также применяемых образцов, подытожены в таблицах I и II.
Таблица I. Общие характеристики некоторых реальных сетей. Для каждой сети мы отметили
количество узлов, среднюю степень ⟨𝑘⟩, среднюю длину пути 𝑙 и коэффициент кластерации 𝐶. Для
сравнения мы включили среднюю длину пути 𝑙𝑟𝑎𝑛𝑑 и коэффициент кластерации 𝐶𝑟𝑎𝑛𝑑 случайного графа той
же величины и с той же средней степенью. Числа в последнем столбце закреплены с символами на рисунках
8 и 9.
A. Всемирная сеть.
Всемирная сеть представляет собой самую крупную сеть, для которой информация о
топологии в данное время доступна. Узлами сети являются документы (веб-страницы), а ребра _
гиперссылки (URL-ы), которые ведут от одного документа к другому (смотри рис.1). Размер этой
сети в конце 1999-го года составлял примерно один миллиард (Лоуренс и Гилс, 1999). Интерес к
всемирной сети во многом возрос после того, как было открыто, что распределение степеней вебстраниц подчиняется степенному закону над несколькими порядками величин (Альбер, Йонг и
Барабаси, 1999; Кумар и др., 1999). Т. к. ребра во всемирной сети имеют направление, сеть
характеризуется двумя распределениями степеней: распределение выходящих ребер, 𝑃𝑜𝑢𝑡(𝑘),
обозначает вероятность того, что у документа есть 𝑘 гиперссылок, и распределение входящих
ребер, 𝑃𝑖𝑛(𝑘), есть вероятность того, что 𝑘 гиперссылок указывают на конкретный документ.
Несколько исследований показали, что и у 𝑃𝑜𝑢𝑡(𝑘), и у 𝑃𝑖𝑛(𝑘) хвосты подчиняются степенному
закону:
𝑃𝑜𝑢𝑡(𝑘)~ 𝑘 −𝜆𝑜𝑢𝑡 и 𝑃𝑖𝑛(𝑘)~ 𝑘 −𝜆𝑖𝑛 .
(3)
Альберт, Йонг и Барабаси (1999) изучили подмножество всемирной сети, содержащее
325 729 узлов, и обнаружили, что 𝜆𝑜𝑢𝑡 = 2,45 и 𝜆𝑖𝑛 = 2,1. Кумар и др. (1999) использовали кроль
Алекса Inc., состоящий из 40 миллионов документов, и получили 𝜆𝑜𝑢𝑡 = 2,38 и 𝜆𝑖𝑛 = 2,1 (см. также
Клейнберг и др., 1999). Последующее рассмотрение топологии всемирной сети Бродером и др.
(2000) использовало два 1999 кролей Алтависта, содержащих в общей мере 200 миллиона
документов, и обнаружили, что 𝜆𝑜𝑢𝑡 = 52,72 и 𝜆𝑖𝑛 = 52,1 с масштабом, близким к пяти порякам
величин (рис. 2). Адамик и Хьюберман (2000) использовали несколько другое представление
всемирной сети, где каждый узел представлял отдельное имя домена и два узла соединялись, если
любая страница из одного домена соединялась с любой страницей из другого домена. В то время
как данный метод рассматривал страницы из одного домена как целое, представляя нетривиальное
скопление узлов, распределение входящих ребер все еще подчинялось степенному закону с
𝜆𝑑𝑜𝑚
= 1.94.
𝑖𝑛
Обратите внимание на то, что 𝜆𝑖𝑛 одно и то же для всех измерений на уровне документов,
кроме двухгодичного перерыва между первым и последним сетевым кролем, в течение которого
всемирная сеть выросла, по крайней мере, в пять раз. Тем не менее, 𝜆𝑜𝑢𝑡 склонно расти с объемом
выборки или со временем (см. таблицу 2).
Несмотря на большое число узлов, всемирная сеть обладает свойством маленького мира. Это
впервые было отмечено Альбетом, Йонгом и Барабаси (1999). Они открыли, что средняя длина пути
в выборке, содержащей 325 729 узлов, есть 11,2 и, используя масштабное преобразование в
конечном объеме, предсказали, что для всей всемирной сети из 800 миллиона узлов средняя длина
пути будет примерно 19. Дальнейшие измерения Бродера и др. (2000) показали, что средняя длина
пути в 50-миллионном образце всемирной сети есть 16, что совпадает с предсказанием для
конечного объема для образца такой величины. И наконец, сеть уровня доменов демонстрирует
среднюю длину пути 3,1 (Адамик, 1999).
Ориентированность всемирной сети не дает нам возможность измерят коэффициент
кластерации, используя равенство (1). Для того чтобы избежать этой трудности, можно избавиться
от ориентированности, сделав все ребра двунаправленными. Таким способом воспользовался
Адамик (1999), кто изучил всемирную сеть на уровне домена, используя кроль Алекса 1997,
состоящий из 50 миллионов веб-страниц, распределенных в 259 794 сайтах. Адамик убрал узлы,
имеющие лишь один край, и работал с сетью из 153 127 сайтов. В то время как ожидалось, что
такие изменения несколько увеличат коэффициент кластерации, она обнаружила значения 𝐶 =
0.1078, порядок величин выше чем 𝐶𝑟𝑎𝑛𝑑 = 0.00023, соответствующий случайному графу такой же
величины и средней степени.
B.Интернет.
Интернет _ сеть физических связей между компьютерами и другими
телекоммуникационными устройствами (рис. 1). Топология интернета изучена на двух различных
уровнях. На уровне маршрутизаторов, где последние являются вершинами, а ребра _ физические
соединения между ними. И на внутридоменном уровне (или уровне автономных систем), где
каждый домен, состоящий из сотен маршрутизаторов и компьютеров, представляется
единственным узлом. Два домена соединены ребром, если есть хотя бы один путь, соединяющий
их. Фалоутсос и др. (1999) изучили интернет на обоих уровнях и пришли к выводу, что в каждом
случаи распределение степеней подчиняется степенному закону. В результате исследования
топологии интернета в трех различных датах между 1997 и концом 1998 были получены значения
между 𝛾𝐼𝑎𝑠 = 2,15 и 𝛾𝐼𝑎𝑠 = 2,22. Исследования топологии интернета 1995-го на уровне
маршрутизаторов, содержащем 3888 узлов, привело к значению 𝛾𝐼𝑟 = 2,48 (Фалоутсос и др., 1999).
Таблица II. Масштабные степени, характеризующие распределение степеней некоторых свободных
от масштаба сетей, для которых 𝑃(𝑘) подчиняется степенному закону (2). Мы отмечаем размер сети, ее
среднюю степень ⟨𝑘⟩ и границу к для масштабирования по степенному закону. Для ориентированных сетей
мы отдельно отмечаем показатели (𝛾𝑖𝑛 ) для входящих и (𝛾𝑜𝑢𝑡 ) для выходящих, а для неориентированных
сетей, отмеченных звездочкой (∗), эти величины совпадают. Столбцы 𝑙𝑟𝑒𝑎𝑙 , 𝑙𝑟𝑎𝑛𝑑 и 𝑙𝑝𝑜𝑤 сравнивают
среднюю длину пути реальных сетей с распределением степеней по степенному закону и предсказаниями в
теории случайных графов (17) и Ньюмана, Строгатса, и Уоттса (2001) [см. также равенство (63) выше], как
это обсуждено в отделе V. Числа в последнем столбце связаны с символами в рисунках 8 и 9.
Рисунок 1. Сетевая структура всемирной сети и интернета. Верхняя панель: узлами всемирной сети являются
веб-документы, соединенные гиперссылками (URLы). Нижняя панель: в интернете узлами являются
маршрутизаторы и компьютеры, а ребра _ провода и
кабели, которые их физически соединяют. Рисунок
любезно предоставлен Истваном Альбертом.
Рисунок 2. Распределение степеней всемирной сети с точки зрения двух различных измерений: ,
325 729-узелный образец Альберта и др. (1999); , измерения более чем 200 миллионов страниц Бродером и
др. (2000); (a) степенное
распределение выходящих
ребер; (b) степенное
распределение входящих ребер.
Информация представлена
логарифмически для
уменьшения шума. Любезно
предоставлено Алтависта и
Эндрю Томкинами. Авторы
благодарят Луизу Амараль за
исправление ошибки в
предыдущей версии рисунка
(см. Мосса и др., 2001).
Рисунок 3. Степенное распределение некоторых реальных систем: (a) интернет на уровне
маршрутизаторов. Информация любезно
предоставлена Рамешом Говинданом; (b) сеть
сотрудничества фильмов и актеров. Барабаси
и Альберт (1999). Обратите внимание на то,
что если добавить также телевизионные
сериалы, что включает большое число
актеров, то возникает экспоненциальный
останов для больших 𝑘 (Амараль и др., 2000);
(c) соавторская сеть физиков высокой
энергии. Ньюман (2001a, 2001b); (d)
соавторская сеть нейробиологов, Барабаси и
др. (2001).
Недавно Говиндан и Тангмунарункит (2000) отобразили множество из примерно 150 000
интерфейсов маршрутизаторов и примерно 200 000 смежных маршрутизаторов, подтверждая
степенной закон с 𝛾𝐼𝑟 ≃ 2,3 [см. рис. 3(a)].
Интернет как сеть демонстрирует кластерацию и небольшую длину пути. Йук и др. (2001a) и
Пастор-Саторрас и др. (2001), изучая интернет на уровне доменов между 1997 и 1999, обнаружили,
что коэффициент кластерации менялся между 0,18 и 0,3 в сравнении с 𝐶𝑟𝑎𝑛𝑑 ≃ 0.001 для случайных
графов со сходными параметрами. Средняя длина пути для интернета на уровне доменов менялся от
3,70 до 3,77 (Пастор-Саторрас и др., 2001; Йук и др., 2001a), а на уровне маршрутизаторов он был
около 9 (Йук и др., 2001a), указывая на свойство маленького мира.
C. Сеть сотрудничества фильмов и актеров.
Сеть сотрудничества фильмов и актеров немало изучена. Она основана на базе данных о
фильмах в интернете, которая содержит все фильмы и их составы актеров с 1890-ых. В этой сети
узлы _ актеры, а два узла соединяются ребром, если соответствующие актеры играли вместе в
некотором фильме. Эта сеть постоянно увеличивается: в 1998 году было 225 226 узлов (Уоттс и
Строгатс, 1998), а к маю 2000 года это число выросло до 449 913 (Ньюман, Строгатс и Уоттс, 2000).
Средняя длина пути в сети актеров близка к значению длины для случайного графа той же
величины и средней степени _ 3,65 по сравнению с 2,9, но коэффициент кластерации 100 раз
превышает значение для случайного графа (Уоттс и Строгатс, 1998). Распределение степеней сети
фильмов и актеров имеет хвост со степенным законом для больших значений 𝑘 [см. рис. 3(b)], с
𝑃(𝑘)~ 𝑘 −𝛾𝑎𝑐𝑡𝑜𝑟 , где 𝛾𝑎𝑐𝑡𝑜𝑟 = 2.3 ± 0,1 (Барабаси и Альберт, 1999; Альберт и Барабаси, 2000; Амараль
и др., 2000).
D. Сеть научных сотрудничеств.
Аналогичная к сети актеров и фильмов сеть может быть сконструирована и для ученых, где
узлы _ ученые, и два узла соединяются, если соответствующие ученые вместе писало статью. Для
раскрытия топологии этого сложного графа Ньюман (2001a, 2001b, 2001c) в течение пяти лет (19951999) изучал четыре базы данных, охватывающие физику, биомедицинские исследования, физику
высокой энергии компьютерную науку. Все эти сети демонстрируют маленькую среднюю длину
пути, но большой коэффициент кластерации, это показано в таблице I. Степенное распределение
сети сотрудничеств физиков высокой энергии демонстрирует почти идеальный степенной закон с
показателем 1,2 [рис. 3(c)], во время как другие базы данных имеют степенной закон с более
высоким показателем в хвосте.
Барабаси и др. (2001) изучили граф сотрудничества математиков и неврологов, публикации
между 1991 и 1998. Средняя длина пути в этих сетях составляет примерно 𝑙𝑚𝑎𝑡ℎ = 9.5 и 𝑙𝑛𝑠𝑐𝑖 = 6,
коэффициенты кластерации 𝐶𝑚𝑎𝑡ℎ = 0.59 и 𝐶𝑛𝑠𝑐𝑖 = 0,76. Степенные распределения данных сетей
сотрудничеств стойкие со степенными законами с показателями 2,1 и 2,5, соответственно [см. рис.
3(d)].
E. Сеть половых контактов человека.
Многие болезни, передаваемые половым путем, включая СПИД, распространяются на сеть
сексуальных отношений. Лильерос и др. (2001) изучили сеть, составленную из сексуальных
отношений 2810 людей и основанную на широком исследовании, проведенной в Швеции в 1996.
Т.к. ребра в этой сети существуют относительно недолго, они анализировали распределение
партнеров в течение одного года, и выяснили, что и для мужчин, и для женщин распределение
имеет степенной закон с показателями 𝛾𝑓 = 3,5 ± 0,2 и 𝛾𝑚 = 3,3 ± 0,2, соответственно.
F. Клеточные сети.
Йонг и др. (2000) изучали обмен веществ 43 организмов, представляющих все три среды
жизни, объединяя их в сеть, где узлы _ субстраты (такие как ATP, ADP, H2O), а ребра представляют
преимущественно ориентированные химические реакции, в которых эти субстраты могут
участвовать. Оказалось, что для всех организмов распределение входящих и выходящих ребер
подчиняется степенному закону с показателями между 2,0 и 2,4. В силу ориентированности сетей
коэффициент кластерации не определен. Средняя длина пути приблизительно одна и та же для всех
организмов, со значением 3,3.
Коэффициент кластерации был изучен Уонгером и Феллем (2000; см. также Фелл и Уонгер,
2000), обращая внимание на энергетический и биосинтетический обмен веществ бактерии
Escherichia coli. Они открыли, что , вдобавок к степенному закону распределения степеней,
неориентированная версия этого графа обладает маленькой средней длиной пути и большим
коэффициентом кластерации (см. таблицу I).
Еще одна сеть, характеризующая клетку, описывает взаимодействия между протеинами, где
узлы _ протеины, которые соединяются ребром, если экспериментальным путем показано, что они
связаны вместе. Изучение этих физических взаимодействий показало, что распределение степеней в
карте физических взаимодействий протеинов дрожжах подчиняется степенному закону с
показателем в хвосте 𝑃(𝑘)~ (𝑘 + 𝑘0 )−𝛾𝑒− (𝑘+𝑘0 )/𝑘𝑐 , где 𝑘0 = 1, 𝑘𝑐 = 20 и 𝛾 = 2,4 (Йонг, Мейсон и
др., 2001).
G. Экологические сети.
Пищевые сети очень часто используются экологами для численной оценки взаимодействий
между различными видами (Пим, 1991). В пищевой сети узлами являются виды, а ребра
представляют отношения хищник-добыча. В недавнем исследовании, Уиллиамс и др. (2000)
изучили топологию семи наиболее документированных и больших пищевых цепей: Skipwith Pond,
Little Rock Lake, Bridge Brook Lake, Chesapeake Bay, Ythan Estuary, Coachella Valley и St. Martin
Island. В то время как эти сети широко различаются в количестве видов или средней степени, в
каждом из них виды находятся в трех или меньше ребрах друг от друга. Этот результат был
подтвержден независимым исследованием Монтоя и Сола (2000) и Камачо и др. (2001a). Они также
показали, что пищевые сети обладают высокой кластерацией. Степенное распределение было
вначале исследовано Монтоя и Сола (2000). Они сфокусировались на сетях Ythan Estuary,
Silwood Park и Little Rock Lake, считая их неориентированными. Несмотря на маленький
размер этих сетей (самый большой из них имеет 186 узлов), они разделяют свойства их бо'льших
аналогов, присущие неслучайным графам. В частности, Монтоя и Соле (2000) пришли к выводу о
том, что распределение степеней стойко со степенным законом с необычно маленьким показателем
𝛾 ≃ 1,1. Тем не менее, маленький размер этих сетей оставляет место для некоторой
неопределенности 𝑃(𝑘). Камачо и др. (2001a, 2001b) считают, что для некоторых пищевых цепей
экспоненциальный fit очень подходящий. Подтвердившееся существование ключевых видов,
которые играют важную роль в топологии пищевой сети, указывает существование узлов
(распространенное свойство сетей, не обладающих масштабом), однозначное определение топологи
сети может улучшиться благодаря более крупным сетям данных.
H. Сети телефонных звонков.
Из модели звонков дальней дистанции сконструирован большой ориентированный граф, где
узлы _ телефонные номера, а каждый звонок есть ребро, направленное от звонившего к
принявшему звонок. Абелло, Пардалос и Ресенд (1999) и Айелло, Чанг и Лу (2000) изучили граф
телефонных звонков дальней дистанции, сделанных за один день, и обнаружили, что распределение
выходящих и входящих ребер подчиняется степенному закону с показателем 𝛾𝑜𝑢𝑡 = 𝛾𝑖𝑛 = 2,1.
I. Сети цитат.
Из модели цитат научных публикаций сформирована достаточная сложная сеть, где узлами
являются статьи, а ориентированные ребра _ ссылка на ранее опубликованную статью. Рендер
(1998), изучая распределение 783 339 газет, каталогизированный Институтом Научной
Информации, и 24 296 газет, опубликованных в Физическом Обзоре между 1975 и 1994, обнаружил,
что вероятность того, что газета была процитирована 𝑘 раз, подчиняется степенному закону с
показателем 𝛾𝑐𝑖𝑡𝑒 = 3, указывая на то, что распределение входящих ребер в сети подчиняется
степенному закону. Недавнее исследование Вазкуезом (2001) распространило эти исследования
также на распределение степеней выходящих ребер, обнаружив, что оно имеет экспоненциальный
хвост.
J. Лингвистические сети.
Запутанность человеческих языков предлагает несколько возможных способов для
определения и изучения сложных сетей. Недавно Феррер и Канчо и Соле (2001) сконструировали
такую сеть для английского языка, основанной на Британском Национальном Собрании, где узлы _
это слова; эти узлы соединены, если в предложениях они либо расположены друг за другом, либо
между ними есть одно слово. Они обнаружили, что полученная сеть из 440 902 слов имеет
маленькую среднюю длину пути 𝑙 = 2,67, высокий коэффициент кластерации 𝐶 = 0,437 и
двурежимное распределение степеней со степенным законом. Слова со степенью 𝑘 ≤ 103
разлагаются с показателем степени 𝛾< = 1,5, в то время как слова с 103 < 𝑘 < 105 подчинаются
степенному закону с 𝛾> ≃ 2,7.
Другое исследование (Йук, Йонг и Барабаси, 2001b) соединяло слова в зависимости от их
значений, т. е. два слова соединялись друг с другом, если они являлись синонимами согласно
словарю Мерриам-Уебстер. Результат указывает на существование гигантского кластера из 22 311
слов из 23 279, имеющих синонимы, со средней длиной пути 𝑙 = 4,5 и с более высоким
коэффициентом кластерации 𝐶 = 0,7 в сравнении с 𝐶𝑟𝑎𝑛𝑑 = 0,0006 для эквивалентной случайной
сети. Вдобавок, распределение степеней имело хвост, подчиняющийся степенному закону с 𝛾𝑠𝑦𝑛 =
2,8. Эти результаты показывают, что во многих отношениях язык также образует сложную сеть с
принципами организации, которые мало отличаются от примеров, рассмотренных выше (см. также
Стейверс и Тененбаум, 2001).
К. Энергетические и нервные системы.
Энергетическая система западной части Соединенных Штатов описывается сложной сетью,
узлы в которой _ это генераторы, трансформаторы и подстанции, а ребра _ высоковольтные линии
передачи. Количество узлов в энергетической системе есть 𝑁 = 4941, а ⟨𝑘⟩ = 2,67. В крошечной
(𝑁 = 282) нервной сети черви нематода 𝐶. 𝑒𝑙𝑒𝑔𝑎𝑛𝑠 узлами являются нейроны, а ребро соединяет
два нейрона, если они связаны либо синапсом, либо щелевым контактом. Уоттс и Строгатс (1998)
обнаружили, что в то время как средняя длина пути приблизительно равнялась длине для
случайного графа того же размера и средней степени, их коэффициент кластерации был намного
выше (таблица I). Распределение степеней энергетической системы сопоставимо с
экспоненциальной, а для нервной сети 𝐶. 𝑒𝑙𝑒𝑔𝑎𝑛𝑠 оно имеет пик в промежуточном 𝑘, после чего
оно разрушается по экспоненте (Амараль и др., 2000).
L. Белковое свертывание.
Во время свертывания белок принимает последовательные структуры. Каждый узел
представляет отдельное состояние. Две структуры соединяются, если они могут быть получены
друг из друга с помощью элементарного изменения. Скала, Амараль и Бартелеми (2001) изучили
сеть, сформированную из структур двумерного (2D) сетчатого полимера, и обнаружили, что она
обладает свойством маленьких миров. В особенности, средняя длина пути увеличивается
логарифмически с увеличением размера полимера (и размера сети, соответственно), что
соответствует поведение случайного графа. Тем не менее, коэффициент кластерации намного
превосходит 𝐶𝑟𝑎𝑛𝑑 , и эта разница увеличивается вместе с размером сети. Распределение степеней
сети структур сопоставимо с Гауссовским (Амараль и др., 2000).
Базы данных, обсужденные выше, послужили причиной и источником вдохновения для
раскрытия топологических свойств реальных сетей. Мы часто будем обращаться к ним для
обоснования различных теоретических предсказаний или для понимания ограничений
возможностей моделирования. В остальной части данного обзора мы обсудим различные
теоретические средства, разработанные для моделирования этих сложных сетей. Для этого нам
нужно начать с родителем всех моделей сетей: теорией случайных графов Эрдоса и Ренйи.
III. Теория случайных графов.
В математических терминах сеть представляется как граф. Граф _ пара множеств 𝐺 = {𝑃, 𝐸},
где 𝑃 _ множество 𝑁 узлов (вершин или точек) 𝑃1 , 𝑃2 , … , 𝑃𝑁 , а 𝐸 _ множество ребер (соединений или
линий), которые соединяют два элемента из 𝑃.
Рисунок 4. Иллюстрация графа с 𝑁 = 5 вершинами
и 𝑛 = 4 ребрами. Множество вершин: 𝑃 = {1, 2, 3, 4, 5}.
Множество ребер: 𝐸 = {{1, 2}, {1, 5}, {2, 3}, {2, 5}}.
Графы обычно представляются как множество точек, каждая из которых соответствует
вершине. Две такие точки соединены линией, если соединены соответствующие вершины (см.
рисунок 4).
Теория графов возникла в восемнадцатом веке в работе Леонарда Эйлера, чья ранняя работа
в основном касалась маленьких графов с высокой степенью регулярности. В двадцатом веке теория
графов стала более статистической и алгоритмической. Особенно большим источником идей
являлось изучение случайных графов, т. е. графов, в которых ребра распределены случайным
образом. Сети со сложной топологией и неизвестными принципами организации часто оказываются
случайными; таким образом, теория случайных графов широко используется в изучении сложных
сетей.
Теория случайных графов была представлена Полом Эрдосом и Альфредом Ренйи (195 1960,
1961) после того, как Эрдос открыл, что вероятностные методы часто оказываются полезными в
проблемах со средствами в теории графов. Детальное обсуждение данной области доступно в
классической книге Боллобаса (1985), дополненной обозрением Коэна (1988) параллелей между
фазовыми переходами и случайными графами, а также путеводителем истории подхода Эрдоса и
Ренйи, написанным Каронским и Русинским (1997). Здесь мы кратко описываем важнейшие
результаты теории графов, обращая особое внимание на те аспекты, которые имеют прямое
отношение к сложным сетям.
A. Модель Эрдоса-Ренйи.
В своей первой классической статье о случайных графах Эрдос и Ренйи определяют граф как
𝑁 помеченных узлов, соединенных 𝑛 ребрами, которые выбраны случайным образом из 𝑁(𝑁 −
𝑛
1)/2 возможных ребер (Эрдос и Ренйи, 1959). В общем существует 𝐶[𝑁(𝑁−1)/2]
графов с 𝑁
вершинами и 𝑛 ребрами, которые формируют вероятностное пространство, в котором каждая
реализация равновероятна.
Альтернативным и эквивалентным определением случайного графа является биномиальная
модель. Здесь в начале имеется 𝑁 вершин. Каждая пара вершин соединяется с вероятностью 𝑝 (см.
рисунок 5). Следовательно общее количество ребер _ случайная величина с ожидаемым значением
𝐸(𝑛) = 𝑝[𝑁(𝑁 − 1)/2]. Если 𝐺0 _ граф с вершинами 𝑃1 , 𝑃2 , … , 𝑃𝑁 и с 𝑛 ребрами, то вероятность
получения этого графа в процессе построения есть 𝑃(𝐺0 ) = 𝑝𝑛 (1 − 𝑝)
𝑁(𝑁−1)
−𝑛
2
.
Рисунок 5. Иллюстрация
процесса изменения графа в модели
Эрдоса-Ренйи. В начале имеем 𝑁 = 10
отдельных вершин (верхняя часть
рисунка), затем каждая пара вершин
соединяется с вероятностью 𝑝. Нижняя
часть рисунка показывает два
различных этапа формирования графа,
соответствующих значениям 𝑝 = 0,1 и
𝑝 = 0,15. Мы можем увидеть
появление деревьев (дерево порядка 3,
нарисованное длинными пунктирными
линиями) и циклов (цикл порядка 3,
нарисованный короткими
пунктирными линиями), а также
соединенный кластер, который
объединяет половину вершин в 𝑝 =
0,15 = 1,5/𝑁.
Теория случайных графов изучает свойства вероятностного пространства, связанного с
графами с 𝑁 вершинами, при 𝑁 → ∞. Многие свойства таких случайных графов могут быть
определены с использованием вероятностных доводов. В этом отношении Эрдос и Ренйи
использовали определение, что почти каждый граф обладает свойством 𝑄, если вероятность
обладания свойством 𝑄 приближается к 1 при 𝑁 → ∞. Среди вопросов, поставленных Эрдосом и
Ренйи, есть такие, которые имеют непосредственную значимость в понимании сложных сетей,
например: Является ли типичный граф связным? Содержит ли он треугольник соединенных
вершин? Каким образом его диаметр зависит от его размера?
В математической литературе конструирование случайного графа часто называется
эволюцией: вначале имея множество из 𝑁 отдельных вершин, граф развивается с последовательным
добавлением случайных ребер. Графы, полученные на разных этапах этого процесса, соответствуют
все большим и большим вероятностям соединения 𝑝, и наконец, при 𝑝 → 1, получается полный
граф [имеющий максимальное количество ребер 𝑛 = 𝑁(𝑁 − 1)/2]. Основной целью теории
случайных графов является выяснение при какой вероятности соединения 𝑝 некоторое
фиксированное скорей всего свойство появится. Самым большим открытием Эрдоса и Ренйи было
то, что многие важные свойства случайных графов появляются довольно неожиданно. Т. е. при
заданной вероятности либо почти все графы обладают некоторым свойством 𝑄 (например, все пары
вершин соединены путем из последовательных ребер), либо наоборот почти все графы этим
свойством не обладают. Переход между тем, что свойство скорей всего будет или не будет
выполняться, обычно происходит очень быстро. Для многих таких свойств есть критическая
вероятность 𝑝𝑐 (𝑁). Если 𝑝(𝑁) растет медленней чем 𝑝𝑐 (𝑁) при 𝑁 → ∞, то почти каждый граф с
вероятностью соединения 𝑝(𝑁) не будет обладать свойством 𝑄. Если же 𝑝(𝑁) растет слегка быстрее
чем 𝑝𝑐 (𝑁), то почти каждый граф будет обладать свойством 𝑄. Таким образом, вероятность того,
что граф с 𝑁 вершинами и с вероятностью соединения 𝑝 = 𝑝(𝑁) имеет свойство 𝑄, удовлетворяет
следующей системе:
𝑝(𝑁)
0, 𝑖𝑓 𝑝 (𝑁) → 0
𝐶
lim 𝑃𝑁,𝑝 (𝑄) = {
(4)
𝑝(𝑁)
𝑁→∞
1, 𝑖𝑓 𝑝 (𝑁) → ∞.
𝐶
Здесь уместно важное замечание. Физики, специализированные в критических явлениях,
примут 𝑝𝐶 (𝑁) как критическую вероятность, знакомую в протекании. В литературе физики система
обычно рассматривается в фиксированном размере 𝑁, а затем различные режимы в равенстве (4)
сводятся к вопросу меньше ли 𝑝, чем 𝑝𝑐 , или наоборот. Подходящее значение 𝑝𝑐 , т. е. предел 𝑝𝑐 =
𝑝𝑐 (𝑁 → ∞) получается с помощью конечного масштабного преобразования. Базисом данного
действия является предположение, что предел существует, отражая тот факт, что в конечном счете
предел протекания не зависит от размера системы. Это в основном случай конечномерных систем,
который включает большинство систем теории просачивания и критических явлений,
представляющих интерес. Сети же, наоборот, по определению являются бесконечномерными:
количество возможных соседей узла возрастает вместе с размером системы. Соответственно, в
теории случайных графов вероятность соединения определяется как функция от размера: 𝑝
представляет из себя отношение количества существующих ребер и количества 𝑁(𝑁 − 1)/2 всех
возможных. Более крупные графы с тем же 𝑝 будут содержать больше ребер, следовательно, такие
свойства, как наличие циклов, будут иметь место для относительно маленьких 𝑝 в более крупных
графах, нежели в меньших. Это означает, что для многих свойств 𝑄 для случайных графов нет
единого независящего от 𝑁 предела, но мы можем определить предельную функцию, которая
зависит от размера системы, и 𝑝𝐶 (𝑁 → ∞) → 0. Тем не менее, мы увидим, что средняя степень
графа
⟨𝑘⟩ = 2𝑛/𝑁 = 𝑝(𝑁 − 1) ≃ 𝑝𝑁
(5)
имеет критическое значение, независимое от размера системы. В следующей части мы
проиллюстрируем эти идеи, рассматривая появление различных подграфов в случайных графах.
B. Подграфы.
Первым свойством случайных графов, изученным Эрдосом и Ренйи (1959), было появление
подграфов. Граф 𝐺1 , состоящий из 𝑃1 вершин и множества ребер 𝐸1 , является подграфом графа 𝐺 =
{𝑃, 𝐸}, если все вершины в 𝑃1 содержатся также и в 𝑃 и все ребра из 𝐸1 являются также ребрами из
𝐸. Самыми простыми примерами подграфов являются циклы, деревья и полные подграфы (клики)
(см. рисунок 5). Цикл порядка 𝑘_ это замкнутая петля из 𝑘 ребер такой что каждая пара
последовательных ребер, и только она, имеет общую вершину. Таким образом, графически
треугольник _ цикл порядка 3, а квадрат _ порядка 4. Средняя степень цикла равняется двум, т.к. у
каждой вершины есть два ребра. Противоположностью к циклам являются деревья. Более точно,
граф является деревом порядка 𝑘, если он имеет 𝑘 вершин и 𝑘 − 1 ребер, и ни один из его
подграфов не является циклом. Средняя степень дерева порядка 𝑘 есть ⟨𝑘⟩ = 2 − 2/𝑘, что
приближается к 2 для больших 𝑘. Полные подграфы (клики) порядка 𝑘 содержат 𝑘 вершин и все
возможные 𝑘(𝑘 − 1)/2 ребер, другими словами, они полностью связаны.
Рассмотрим процесс эволюции, описанном на рисунке 5 для графа 𝐺 = 𝐺𝑁,𝑝 .
Рисунок 6. Предельные
вероятности, при которых в
случайных графах
появляются различные
подграфы. При 𝑝𝑁 3/2 → 0
граф состоит из отдельных
вершин и ребер. При
𝑝~𝑁 −3/2 появляются
деревья порядка 3, а при
𝑝~𝑁 −4/3 _ порядка 4. При
𝑝~𝑁 −1 присутствуют деревья всех порядков, в то же время появляются циклы всех порядков. Вероятность
𝑝~𝑁 −2/3 отмечает появление полных подграфов порядка 4, а 𝑝~𝑁 −1/2 соответствует наличию кликов
порядка 5. При приближении 𝑧 к нулю граф содержит полные подграфы увеличивающегося порядка.
В начале имеем 𝑁 отдельных вершин, потом соединяем каждую пару вершин с вероятностью 𝑝. Для
маленьких вероятностей соединения вершины изолированы, но с ростом 𝑝 и количества ребер
вместе с ним, два ребра могут быть соединены с одной и той же вершиной, формируя деревья
порядка 3. В общем случае мы можем спросить есть ли критическая вероятность, которая отмечает
наличие произвольных подграфов с 𝑘 вершинами и 𝑙 ребрами.
В теории случайных графов есть строго доказанный ответ на этот вопрос (Боллобас, 1985).
Пусть имеем случайный граф 𝐺 = 𝐺𝑁,𝑝 . Пусть также имеем маленький граф 𝐹 с 𝑘 вершинами и 𝑙
ребрами. В принципе, случайный граф 𝐺 может содержать несколько таких подграфов 𝐹. Наша
первая цель _ определить, сколько таких подграфов существует. 𝑘 вершин могут быть выбраны из
всех 𝑁 вершин 𝐶𝑁𝑘 способами, а 𝑙 ребра формируются с вероятностью 𝑝𝑙 . В добавок, мы можем
переставлять эти 𝑘 вершин и получить 𝑘! новых графов (точное значение есть 𝑘!/𝑎, где 𝑎 _
количество изоморфных графов). Таким образом, количество подграфов 𝐹, содержащихся в 𝐺, есть
𝐸(𝑋) = 𝐶𝑁𝑘
𝑘!
𝑎
𝑝𝑙 ≃
𝑁 𝑘 𝑝𝑙
𝑎
.
(6)
Данная запись подсказывает о том, что фактическое количество таких подграфов, 𝑋, может
отличаться от 𝐸(𝑋), но в большинстве случаев эти числа будут близки. Заметим, что подграфы не
обязаны быть изолированными, т.е. могут существовать ребра с одной вершиной внутри подграфа и
с другой _ снаружи.
Равенство (6) показывает, что если p(𝑁) такое что 𝑝(𝑁)𝑁𝑘/𝑙 → 0 при 𝑁 → 0, то количество
подграфов 𝐸(𝑋) → 0, т.е. почти ни один случайный граф не содержит подграф 𝐹. Тем не менее,
если 𝑝(𝑁) = 𝑁 −𝑘/𝑙 , то среднее количество подграфов _ конечное число, которое обозначается через
𝜆 = 𝑐 𝑙 /𝑎, отмечая, что эта функция может быть критической вероятностью. Достоверность данного
результата может быть проверена вычислением распределения количеств подграфов, 𝑃𝑝 (𝑋 = 𝑟),
получая (Боллобас, 1985)
𝜆𝑟
lim 𝑃𝑝 (𝑋 = 𝑟) = 𝑒 −𝜆 𝑟! .
𝑁→∞
Тогда вероятность того, что 𝐺 содержит хотя бы один такой подграф 𝐹, равняется
(7)
−𝜆
𝑃𝑝 (𝐺 ⊃ 𝐹) = ∑∞
(8)
𝑟=1 𝑃𝑝 (𝑋 = 𝑟) = 1 − 𝑒 ,
𝑘/𝑙
что стремится к 1 с увеличением 𝑐. Для значений 𝑝, удовлетворяющих 𝑝𝑁 → ∞, вероятность
𝑃𝑝 (𝐺 ⊃ 𝐹) стремится к 1. Итак, действительно, критическая вероятность, при которой каждый граф
содержит подграф с 𝑘 вершинами и 𝑙 ребрами есть 𝑝𝐶 (𝑁) = 𝑐𝑁 −𝑘/𝑙 .
Несколько важных особых случая следуют прямо из равенства (8):
(a) Критическая вероятность наличия дерева порядка 𝑘 есть 𝑝𝐶 (𝑁) = 𝑐𝑁 −𝑘/(𝑘−1) .
(b) Критическая вероятность наличия цикла порядка 𝑘 есть 𝑝𝐶 (𝑁) = 𝑐𝑁 −1.
(c) Критическая вероятность наличия клики порядка 𝑘 есть 𝑝𝐶 (𝑁) = 𝑐𝑁 −2/(𝑘−1) .
C.Эволюция графов.
Полезно посмотреть на результаты, обсужденные выше, с другой точки зрения. Пусть
имеется случайный граф с 𝑁 вершинами. Допустим, вероятность соединения 𝑝(𝑁) меняется как 𝑁 𝑧 ,
где 𝑧 _ перестраиваемый параметр, который может принимать значения между 0 и ∞ (рисунок 6).
Для значений 𝑧, меньших чем −3/2 почти все графы содержат изолированные вершины и ребра.
Когда 𝑧 начинает превосходить −3/2, неожиданно начинают появляться деревья порядка 3. Когда 𝑧
достигает значения −4/3, появляются деревья порядка 4, и, по мере того как 𝑧 приближается к −1,
граф содержит деревья большего и большего порядка. Тем не менее, пока 𝑧 < −1 такой что средняя
степень графа ⟨𝑘⟩ = 𝑝𝑁 → 0 при 𝑁 → ∞, граф представляет из себя объединение несвязанных
деревьев, а циклы отсутствуют. В точности когда 𝑧 перешагивает значение −1, что соответствует
⟨𝑘⟩ = 𝑐𝑜𝑛𝑠𝑡, не смотря на то, что 𝑧 равномерно меняется, асимптотическая вероятность наличия
циклов всех порядков прыгает от 0 к 1. Циклы порядка 3 могут также быть рассмотрены как клики
того же порядка. Клики порядка 4 появляются при 𝑧 = −2/3, и по мере того как 𝑧 продолжает
расти, возникают клики все большего и большего порядка. И наконец, когда 𝑧 приближается к 0,
граф содержит клики всех конечных порядков.
Дальнейшие результаты могут быть получены для 𝑧 = −1, т.е. когда имеем 𝑝 ∝ 𝑁 −1 и
средняя степень узлов ⟨𝑘⟩ = 𝑐𝑜𝑛𝑠𝑡. Для 𝑝 ∝ 𝑁 −1 случайный граф содержит циклы и деревья всех
порядков, однако до сих пор мы не обсуждали размер и структуру типичной составляющей графа.
Образующая графа по определению есть связный изолированный подграф, который в
исследованиях сетей и теории просачивания также называется кластером. Как показывают Эрдос и
Ренйи (1960), в структуре кластера случайного графа есть неожиданное изменение, когда ⟨𝑘⟩
приближается к 1.
Если 0 < ⟨𝑘⟩ < 1, то все кластеры почти наверняка являются деревьями или содержат ровно
один цикл. Несмотря на наличие циклов, почти все вершины принадлежат деревьям. Среднее
количество кластеров есть число порядка 𝑁 − 𝑛, где 𝑛 _ количество ребер, т.е. при добавлении
нового ребра количество кластеров уменьшается на 1. Самый большой кластер является деревом,
размер которого пропорционален к ln 𝑁.
Когда ⟨𝑘⟩ перешагивает предел ⟨𝑘⟩𝑐 = 1, структура графа неожиданно изменяется. В то
время как для ⟨𝑘⟩ < 1 самый большой кластер является деревом, для ⟨𝑘⟩𝑐 = 1 он имеет
приблизительно 𝑁 2/3 вершин и довольно сложную структуру. Более того, для ⟨𝑘⟩ > 1 самый
большой (гигантский) кластер имеет [1 − 𝑓(⟨𝑘⟩)]𝑁 вершин, где 𝑓(𝑥) _ функция, которая
экспоненциально уменьшается от 𝑓(1) = 1 к 0 при 𝑥 → ∞. Таким образом, конечная часть вершин,
𝑆 = 1 − 𝑓(⟨𝑘⟩) принадлежит самому большому кластеру. Кроме этого гигантского кластера, все
остальные кластеры относительно невелики, большинство из них являются деревьями, а общее
количество вершин, принадлежащих деревьям, есть 𝑁(⟨𝑘⟩). С увеличением ⟨𝑘⟩ маленькие кластеры
сливаются и соединяются к гигантскому кластеру, причем чем меньше кластер, чем больше
вероятность того, что он не соединится.
Таким образом, при 𝑝𝑐 ≃ 1/𝑁 топология случайного графа внезапно изменяется от
множества отдельных маленьких кластеров к системе с одним доминирующим гигантским
кластером. Начало сверхкритической фазы было исследовано Боллобасом (1984), Колчином (1986)
и Лукзаком (1990). Достигнутые ими результаты показывают, что в это время самый большой
кластер явно отделяется от остальных кластеров, а его размер 𝑆 увеличивается пропорционально
разделению критической вероятности,
𝑆 ∝ (𝑝 − 𝑝𝑐 ).
(9)
Как
мы увидим с разделе IV.F, эта зависимость аналогична вероятности протекания в
бесконечномерном протекании.
D. Распределение степеней.
Эрдос и Ренйи (1959) были первыми, кто изучал распределение максимальных и
минимальных степеней в случайном графе. Полное распределение степеней в дальнейшем было
выведено Боллобасом (1981).
В случайном графе с вероятностью соединения 𝑝 степень 𝑘𝑖 вершины 𝑖 имеет биномиальное
распределение с параметрами 𝑁 − 1 и 𝑝:
𝑘
𝑃(𝑘𝑖 = 𝑘) = 𝐶𝑁−1
𝑝𝑘 (1 − 𝑝)𝑁−1−𝑘 .
(10)
Эта вероятность представляет количество способов, которыми 𝑘 ребер могут выходит из
определенной вершины: вероятность 𝑘 ребер есть 𝑝𝑘 , вероятность отсутствия дополнительных
𝑘
ребер есть (1 − 𝑝)𝑁−1−𝑘 , и есть 𝐶𝑁−1
эквивалентных способа выбрать 𝑘 вершин на концах этих
ребер. Более того, если 𝑖 и 𝑗 _ отличные друг от друга вершины, то 𝑃(𝑘𝑖 = 𝑘) и 𝑃(𝑘𝑗 = 𝑘) близки к
тому, чтобы быть независимыми случайными переменными. Для нахождения распределения
степеней графа нам необходимо изучить количество вершин со степенью 𝑘, 𝑋𝑘 . Нашей основной
целью является определение вероятности того, что 𝑋𝑘 будет иметь заданное значение, 𝑃(𝑋𝑘 = 𝑟).
Рисунок 7.Распределение
степеней, полученное из
цифрового моделирования
случайного графа. Мы
сгенерировали единственных
случайный граф с 𝑁 = 10000 и
вероятностью соединения 𝑝 =
0,0015 и вычислили
количество вершин со
степенью 𝑘, 𝑋𝑘 . График
сравнивает 𝑋𝑘 /𝑁 с ожидаемой
величиной в Пуассоновском
𝐸(𝑋 )
распределении (13), 𝑁𝑘 =
= 𝑃(𝑘𝑖 = 𝑘), и мы можем
увидеть, что отклонение _
небольшое.
где
Согласно равенству (10), ожидаемое количество вершин со степенью 𝑘 есть
𝐸(𝑋𝑘 ) = 𝑁𝑃(𝑘𝑖 = 𝑘) = 𝜆𝑘 ,
(11)
𝑘
𝜆𝑘 = 𝑁𝐶𝑁−1
𝑝𝑘 (1 − 𝑝)𝑁−1−𝑘 .
(12)
Как и в выводе условий существования подграфов (см. раздел III.B), распределение величин
𝑋𝑘 , 𝑃(𝑋𝑘 = 𝑟), приближается к Пуассоновскому распределению,
𝑃(𝑋𝑘 = 𝑟) = 𝑒 −𝜆𝑘
𝜆𝑟𝑘
𝑘!
.
(13)
Таким образом, количество вершин со степенью 𝑘 имеет распределение Пуассона со средним
значением 𝜆𝑘 . Заметим, что ожидаемое значение в распределении (13) есть функция 𝜆𝑘 , заданная
равенством (12), а не константа. Распределение Пуассона быстро затухает для больших значений 𝑟
со стандартным отклонением 𝜎𝑘 = √𝜆𝑘 . После небольшого упрощение можем сказать, что
равенство (13) предполагает, что 𝑋𝑘 не отклоняется намного от приблизительного результата 𝑋𝑘 =
𝑁𝑃(𝑘𝑖 = 𝑘), что верно только если вершины независимы (см. рисунок 7). Таким образом, с
хорошим приближением, распределение степеней случайного графа _ биномиальное,
𝑘
𝑃(𝑘) = 𝐶𝑁−1
𝑝𝑘 (1 − 𝑝)𝑁−1−𝑘 ,
(14)
Что для больших значений 𝑁 может быть заменено распределением Пуассона,
(𝑝𝑁)𝑘
⟨𝑘⟩𝑘
𝑃(𝑘) ≃ 𝑒 −𝑝𝑁 𝑘! = 𝑒 −⟨𝑘⟩ 𝑘! .
(15)
После новаторской статьи Эрдоса и Ренйи, была проведена огромная работа в изучении
существования и единственности минимальной и максимальной степени в случайном графе.
Результаты показывают, что для большого множества значений 𝑝 и максимальная, и минимальная
степень определены и конечны. Например, если 𝑝(𝑁)~𝑁 −1−1/𝑘 (а граф, следовательно, является
множеством изолированных деревьев порядка не больше чем 𝑘 + 1), то почти ни один граф не
имеет вершин со степенью выше чем 𝑘. Если же 𝑝 = {ln(𝑁) + ln[ln(𝑁)] + 𝑐 /𝑁}, то почти в каждом
графе минимальная степень не меньше чем 𝑘. Кроме того, для достаточно большого 𝑝,
соответственно, если 𝑝𝑁 ln(𝑁) → ∞, то максимальная степень почти всех случайных графов имеет
тот же порядок величины, что и средняя степень. Таким образом, несмотря на то, что распределение
ребер случайно, типичный случайный граф достаточно однородный и большинство вершин имеют
одно и то же количество ребер.
E. Связность и диаметр.
Диаметр графа _ максимальное расстояние между любой парой вершин. Строго говоря,
диаметр несвязного графа (т.е. такого, который состоит из отдельных кластеров) бесконечен, но он
может быть определен как максимальный диаметр кластеров графа. Случайные графы склонны
иметь маленький диаметр, если конечно значение 𝑝 не слишком мало. Причина этого заключается в
том, что граф вероятно будет распространяться: с большой вероятностью количество вершин,
расстояние которых от некоторой фиксированной вершины есть 𝑙, не намного меньше ⟨𝑘⟩𝑙 .
Приравнивая ⟨𝑘⟩𝑙 с 𝑁, получим, что диаметр пропорционален ln(𝑁)/ ln(⟨𝑘⟩); следовательно, от
количества вершин он зависит только логарифмически.
Диаметр случайного графа изучался многими авторами (см. Чанг и Лу, 2001). Общим
выводом является то, что для большинства значений 𝑝 почти все графы с теми же значениями 𝑁 и 𝑝
имеют приблизительно одинаковый диаметр. Это означает, что при рассмотрении всех графов с 𝑁
вершинами и вероятностью соединения 𝑝 промежуток значений, в котором диаметры этих графов
могут меняться, очень маленький, и обычно сконцентрированный вокруг
𝑑=
ln(𝑁)
ln(𝑝𝑁)
=
ln(𝑁)
ln(⟨𝑘⟩)
.
(16)
Ниже мы подытожим несколько важных результатов:
 Если ⟨𝑘⟩ = 𝑝𝑁 < 1, типичный граф состоит из деревьев и его диаметр равен диаметру дерева.
 Если ⟨𝑘⟩ > 1, появляется гигантский кластер. Диаметр графа равен диаметру гигантского
кластера, если ⟨𝑘⟩ ≥ 3,5 и пропорционален ln(𝑁) / ln(⟨𝑘⟩).
 Если ⟨𝑘⟩ ≥ ln(𝑁), то почти все графы полностью связные. Диаметры графов, имеющих
одинаковые 𝑁 и ⟨𝑘⟩, сконцентрированы на нескольких величинах, близких к ln(𝑁) / ln(⟨𝑘⟩).
Для определения степени разброса случайного графа можно также вычислить среднее
расстояние между всеми парами вершин или посчитать среднюю длину пути. Можно ожидать, что
средняя длина пути соотносится с количеством вершин также, как и диаметр,
𝑙𝑟𝑎𝑛𝑑 ~ ln(𝑁) / ln(⟨𝑘⟩).
(17)
Рисунок 8. Сравнение между средней
длиной пути реальных сетей и
предположения (17) теории случайных
графов (пунктирная линия). Для каждого
символа мы отмечаем соответствующее
число в таблицах I и II: маленький ○, I.12;
большой ○, I.13; , I.17; маленький □, I.10;
средний □, I.11; большой □, II.13;
маленькой ●, II.6; средний ●, I.2; ×, I.16;
маленький , I.7; маленький ■, I.15;
большой , I.4; маленький , I.5; большой
, I.6; большой ●, II.6; маленький ♦, I.1;
маленький , I.7; , I.3; средний ♦, II.1;
большой ■, I.14; большой , I.5; большой
♦, II.3.
В разделе II мы представили доказательство того, что средняя длина пути в реальных сетях
близка к средней длине пути в случайных графах того же размера. Равенство (17) дает нам
возможность для лучшего сравнения случайных графов и реальных сетей (см. Ньюман 2001a,
2001c). Согласно равенству (17), произведение 𝑙𝑟𝑎𝑛𝑑 ln(⟨𝑘⟩) совпадает с ln(𝑁), поэтому графическое
представление 𝑙𝑟𝑎𝑛𝑑 ln(⟨𝑘⟩) как функции от ln(𝑁) для случайных графов разных размеров дает
линию с наклоном 1. В рисунке 8 мы графически изображаем аналогичные произведения для
нескольких реальных сетей, 𝑙𝑟𝑒𝑎𝑙 log(⟨𝑘⟩), как функция от размера сети, сравнивая ее с ожидаемым
значением в равенстве (17). Мы можем увидеть, что направление данных совпадает с
теоретическим предсказанием, и, с некоторыми исключениями, равенство (17) дает первое
приемлемое приближение.
F. Коэффициент кластерации.
Как мы заметили в разделе II, сложные сети имеют высокую степень кластерации. Если
рассмотреть вершину в случайном графе вместе с двумя его ближайшими соседними вершинами,
вероятность того, что эти соседи соединены равна вероятности того, что соединены две случайно
выбранные вершины. Следовательно, коэффициент кластерации случайного графа равен
𝐶𝑟𝑎𝑛𝑑 = 𝑝 = ⟨𝑘⟩/𝑁.
(18)
Согласно равенству (18), если мы графически изобразим отношение 𝐶𝑟𝑎𝑛𝑑 /⟨𝑘⟩ как
функцию от 𝑁 для случайных графов разных размеров, на графике в двойном логарифмическом
масштабе они выстроятся в линию вдоль прямой с наклоном −1. На рисунке 9 мы изобразили
отношение коэффициента кластерации реальных сетей и их среднюю степень как функцию от их
размера, сравнивая с ожидаемой величиной в равенстве (18). График ясно показывает, что
реальные сети не следуют предсказанию для случайных графов. Отношение не увеличивается как
𝑁 −1; вместо этого оно оказывается независимым от 𝑁. Это свойство характерно для больших
упорядоченных сетей, коэффициент кластерации которых зависит только от числа
координированности сети, а не от его размера (Уоттс и Строгатс, 1998).
G.Спектр графа.
Произвольный граф 𝐺 с 𝑁 вершинами может быть представлен с помощью матрицы
инцидентности 𝐴(𝐺) с 𝑁 × 𝑁 элементами 𝐴𝑖𝑗 , где 𝐴𝑖𝑗 = 𝐴𝑗𝑖 = 1, если вершины 𝑖 и 𝑗 соединены, и
0, в противном случае. Спектром графа 𝐺 называется множество собственных значений его
матрицы инцидентности 𝐴(𝐺). Граф с 𝑁 вершинами имеет 𝑁 собственных значений 𝜆𝑗
𝑁
1
𝑝(𝜆) = ∑ 𝛿(𝜆 − 𝜆𝑗 ) ,
𝑁
(19)
𝑗=1
что приближается к непрерывной функции, если 𝑁 → ∞.
Рисунок 9. Сравнение коэффициентов
кластерации реальных сетей и
случайных графов. Все сети из
таблицыI включены в рисунок, а
символы совпадают с символами из
рисунка 8. Пунктирная линия
соответствует равенству (18).
Рисунок 10. Спектральная плотность с измененным масштабом трех случайных графов с 𝑝 = 0,05 и с
размерами 𝑁 = 100 (непрерывная линия), 𝑁 = 300 (линия с длинными пунктирами), и 𝑁 = 1000 (линия с
короткими пунктирами). Изолированный пик соответствует главному собственному значению. Фаркас и др.
(2001).
Интерес к свойствам спектров связан с тем, что спектральная плотность напрямую связан с
топологическими характеристиками графа, т.к. его 𝑘-ый момент может быть представлен как
𝑁
1
1
∑(𝜆𝑗 )𝑘 =
∑ 𝐴𝑖1 ,𝑖2 , 𝐴𝑖2 ,𝑖3 , … , 𝐴𝑖𝑘,𝑖1 ,
𝑁
𝑁
𝑗=1
(20)
𝑖1 ,𝑖2 ,…,𝑖𝑘
т.е. количество путей, идущих к той же вершине в графе. Заметим, пути могут содержать вершины,
которые уже были посещены.
Рассмотрим случайный граф 𝐺𝑁,𝑝 , удовлетворяющий условию 𝑝(𝑁) = 𝑐𝑁 −𝑧 . Для 𝑧 < 1 в
графе существует бесконечный кластер (см. раздел III.C), и при 𝑁 → ∞ почти наверняка каждая
вершина принадлежит этому бесконечному кластеру. В этом случае спектральная плотность
случайного графа стремится к полукружному распределению (см. рисунок 10),
√4𝑁𝑝(1 − 𝑝) − 𝜆2
𝑖𝑓 |𝜆| < 2√𝑁𝑝(1 − 𝑝)
𝑝(𝜆) = { 2𝜋𝑁𝑝(1 − 𝑝)
(21)
0
в противном случае
Известное как закон Уингера (см. Уингер, 1955, 1957, 1958) или закон полуокружности равенство
(21) имеет много применений в квантовой, статистической физике и физике твердого тела (Мегта,
1991; Крисанти и др., 1993; Гар, 1998). Самое большие (важнейшее) собственное значение, 𝜆1 ,
изолированно от объема спектра и увеличивается вместе с размером сети как 𝑁𝑝.
При 𝑧 > 1 спектральная плотность отличается от закона полуокружности. Самым
поразительным свойством 𝑝(𝜆) является то, что в нечетные моменты он равен нулю. Это означает,
что для того, чтобы путь вернулся в первоначальную вершину, он должен пройти в точности через
те же вершины. Это яркое свойство структуры дерева, и, в самом деле, в разделе III.B мы увидели,
что в данном случае случайный граф состоит из деревьев.
IV. Теория протекания.
Одним из самых интересных открытий в теории случайных графов _ это существование
критической вероятности, при которой формируется гигантский кластер. Переводя на язык сетей,
теория отмечает существование критической вероятности 𝑝𝑐 такой что до 𝑝𝑐 сеть состоит из
изолированных кластеров, а после 𝑝𝑐 гигантский кластер охватывает всю сеть. Это явление заметно
похоже на перколяционный переход, тема, много изученная в математике и статистической
механике (Стауффер и Аарони, 1992; Бунд и Халвин, 1994, 1996; Гтиммет, 1999; бен Авраам и
Халвин, 2000). И в самом деле, перколяционный перехода и появление гигантского кластера _ это
одно и то же явление, выраженное на разных языках. Теория просачивания, тем не менее, прямо не
воспроизводит предсказание в теории случайных графов. Рассматривая проблемы с другой точки
зрения, она обращается к нескольким ключевым понимании реальных сетей вопросам, которые,
однако, не обсуждаются в теории случайных графов. Следовательно, важно рассмотреть
предсказания теории протекания, значимые для сетей, т.к. они _ ключевые для понимания важных
аспектов топологии сетей.
A. Интересные величины в теории протекания.
Рассмотрим регулярную 𝑑-мерную сеть, ребра которой имеют вероятность присутствия 𝑝 и
отсутствия 1 − 𝑝. Теория протекания изучает возникновение путей, которые проходят сквозь сеть
(начинаясь в одной стороне и кончаясь в противоположной). Для маленьких значений 𝑝
присутствует только несколько ребер, поэтому могут формироваться только маленькие кластеры
вершин, соединенных ребрами, а при критической вероятности 𝑝𝑐 , называемой пределом
перколяции, появляется перколяционный кластер вершин, соединенных ребрами (см. рисунок 11).
Этот кластер также называется бесконечным кластером, т.к. его размер расходится с увеличением
размера сети. Есть несколько хорошо изученных версий перколяции. Представленная выше версия
называется “связной перколяцией”.
Рисунок 11. Двумерная иллюстрация
связной перколяции. Узлы размешены
в сетке 25 × 25, два узла соединяются
с вероятностью 𝑝. Для 𝑝 = 0,315
(слева), что ниже предела перколяции
𝑝𝑐 = 0,5, соединенные узлы
формируют изолированные кластеры.
Для 𝑝 = 0,525 (справа), что выше
предела перколяции, появляется самый
большой кластер.
Самой известной альтернативой является позиционная перколяция, в которой все связи
присутствуют, а узлы сети не являются изолированными с вероятностью 𝑝. Также, как и для
связной перколяции, только для маленьких значений 𝑝 существуют конечные кластеры связанных
ребер, а для 𝑝 > 𝑝𝑐 появляется бесконечный кластер.
Ниже приведены основные величины, представляющие интерес в перколяции:
(1) Вероятность перколяции 𝑃, обозначает вероятность того, что заданный узел принадлежит
бесконечному кластеру:
𝑃 = 𝑃𝑝 (|𝐶| = ∞) = 1 − ∑ 𝑃𝑝 (|𝐶| = 𝑠),
(22)
𝑠<∞
где 𝑃𝑝 (|𝐶| = 𝑠) обозначает вероятность того, что кластер в начале имеет размер 𝑠. Очевидно
0
если 𝑝 < 𝑝𝑐
𝑃={
.
(23)
> 0 если 𝑝 > 𝑝𝑐
(2) Средний размер кластера ⟨𝑠⟩, определенное как
∞
⟨𝑠⟩ = 𝐸𝑝 (|𝐶|) = ∑ 𝑠𝑃𝑝 (|𝐶| = 𝑠),
(24)
𝑠=1
давая ожидаемое значение размера кластера. Т.к. ⟨𝑠⟩ бесконечно при 𝑃 > 0, в таком случае
лучше работать со средним размером конечных кластеров, убирая из системы конечный
кластер |𝐶| = ∞
⟨𝑠⟩ 𝑓 = 𝐸𝑝 (|𝐶|, |𝐶| < ∞) = ∑ 𝑠𝑃𝑝 (|𝐶| = 𝑠).
𝑠<∞
(25)
(3) Распределение размера кластеров 𝑛𝑠 , определенное как вероятность того, что узел имеет
фиксированную позицию в кластере размера 𝑠 (например, узел является левым концом, если
данная позиция однозначно определена).
1
𝑛𝑠 = 𝑃𝑝 (|𝐶| = 𝑠).
(26)
𝑠
Заметим, что 𝑛𝑠 не совпадает с вероятностью того, что узел является частью кластера размера
𝑠. Фиксируя позицию узла в кластере, мы выбираем лишь один из возможных 𝑠 узлов. Это
отражено в том, что 𝑃𝑝 (|𝐶| = 𝑠) разделено на 𝑠, гарантируя, что мы считаем каждый кластер
только один раз.
Эти количества представляют интерес также и в случайных сетях. Тем не менее, есть одно важное
различие между теорией протекания и случайными сетями: теория протекания определена на
регулярных 𝑑-мерных сетях. В случайной сети (или графе) мы можем определить неметрическое
расстояние вдоль ребер, но т.к. любая вершина может быть соединена ребром с любой другой
вершиной, нет регулярной сети маленькой меры, в которую сеть может быть помещена. Тем не
менее, как мы обсудим ниже, случайные сети и теория протекания встречаются в
бесконечномерном пределе (𝑑 → ∞) протекания. К счастью, многие результаты в теории
протекания могут быть обобщены для бесконечных измерений. Следовательно, результаты,
полученные в контексте протекания, распространяются также и на случайные сети.
B.Общие результаты.
1. Субкритическая фаза (𝑝 < 𝑝𝑐 ).
Когда 𝑝 < 𝑝𝑐 , в системе присутствуют только маленькие кластеры соединенных ребер. На
данном этапе придвигаются следующие вопросы: (i) какова вероятность существования пути 𝑥 ↔ 𝑦,
соединяющей две случайно выбранные вершины 𝑥 и 𝑦? и (ii) какова степень разложения 𝑃𝑝 (|𝐶| = 𝑠)
при 𝑠 → ∞? Первый результат такого рода был достигнут Хаммерслейем (1957). Он показал, что
вероятность соединения пути с первоначальной вершиной на поверхности, 𝜕𝐵(𝑟), куба с центром в
начале и длиной сторон 2𝑟 затухает экспоненциально при 𝑃 < ∞. Мы можем определить длину
корреляции 𝜉 как характеристическую длину экспоненциального затухания
𝑃𝑝 [0 ↔ 𝜕𝐵(𝑟)]~𝑒 −𝑟/𝜉 ,
(27)
Где 0 ↔ 𝜕𝐵(𝑟) означает, что существует путь из первоначальной вершины к произвольному узлу в
𝜕𝐵(𝑟). Равенство (27) показывает, что радиус конечных кластеров в субкритической части имеет
экспоненциально убывающий хвост, а корреляционная длина представляет средний радиус
конечного кластера. Было показано (Гриммет, 1999), что 𝜉 равен 0 при 𝑝 = 0 и стремится к
бесконечности при 𝑝 → 𝑝𝑐 .
Экспоненциальное убывание радиусов кластеров предполагает, что вероятность того, что
кластер имеет размер 𝑠, 𝑃𝑝 (|𝐶| = 𝑠), также убывает экспоненциально для больших значений 𝑠:
𝑃𝑝 (|𝐶| = 𝑠)~𝑒 −𝛼(𝑝)𝑠 при 𝑠 → ∞,
(28)
)
Где 𝛼(𝑝) → ∞ при 𝑝 → ∞ и 𝛼(𝑝𝑐 = 0.
2. Сверхкритическая фаза (𝑝 > 𝑝𝑐 ).
Для 𝑃 > 0 существует точно один бесконечный кластер (Бартон и Кеан, 1989). В этой
сверхкритической фазе прежде исследованные количества доминируются вкладом бесконечного
кластера; таким образом полезно изучить соответствующие вероятности в терминах конечных
кластеров. Вероятность того, что существует путь с начала до поверхности куба с длиной сторон
2𝑟, который не является частью бесконечного кластера, экспоненциально убывает
𝑃𝑝 [0 ↔ 𝜕𝐵(𝑟), |𝐶| < ∞]~𝑒 −𝑟/𝜉 .
(29)
В отличие от субкритической фазы, несмотря на то, что убывание размеров кластеров,
(𝑑−𝐼)/𝑑
𝑃𝑝 (|𝐶| = 𝑠) < ∞, строго экспоненциально, 𝑒 −𝛽(𝑝)𝑠
, предлагая первое количество, которое
зависит от размерности сети, но даже эта зависимость исчезает при 𝑑 → ∞, и распределение
размера кластера экспоненциально убывает как и субкритической фазе.
C. Точные решения: протекание в дереве Кэли.
Дерево Кэли (или сеть Бете) не содержит циклы (см. рисунок 12), в котором каждая вершина
имеет 𝑧 соседей, за исключением вершин на поверхности. В то время как поверхность и объем
регулярного 𝑑-мерного объекта подчиняется масштабному соотношению поверхность∝
объем 1−1/𝑑 и только в пределе 𝑑 → ∞ поверхность пропорциональна объему, для дерева Кэли
количество вершин на поверхности пропорционально общему количеству вершин (т.е. объему
дерева).
Рисунок 12. Образец дерева Кэли с координированным
числом 𝑧 = 3. Все вершины имеют три ребра, кроме
вершин на поверхности, которые имеют только одно
ребро. Соотношение между количеством вершин на
поверхности и общим количеством вершин
приближается к константе, (𝑧 − 2)/(𝑧 − 1), свойство,
которое справедливо только для бесконечномерных
объектов. Средняя степень приближается ⟨𝑘⟩ = 2, когда
размер дерева стремится к бесконечности, свойство,
которое довольно часто встречается у случайных
деревьев (см. раздел III.B).
Таким образом, в этом отношении дерево Кэли представляет собой бесконечномерный объект. Еще
одним аргументом в пользу бесконечномерности дерева Кэли является то, что в нем нет циклов.
Отсюда, несмотря на его регулярную топологию, дерево Кэли представляет имеющее смысл
приближение к топологии случайных сетей в субкритической фазе, где все кластеры являются
деревьями. Это неверно в сверхкритической фазе, т.к. при критической вероятности 𝑝𝑐 (𝑁) в графе
появляются циклы всех порядков (см. раздел III.C).
Для исследования протекания в дереве Кэли мы предполагаем, что каждое ребро
присутствует с вероятностью 𝑝. Затем мы обсуждаем основные количества, представляющие
интерес для данной системы.
(a) Предел протекания: Присутствие хотя бы одного из 𝑧 − 1 возможных ребер из вершины
(т.е.(𝑧 − 1)𝑝 ≥ 1) является условием существования бесконечного пути от начала. Отсюда,
предел протекания равен
1
𝑝𝑐 =
.
(30)
𝑧−1
(b) Вероятность протекания: Для дерева Кэли с 𝑧 = 3, для которого 𝑝𝑐 = 1/2 вероятность
протекания дается следующим образом (Стауффер и Аарони, 1192)
1
0
если 𝑝 < 𝑝𝑐 =
2
𝑃 = 2𝑝 − 1
(31)
1
если
𝑝
>
𝑝
=
.
𝑐
{ 𝑝2
2
1
Разложение в ряд Тейлора в окрестности 𝑝𝑐 = 1/2 дает 𝑃 ≃ 8(𝑝 − 2), следовательно,
вероятность протекания, пропорциональную отклонению от предела протекания
𝑃 ∝ (𝑝 − 𝑝𝑐 )при 𝑝 → 𝑝𝑐 .
(32)
(c) Средний размер кластеров: Средний размер кластеров дается формулой
∞
3 1
3
⟨𝑠⟩ = ∑ 3 × 2𝑛−1 𝑝𝑛 =
= (𝑝𝑐 − 𝑝)−1 .
(33)
2 1 − 2𝑝 4
𝑛=1
Заметим, что ⟨𝑠⟩ расходится при 𝑝𝑐 → 𝑝, и расстояние 𝑝𝑐 − 𝑝 от предела протекания зависит от
𝑝. Такое поведение _ пример критического явления: параметр порядка приближается к нулю,
следуя степенному закону в окрестности критической точки (Стенли, 1971; Ма, 1976).
(d) Распределение размеров кластеров: Вероятность наличия кластера размера 𝑠 есть (Дуретт,1985)
1 𝑠−1 𝑠−1
𝑃𝑝 (|𝐶| = 𝑠) = 𝐶2𝑠
𝑝 (1 − 𝑝)𝑠+1 .
(34)
𝑠
Здесь количество ребер, окружающих 𝑠 вершин есть 2𝑠, из которых внутренние 𝑠 − 1 ребра
𝑠−1
должны присутствовать, а наружные 𝑠 + 1 _ отсутствовать. Множитель 𝐶2𝑠
учитывает
различные случаи, которые могут возникать при перестановке ребер, а 1/ 𝑠 _ нормализующий
сомножитель. Т.к. 𝑛𝑠 = (1/𝑠)𝑃𝑝 (|𝐶| = 𝑠), то после применения формулы Стерлинга получим
𝑛𝑠 ∝ 𝑠 −5/2 𝑝 𝑠−1 (1 − 𝑝)𝑠+1 .
(35)
В окрестности предела протекания это выражение приблизительно равно следующему
𝑛𝑠 ~𝑠 −5/2 𝑒 −𝑐𝑠 где 𝑐 ∝ (𝑝 − 𝑝𝑐 )2 .
(36)
Таким образом, распределение размеров кластеров следует степенному закону с
экспоненциальным хвостом: только кластеры размера 𝑠 < 𝑠𝜉 = 1/𝑐 ∝ (𝑝 − 𝑝𝑐 ) −2 играют
значительную роль в средних значениях кластеров. Для этих кластеров 𝑛𝑠 фактически равно
𝑛𝑠 (𝑝𝑐 ) ∝ 𝑠 −5/2. Кластеры с 𝑠 ≫ 𝑠𝜉 экспоненциально редки, а их свойства не определяются
поведением 𝑝𝑐 . Индексация 𝑠𝜉 демонстрирует, что т.к. длина корреляции 𝜉 _
характеристический размер длины диаметров кластеров, 𝑠𝜉 _ внутренняя характеристика
размеров кластеров. Корреляционная длина дерева плохо определена, но в более общих случаях
мы увидим, что 𝑠𝜉 и 𝜉 соотносятся простым степенным законом.
D. Масштабирование в критических областях.
Основным анзацом теории протекания является то, что окрестности предела протекания
самая общая задача перколяции в любом измерении подчиняется масштабному соотношению,
аналогичному равенству (36). Следовательно, в общем случае размер кластера может быть
представлен следующим образом:
1
𝑛𝑠 (𝑝)~ {
𝑠 −𝜏 𝑓− (|𝑝 − 𝑝𝑐 |𝜎 𝑠)
−𝜏
1
𝑠 𝑓+ (|𝑝 − 𝑝𝑐 |𝜎 𝑠)
при 𝑝 ≤ 𝑝𝑐
(37)
при 𝑝 ≥ 𝑝𝑐 .
Здесь 𝜏 и 𝜎 _ критические степени, численные значения которых должно быть определено, 𝑓− и 𝑓+ _
гладкие функции на [0, ∞) и 𝑓− (0) = 𝑓+ (0). Результаты раздела IV.B подсказывают, что 𝑓− (𝑥) ≃
(𝑑−1)/𝑑
1
𝑒 −𝐴𝑥 и 𝑓+ (𝑥) ≃ 𝑒 −𝐵𝑥
для 𝑥 ≫ 1. Этот анзатс показывает, что значение 𝑠𝜉 ∝ |𝑝 − 𝑝𝑐 |𝜎 как
хвоста та же, что и для дерева Кэли. Общее выражение (37) в качестве частного случая содержит
дерево Кэли с 𝜏 = 5/2, 𝜎 = 1/2 и 𝑓∓ (𝑥) = 𝑒 −𝑥 .
Еще одним элементом масштабной гипотезы является тот факт, что корреляционная длина
расходится в окрестности пределе протекания, следую степенному закону:
𝜏−1
𝑃~(𝑝 − 𝑝𝑐 )𝛽 с 𝛽 =
,
(39)
𝜎
что оценивается как положительная степень величины 𝑝 − 𝑝𝑐 для 𝑝 ≫ 𝑝𝑐 ; следовательно она
равняется 0 для 𝑝 = 𝑝𝑐 и возрастает при 𝑝 > 𝑝𝑐 . Средний размер конечных кластеров, ⟨𝑠⟩ 𝑓 , который
может быть вычеслен в обоих сторонах предела протекания, имеет следующее значение:
3−𝜏
⟨𝑠⟩ 𝑓 ~|𝑝 − 𝑝𝑐 |−𝛾 с 𝛾 =
,
(40)
𝜎
Что расходится при 𝑝 → 𝑝𝑐 . Показатели 𝛽 и 𝛾 называются критическими степенями для вероятности
протекания и среднего размера кластеров, соответственно.
E. Структура кластера.
До сих пор мы обсуждали размеры и радиусы кластеров, не обращая внимания на их
внутреннюю структуру. Будем теперь считать, что периметром кластера 𝑡 называется количество
вершин на внешних ребрах (листья). Периметр 𝑡𝑠 очень большого, но конечного кластера размера 𝑠
равен следующему (Леат, 1976)
1−𝑝
+ 𝐴𝑠 𝜉 при 𝑠 → ∞,
(41)
𝑝
где 𝜉 = 1 для 𝑝 < 𝑝𝑐 и 𝜉 = 1 − 1/𝑑 при 𝑝 > 𝑝𝑐 . Таким образом, ниже 𝑝𝑐 периметр кластера
пропорционален его объему. Это свойство _ очень неправильное свойство, которое, тем не менее,
верно для деревьев, включая дерево Кэли.
Другом способом понимания непривычной структуры конечных кластеров _ оценивание
соотношения между их радиусами и объемом. Корреляционная длина 𝜉 _ мера среднего радиуса
1/𝜈𝜎
кластеров, и мы знаем, что 𝜉 соотносится с размером 𝑠𝜉 хвоста кластера как 𝜉 ∝ 𝑠𝜉 . Отсюда,
конечные кластеры являются фракталами (см. Манделброт, 1982), т.к. их размер измеряется не как
𝑑-ая степень радиуса, а как
𝑠(𝑟)~𝑟 𝑑𝑓 ,
(42)
Где 𝑑𝑓 = 1/ 𝜎𝜈. Можно также показать, что в пределе протекания бесконечный кластер все еще
является фракталом, но для 𝑝 > 𝑝𝑐 он превращается в нормальный 𝑑-мерный объект.
В то время как радиусы кластера и корреляционная длина 𝜉 определены с использованием
Евклидово расстояния, химическое расстояние определяется как длина кратчайшего пути между
двумя противоположными сторонами кластера (Хавлин и Носсал, 1984). Следовательно,
химическое расстояние _ эквивалент расстояния в случайном графе. Количество вершин в
химическом расстоянии 𝑙 оценивается следующим образом
𝑠(𝑙)~𝑙 𝑑𝑙 ,
(43)
где 𝑑𝑙 называется размерностью графа кластера. В отличие от фрактальной размерности 𝑑𝑓
Евклидово расстояния, для размерности графа 𝑑𝑙 пока не найдено соотношение с другими
критическими показателями.
𝑡𝑠 = 𝑠
F. Бесконечномерное протекание.
Протекание, как известно, имеет критическую размерность 𝑑𝑐 , ниже которого некоторые
показатели зависят от 𝑑, но для любой размерности, выше 𝑑𝑐 , все показатели совпадают. Считается,
что критическая размерность протекания _ 𝑑𝑐 = 6, однако независимость критических показателей
от размерности показано только для 𝑑 ≥ 19 (см. Хара и Слейд, 1990). Таким образом, для 𝑑 > 𝑑𝑐
применяется бесконечномерная теория протекания, что предсказывает следующее:
 𝑃~(𝑝 − 𝑝𝑐 ) при 𝑝 → 𝑝𝑐 ;
 ⟨𝑠⟩~(𝑝𝑐 − 𝑝)−1 при 𝑝 → 𝑝𝑐 ;
2
 𝑛𝑠 ~𝑠 −5/2 𝑒 −|𝑝−𝑝𝑐| 𝑠 при 𝑝 → 𝑝𝑐 ;
 𝜉~|𝑝 − 𝑝𝑐 |−1/2 при 𝑝 → 𝑝𝑐 .
Следовательно, критическими для бесконечномерного протекания являются показатели 𝜏∞ =
5/2, 𝜎∞ = 1/2 и 𝜈∞ = 1/2. Фрактальная размерность бесконечного кластера в пределе протекания
равна 𝑑𝑓 = 4, а размерность графа 𝑑𝑙 = 2 (Бунд и Халвин, 1996). Таким образом,
характеристическое химическое расстояние в конечном или бесконечном кластере при пределе
протекания соотносится с его размером как
1
𝑙~𝑠 2/𝑑𝑓 = 𝑠 2 .
(44)
G. Параллели между теорией случайных графов и протеканием.
В теории случайных графов мы изучаем граф с 𝑁 вершинами, где каждая пара вершин
соединена с вероятностью 𝑝. Это соответствует протеканию в максимум 𝑁 измерениях, таких что
две соединенные вершины являются соседями, а ребра между вершинами графа _ ребра в задаче
протекания. Т.к. теория случайных графов изучает предел 𝑁 → ∞, она аналогична
бесконечномерному протеканию.
В разделе IV.C мы увидели, что бесконечномерное протекание подобно протеканию в дереве
Кэли. Предел перколяции для дерева Кэли есть 𝑝𝑐 = 1/(𝑧 − 1), где 𝑧 _ число координации дерева. В
случайном графе из 𝑁 ребер число координации есть 𝑁 − 1; следовательно, “предел протекания”,
который показывает вероятность соединения, при которой появляется гигантский кластер, должен
быть 𝑝𝑐 ≃ 1/𝑁. И в самом деле, это ровно та вероятность, при которой фазовый переход, ведущий к
наличию гигантского компонента, появляется в случайном графе, как это показали Эрдос и Ренйи
(см. раздел III.C).
Сравним предсказания для теории случайных графов и бесконечномерного протекания, часть
которых отражают совершенную аналогичность:
(1) Для 𝑝 < 𝑝𝑐 = 1/𝑁.
 Вероятность наличия гигантского кластера в графе и бесконечного кластера в протекании равна
0.
 Кластеры в случайных графах являются деревьями, а в протекании кластеры имеют фрактальную
структуру и периметр, пропорциональный их объему.
 Самый большой кластер в случайном графе _ это дерево с ln(𝑁) вершинами, а в протекании в
общем случае 𝑃𝑝 (|𝐶| = 𝑠)~𝑒 −𝑠/𝑠𝜉 [см. равенство (28) в разделе IV.B], что подсказывает, что
размер наибольшего кластера измеряется как ln(𝑁).
(2) Для 𝑝 = 𝑝𝑐 = 1/𝑁.
 Появляется единственный гигантский кластер или бесконечный кластер.
 Размер гигантского кластера _ 𝑁 2/3 , а для бесконечномерного протекания _ 𝑃𝑝 (|𝐶| = 𝑠)~𝑠 −3/2,
поэтому размер наибольшего кластера измеряется как 𝑁 2/3 .
(3) Для 𝑝 > 𝑝𝑐 = 1/𝑁.
 Размер гигантского кластера составляет (𝑓(𝑝𝑐 𝑁) − 𝑓(𝑝𝑁))𝑁, где 𝑓 _ экспоненциально
возрастающая функция с 𝑓(1) = 1. Размер бесконечного кластера составляет 𝑃𝑁 ∝ (𝑝 − 𝑝𝑐 )𝑁.
 Гигантский кластер имеет сложную структуру, содержащую циклы, а бесконечный кластер
является не фрактальным, а компактным.
Все эти соответствия показывают, что переходная фаза в случайных графах принадлежит
тому же всеобщему классу что и осредненное протекание. Численное моделирование случайных
графов (см., например, Кристенсен и др., 1998) подтвердило, что критические показатели
переходной фазы равны критическим показателям в бесконечномерном протекании.
Эквивалентность этих двух теорий очень важна, т.к. это дает возможность взглянуть на ту же
задачу по-разному. Например, часто интересно посмотреть на распределение размера кластеров в
случайной сети с фиксированным количеством вершин. На этот вопрос легче найти ответ в теории
протекания. Тем не менее, теория случайных графов отвечает на вопросы огромной важности для
сетей, такие как появление деревьев и циклов, на которые теория протекания почти не обращает
внимание.
В некоторых случаях между предсказаниями теории случайных графов и теорией
перколяции есть видимое различие. Например, теория перколяции предсказывает, что химическое
расстояние между двумя узлами в бесконечном кластере измеряется как степень размера кластера
[см. равенство (44)]. А теория случайных графов предсказывает [см. равенство (16)], что диаметр
бесконечного кластера измеряется логарифмически вместе с размером (см. Чанг и Лу, 2001).
Причиной этого явного различия является то, что два этих предсказания относятся к различным
системам. Тогда как равенство (44) справедливо только тогда, когда бесконечный кластер только
что образовался [например, 𝑝 = 𝑝𝑐 и ⟨𝑘⟩ = 1] и все еще является фракталом, предсказание теории
случайных графов выполняется после перколяционного перехода при ⟨𝑘⟩ ≫ 1. Следовательно,
используя эти два предела мы можем обращаться к эволюции химического расстояния в
бесконечном кластере (см. Кохен и др., 2001). Таким образом, для того, чтобы полностью
охарактеризовать случайные сети, нам необходимо быть знакомыми с этими двумя
взаимодополняющими подходами.
V. Обобщенные случайные графы.
В разделе II мы увидели, что реальные сети отличаются от случайных графов в том, что их
степенное распределение часто подчиняется степенному закону 𝑃(𝑘)~𝑘 −𝛾 . Т.к. степенные законы
не обладают характерного масштаба, эти сети называются “сетями без масштаба” (Барабаси и
Альберт, 1999; Барабаси, Альберт и Йонг, 1999). Из-за того, что случайные графы не обладают
свойством независимости от масштаба реальных сетей, нам нужна другая модель для описания этих
систем. Одним из подходов является обобщение случайных графов, сконструировав модель,
которая в качестве входных данных получает степенное распределение и является случайным по
всем другим параметрам. Другими словами, ребра соединяют случайно выбранные вершины с
ограничением, что степенное распределение подчиняется степенному закону. Теория таких полуслучайных графов должна ответить на вопросы, подобные тем, что поставили Эрдос и Ренйи и
теория перколяции (см. разделы III, IV): Существует ли граница, при которой появляется
гигантский кластер? Как развиваются размер и топология кластеров? Когда граф становится
связным? Кроме того, необходимо определить среднюю длину пути и коэффициент кластерации
такого графа.
Первым шагом в развитии такой теории является определение существенного параметра,
который, вместе с размером сети, дает статистически полную характеристику сети. В случае
случайных графов таким параметром является вероятность связывания (см. раздел III.A); в теории
перколяции _ это вероятность наличия связи (см. раздел IV). Т.к. единственным ограничением для
этих графов является то, что их степенное распределение подчиняется степенному закону,
показатель распределения степеней 𝛾 может выступать в качестве контрольного параметра.
Соответственно, мы изучаем системы без масштаба систематически изменяя 𝛾 и смотрим есть ли
граничное значение 𝛾, при котором важные свойства сетей внезапно изменяются.
Сначала мы делаем некоторые интуитивные предположения. Рассмотрим большую сеть с
распределением степеней 𝑃(𝑘)~𝑘 −𝛾 , где 𝛾 убывает от ∞ к 0. Средняя степень сети, или, что то же
−𝛾+2
самое, количество ребер, возрастает с убыванием 𝛾, т.к. ⟨𝑘⟩~𝑘𝑚𝑎𝑥 , где 𝑘𝑚𝑎𝑥 < 𝑁 _ максимальная
степень графа. Это очень похоже на процесс эволюции графа, описанный Эрдосом и Ренйи (см.
раздел III.C). Соответственно, в то время как при больших значениях 𝛾 сеть состоит из
изолированных маленьких кластеров, мы предполагаем, что существует критическое значение 𝛾,
при котором формируется гигантский кластер, и даже при таком маленьком 𝛾 сеть становится
полностью связной.
Теория случайных графов с заданной степенной последовательностью возникла
сравнительно недавно. Один из первых результатов был достигнут благодаря Луцзаку (1992), кто
показал, что почти все случайные графы с фиксированным распределением степеней и со
степенями вершин не меньше 2, имеют единственный гигантский кластер. Моллой и Рид (1995,
1998) доказали, что для случайных графов с распределением степеней 𝑃(𝑘) бесконечный кластер
появляется почти наверняка при
𝑄 ≡ ∑ 𝑘(𝑘 − 2)𝑃(𝑘) > 0,
(45)
𝑘≥1
обеспечивая, что максимальная степень меньше чем 𝑁1/4 . Метод Моллоя и Рида был применен к
случайным графам с распределением степеней по степенному закону Аелло, Чангом и Лу (2000).
Как мы покажем далее, их результаты полностью соответствуют предположениям, описанным
выше.
A. Предел в случайных графах, не зависящих от масштаба.
Аелло, Чанг и Лу (2000) представляют модель графа с двумя параметрами 𝑃(𝛼, 𝛾), который
определяется следующим образом: Пусть 𝑁𝑘 _ количество вершин со степенью 𝑘. 𝑃(𝛼, 𝛾)
определяет одинаковую вероятность для всех графов с 𝑁𝑘 = 𝑒 𝛼 𝑘 −𝛾 . Таким образом, в этой модели
определено не общее количество вершин _ вместе с показателем 𝛾 _ в самом начале, а количество
вершин со степенью 1. Тем не менее, количество вершин и ребер в графе может быть выведено,
учитывая, что максимальная степень в графе 𝑒 𝛼/𝛾 . Для нахождения условия появления гигантского
кластера в этой модели подставим 𝑃(𝛼, 𝛾) в равенство (45), получая в качестве решения 𝛾0 =
3,47875 …. . Таким образом, при 𝛾 > 𝛾0 случайный граф почти наверняка не содержит бесконечный
кластер. С другой стороны, при 𝛾 < 𝛾0 почти наверняка присутствует единственный бесконечный
кластер.
Связность графа является очень важным вопросом. При 𝛾 > 𝛾0 граф точно является
несвязным, т.к. он состоит из независимый конечных кластеров. В интервале 0 < 𝛾 < 𝛾0 Аелло
Чанг и Лу (2000) изучили размер второго по величине кластера и обнаружили, что при 2 ≤ 𝛾 ≤ 𝛾0
второй по величине кластер почти наверняка имеет размер порядка ln(𝑁), что относительно мало.
Тем не менее, почти наверняка при 1 < 𝛾 < 2 каждая вершина со степенью больше ln(𝑁)
принадлежит бесконечному кластеру. Второй по величине кластер имеет размер порядка 1, т.е. его
размер не возрастает, когда размер графа стремится к бесконечности. Это означает, что
относительное количество вершин в бесконечном кластере приближается к 1 с увеличением
размера системы; таким образом граф становится полностью связным в пределе бесконечного
размера системы. И наконец, при 0 < 𝛾 < 1 граф почти наверняка связный.
B. Формализм функции генерации.
Общий подход к случайным графам с заданным распределением степеней был разработан
Ньюманом, Строгатзом и Уоттсом (2001) с использованием формализм функции генерации (Уилф,
1990). Функция генерации распределения степеней,
∞
𝐺0 (𝑥) = ∑ 𝑃(𝑘)𝑥 𝑘 ,
(46)
𝑘=0
инкапсулирует всю информацию, содержащуюся в 𝑃(𝑘), т.к.
1 𝑑 𝑘 𝐺0
𝑃(𝑘) =
| .
(47)
𝑘! 𝑑𝑥 𝑘 𝑥=0
Важной величиной в изучении структуры кластера является функция генерации распределения
степеней ближайших соседей случайно выбранной вершины. Она может быть выведена следующим
образом: случайно выбранное ребро достигает вершину со степенью 𝑘 с вероятностью,
пропорциональной 𝑘𝑃(𝑘) (т.е. легче найти связанную вершину). Если возьмем случайную вершину
и проследуем за всеми ребрами выходящими из нее, то вершины, в которые мы попадем, имеют
распределение, генерированное 𝑘𝑃(𝑘). Вдобавок, функция вывода будет содержать 𝑥 𝑘−1 [вместо 𝑥 𝑘
в равенстве (46)], т.к. мы должны вычесть ребро, с помощью которого мы дошли до этой вершины.
Таким образом, распределение выходящих ребер генерируется функцией
∑𝑘 𝑘𝑃(𝑘)𝑥 𝑘−1
1 ′
𝐺1 (𝑘) =
=
𝐺 (𝑥).
(48)
∑𝑘 𝑘𝑃(𝑘)
⟨𝑘⟩ 0
Среднее количество первых соседей равна средней степени графа,
𝑧1 = ⟨𝑘⟩ = ∑ 𝑘𝑃(𝑘) = 𝐺0′ (1).
(49)
𝑘
1. Размеры компонент и фазовые переходы.
При определении кластера с использованием ‘burning’ алгоритма (алгоритма поиск в
ширину) мы начинаем с произвольной вершины и следуем за ребрами до тех про, пока не достигаем
их ближайших соседей. Мы отмечаем эти вершины как часть кластера, затем следуем за
выходящими из них ребрами (избегая уже отмеченные вершины) и отмечаем вершины, в которые
мы пришли, как следующие ближайшие соседи первоначальной вершины. Процесс продолжается
до тех пор, пока новые вершины не находятся. Множество отмеченных вершин составляет
изолированный кластер. Этот алгоритм полностью включен в метод функции генерации. Функция
генерации 𝐻1 (𝑥) распределения размера кластеров, полученных методом следования случайного
ребра, удовлетворяет следующему итерационному равенству:
∑𝑘 𝑘𝑃(𝑘)[𝐻1 (𝑥)]𝑘
𝐻1 (𝑥) =
= 𝑥𝐺1 [𝐻1 (𝑥)].
(50)
∑𝑘 𝑘𝑃(𝑘)
Здесь 𝑘𝑃(𝑘) пропорционально вероятности того, что случайное ребро соединено с вершиной со
степенью 𝑘, а [𝐻1 (𝑥)]𝑘 представляет 𝑘 способа, как кластер может быть продолжен рекурсивно (т.е.
нахождением ближайших соседей ранее отмеченных вершин). Если начинать с произвольной
вершины, то получим один такой кластер с этой вершиной на конце каждого ребра, и отсюда
получим функцию генерации размера всего кластера:
𝐻0 (𝑥) = 𝑥 ∑ 𝑃(𝑘)[𝐻1 (𝑥)]𝑘 = 𝑥𝐺0 [𝐻1 (𝑥)].
(51)
𝑘
Когда в графе нет гигантского кластера, средний размер кластеров представляется следующим
образом:
𝐺0′ (1)
′
⟨𝑠⟩ = 𝐻0 (1) = 1 +
.
(52)
1 − 𝐺1′ (1)
Это выражение расходится при 𝐺1′ (1) = 1, отмечая появление гигантского кластера. Подставляя
значение 𝐺0 (𝑥), условие появления гигантского кластера можно записать так:
∑ 𝑘(𝑘 − 2)𝑃(𝑘) = 0,
(53)
𝑘
что идентично с равенством (45), выведенным Моллоем и Ридом (1995). Равенство (53) дает
неявную зависимость для критического распределения степеней случайного графа: Для любого
распределения степеней, для которого сумма левой части отрицательна, в графе не присутствует
гигантский кластер, а распределения степеней с положительной суммой ведут к появлению
гигантского кластера.
Когда гигантский кластер присутствует, 𝐻0 (𝑥) генерирует распределение вероятностей
конечных кластеров. Это означает, что 𝐻0 (1) больше не равно 1, а принимает значение 1 − 𝑆, где 𝑆_
относительное количество вершин в гигантском кластере. Этот факт может быть использован для
вычисления значения размера гигантского кластера 𝑆 (Моллой и Рид, 1998):
𝑆 = 1 − 𝐺0 (𝑢),
(54)
где 𝑢 _ наименьшее неотрицательное действительное решение равенства 𝑢 = 𝐺1 (𝑢).
Т.к. мы имеем дело со случайными графами (несмотря на то, что распределение степеней),
теория перколяции (см. раздел IV) отмечает, что в близи перехода фаз хвост распределения размера
кластера,𝑛𝑠 , ведет себя следующим образом:
𝑛𝑠 ~𝑠 −𝜏 𝑒 −𝑠/𝑠𝜉 .
(55)
Характерный размер кластера 𝑠𝜉 может быть связан с первой особой точкой 𝐻0 (𝑥), 𝑥 ∗ ,
переходом фаз 𝑥 ∗ = 1 и 𝑠𝜉 → ∞. Используя разложение в ряд Тейлора в окрестности критической
точки, мы видим, что 𝐻0 (𝑥) измеряется как
𝐻0 (𝑥)~(1 − 𝑥)𝛼 при 𝑥 → 1,
(56)
1
где 𝛼 = . Этот показатель может быть связан с показателем 𝜏, используя связь между 𝑛𝑠 и 𝐻0 (𝑥),
2
5
получая значение 𝜏 = 𝛼 + 2 = 2, не зависимо от распределения степеней. Таким образом, в
окрестности критической точки распределение размера кластеров следующее 𝑛𝑠𝑐 ~𝑠 −5/2 , как это
было предсказано бесконечномерной перколяцией (см. IV.F), и сейчас было распространено на
огромное семейство случайных графов с произвольным распределением степеней.
2. Средняя длина пути.
Расширяя метод вычисления среднего количества ближайших соседей, мы находим среднее
количество 𝑚-тых соседей,
𝑧2 𝑚−1
𝑧𝑚 =
=[ ]
𝑧1 ,
(57)
𝑧1
где 𝑧1 и 𝑧2 _ количество ближайших и вторых по близости соседей. Используя это выражение, мы
можем вывести приблизительное соотношение для средней длины пути в графе. Пусть имеется
некоторая вершина. Найдем количество ее ближайших, вторых ближайших, …, 𝑚-тых соседей.
Предполагая, что все вершины графа могут быть достигнуты через 𝑙 шагов, получим
[𝐺1′ (1)]𝑚−1 𝐺0′ (1)
𝑙
1 + ∑ 𝑛(𝑚) = 𝑁,
(58)
𝑚=1
где 𝑛(𝑚) _ количество 𝑚-тых соседей первоначальной вершины. Для того, чтобы приблизительно
получить среднюю длину пути, можем заменить 𝑛(𝑚) на 𝑧𝑚 , получая
𝑙
1 + ∑ 𝑧𝑚 = 𝑁.
(59)
𝑚=1
Для большинства графов с 𝑁 ≫ 𝑧1 𝑧2 ≫ 𝑧1, получим
ln(𝑁/𝑧1 )
𝑙=
+ 1.
(60)
ln(𝑧2 /𝑧1 )
В случае связных деревьев существует более точный метод (Амбъорн, Дуруус и Джонсон, 1990;
Бурда, Коррея и Крзивики, 2001), согласно которому средняя длина связных деревьев с
распределением степеней по степенному закону оценивается как 𝑁 (𝛾−2)/(𝛾−1) , где 𝛾 _ показатель
степени. Ни смотря на то, что данная оценка имеет другой функциональный вид, при приближении
𝛾 к 2 зависимость от размера системы становится очень слабой и практически не отличается от
логарифмической зависимости.
C. Случайные графы с распределением степеней по степенному закону.
В качестве применения формализма функции генерации Ньюман, Строгатс и Уоттс (2001)
рассматривают случай распределения степеней типа
𝑃(𝑘) = 𝐶𝑘 −𝛾 𝑒 −𝑘/к для 𝑘 ≥ 1,
(61)
где 𝐶, 𝛾 и к _ константы. Экспоненциальный остаток, который присутствует в некоторых
социальных и биологических (см. Амараль и др., 2000; Йонг, Мейсон и др., 2001; Ньюман, 2001a),
обладает техническим преимуществом, давая возможность нормализировать распределения для
всех 𝛾, а не только 𝛾 ≥ 2, как в случае исключительно степенного закона. Константа 𝐶 фиксируется
нормализацией, получая значение 𝐶 = [𝐿𝑖𝛾 (𝑒 −1/к )]−1 , где 𝐿𝑖𝑛 (𝑥)_ 𝑛-тый полилогарифм 𝑥. Таким
образом, распределение степеней характеризуется двумя независимыми параметрами: показателем
𝛾 и остатком к. Следуя выше описанному формализму, мы получаем, что размер бесконечного
кластера равен
𝐿𝑖𝛾 (𝑢𝑒 −1/к )
𝑆 = 1−
,
(62)
𝐿𝑖𝛾 (𝑒 −1/к )
где 𝑢 _ наименьшее неотрицательное действительное решение равенства 𝑢 = 𝐿𝑖𝛾 (𝑢𝑒 −1/к )/
[𝑢𝐿𝑖𝛾−1 (𝑒 −1/к )]. Для графов с распределением по исключительно степенному закону (к → ∞)
равенство, представленное выше, имеет вид 𝑢 = 𝐿𝑖𝛾−1 (𝑢)/[𝑢𝜁(𝛾 − 1)], где 𝜁(𝑥) _ функция Римана
𝜁. Для всех 𝛾 ≤ 2 это дает 𝑢 = 0, и следовательно 𝑆 = 1, предполагая, что случайно выбранная
вершина принадлежит гигантскому кластеру с вероятностью, приближающейся к 1 при к → ∞. Для
графов с 𝛾 > 2 такой случай не возможен, даже для бесконечного к, что означает, что такой граф
содержит конечные кластеры, т.е. он не связный, согласно с выводами Аелло, Чанга и Лу (2000).
Средняя длина пути следующая:
ln 𝑁 + ln[𝐿𝑖𝛾 (𝑒 −1/к )/𝐿𝑖𝛾−1 (𝑒 −1/к )]
𝑙=
+ 1,
(63)
ln[𝐿𝑖𝛾−2 (𝑒 −1/к )/𝐿𝑖𝛾−1 (𝑒 −1/к ) − 1]
где в пределе к → ∞ имеем
ln 𝑁 + ln[𝜁(𝛾)/𝜁(𝛾 − 1)]
+ 1.
(64)
ln[𝜁(𝛾 − 2)/𝜁(𝛾 − 1) − 1]
Заметим, что данное выражение не имеет конечного положительного действительного значения для
любого 𝛾 < 3, обозначая, что для получения определенной средней длины пути необходимо
определить конечный остаток к для распределения степеней.
𝑙=
Download