Полевой Н.А. Основные характеристики имитационной

реклама
Н.А. Полевой
Основные характеристики
имитационной нейросетевой модели
развития теории истории
Общепризнано, что современное общество вошло в период кри
зиса парадигмы научного познания. Старые парадигмы оказались либо
недостаточно гибкими (например, психоаналитический подход), либо
недостаточно строгими (например, т.н. цивилизационный подход),
либо политически ангажированными (марксистский подход). В ка
честве реакции на такое положение возникли постмодернистские наст
роения, выраженные фразой С.С. Аверинцева «все слова уже сказаны»1
и выводами о множественности истин и, следовательно, множествен
ности парадигм познания.
В исторической науке такое положение привело к широчайшему
распространению конкретноисторических работ, не ставящих даже
задачи достижения некоего обобщения хотя бы в пределах изучаемой
темы. Теоретизирования же относительно проблем исторического
развития в настоящее время либо переносятся в разряд ФИЛОСОФИИ
истории (и реализуются в духе «любомудрствования»), либо приравни
ваются сторонниками постмодернизма к поискам одной из множест
венных истин (не имеющих возможности по определению претендовать
на некоторое приближение к поиску законов или закономерностей
исторического развития как являющихся всего лишь результатом взаи
модействия конкретного исследователя с текстом)2.
74
Основные характеристики имитационной…
В то же время признание плюрализма идей, течений и направлений
в настоящее время не отменяет очевидности того, что в предшествую
щие века в историческом, как, впрочем, и в естественнонаучном по
знании существовали и сменяли друг друга определенные парадигмы,
характеризовавшиеся, в частности, своей доминантностью для данного
времени3. Очевидно также, что изучение отдельных аспектов или це
лостных парадигм исторического познания, существовавших в прош
лом, дает обильную почву как для постмодернистских толкований ис
тории, так и для продолжения старых методологических традиций
осмысления истории.
В настоящее время накоплено огромное количество описаний воз
зрений, источниковедческих и методологических находок и посылок
отдельных историков и историографических школ4, существуют ком
паративные исследования отдельных школ, но нам неизвестны работы,
посвященные описанию законов или закономерностей смены одних
научных школ и взглядов другими, одной парадигмы исторического
познания другой. Более того, создатель теории научных революций
Т. Кун настаивает на том, что смена научных парадигм является прак
тически непредсказуемым процессом. Это утверждение, впрочем, не ме
шает ему находить некоторые закономерности приближения научных
революций (рост сознания научного сообщества) и «послереволю
ционного» развития науки (отказ от многого из багажа науки, руковод
ствовавшейся старой парадигмой)5.
Таким образом, серьезной проблемой в изучении существовавших
в историографии парадигм является выявление закономерностей их
последовательной смены. На наш взгляд, выявление и верификация
таких закономерностей возможны при наличии болееменее формали
зованного описания процесса познания истории, модели этого про
цесса, максимально гибко учитывающей его специфику и в то же время
поддающейся настройке, модификации и последующему исследованию.
Собственно рассмотрение основных характеристик одного из воз
можных вариантов модели теоретического познания истории и явля
ется задачей данной статьи.
В качестве аппарата, или, скорее, методологии моделирования мы
предполагаем использовать методы построения и анализа искусствен
ных нейронных сетей. Нам неизвестны приложения данного метода
моделирования для анализа процесса исторического познания6.
Основанием выбора данного аппарата моделирования служит гипоте
за о сходстве основных этапов познания окружающего мира отдельным
75
Н.А. Полевой
человеком и «исторического поля» («исторического мира») сообщест
вом историков. Данная гипотеза основана на предположении о воз
можности проведения ограниченной аналогии между индивидуальным
и общественным сознанием7.
Мы предполагаем, что поскольку физическая организация того, что
обеспечивает существование и функционирование человеческого соз
нания представлена совокупностью (сетью) нейронов в мозге чело
века, постольку весьма подходящей, почти аналоговой моделью такого
процесса общественного сознания, как познание окружающего мира
(или его части — истории) была бы искусственная нейронная сеть.
Конечно, предпочтительней было бы строить искомую модель по
образцу натуральной нейросети человеческого мозга, однако, к сожа
лению, нам неизвестны детальные нейросетевые модели работы чело
веческого мозга. В психологической литературе понятие «нейросеть»
пока используется, как правило, в качестве метафоры8. Основные ус
пехи в изучении нейросетей, правда, искусственных, достигнуты спе
циалистами в области автоматических систем управления и распоз
навания образов9. Поэтому предполагается использование в качестве
исходного аналога именно искусственной нейросети. Однако вслед
ствие особенностей потребностей того направления науки, которое
в наибольшей степени развивало теорию нейросетей, в большинстве
существующих нейросетевых моделей в качестве решающих правил
используются более или менее сложные математические функции,
рассчитанные на обработку каждым элементом сети точно выражен
ной числовой информации10. Поэтому мы полагаем, что для создания
нейросетевой модели процесса познания необходимо заимствование
существующей традиции построения структуры искусственных нейро
сетей с введением в создаваемую нейросеть не вполне привычных
в естественнонаучных приложениях нечетких решающих правил (функ
ций преобразования).
Основная черта искусственной нейросети — наличие в ней несколь
ких слоев, каждый из которых состоит из определенного количества
так называемых базовых процессорных элементов, или искусственных
нейронов. Каждый искусственный нейрон в пределах одного слоя имеет
идентичную с соседними нейронами функцию преобразования вход
ного сигнала, но с различными коэффициентами преобразования.
Коэффициенты преобразования в нейронах каждого слоя могут быть
либо настраиваемыми, либо постоянными. Причем, как правило, на
вход каждого искусственного нейрона одного слоя попадают все входные
76
Основные характеристики имитационной…
сигналы, а в результате преобразования этих сигналов каждый нейрон
выдает на выходе к следующему слою только один — результирую
щий — сигнал11.
Такое строение искусственной нейросети позволяет использовать
ее с целью аппроксимации математических функций, решения задач
многомерной типологизации и оптимизации сложных непрерывных
процессов12. То есть, искусственная нейросеть способна чрезвычайно
эффективно агрегировать входную информацию, причем делает это,
в случае, например, некоего визуального изображения или целостного
образа, не с частями изображения (образа), а со всем изображением
одновременно.
Считается доказанным, что степень точности аппроксимации ма
тематических функций многим видами нейросетей зависит от коли
чества слоев сети и числа искусственных нейронов в каждом слое —
чем их больше, тем более точной и, вероятнее всего, более быстрой
будет аппроксимация.
Согласно теореме СтоунаВейерштрассе возможно достижение
сколь угодно высокой точности аппроксимации нейросетью непре
рывных функций многих переменных произвольной функцией одного
переменного при условии отсутствия ограничения на число слоев сети
и число искусственных нейронов в каждом слое13.
Приведенные характеристики искусственных нейросетей показы
вают аналогичность их строения тому, что в настоящее время известно
о строении человеческого мозга14 и, кроме того, напрашивается прове
дение аналогии между функционированием искусственных нейросе
тей и процессом познания индивидуумом или группой людей некото
рого объекта:
— так же, как в нейросети, происходит одновременное «схватыва
ние» многообразной информации (целостной «картинки») об объекте
(одновременно неограниченным множеством каналов входной инфор
мации на первом слое);
— весь полученный объем информации обрабатывается одновре
менно (параллельно);
— каждая единица полученной информации преломляется в соз
нании человека множеством дополнительных факторов — его лич
ными предпочтениями, уровнем и широтой образования, условиями
среды жизнедеятельности и восприятия (в искусственной нейросети —
множеством весовых коэффициентов) — причем воздействие этих
факторов, аналогично воздействию коэффициентов, направлено только
77
Н.А. Полевой
на одно — усилить до максимума или, наоборот, снизить до нуля «зву
чание» этой единицы информации в «общем хоре»;
— происходит чрезвычайно быстрое и существенное агрегирование
полученной информации (от слоя к слою);
— механическое увеличение числа одновременно обрабатываемых
единиц информации приводит, наряду с повышением вероятности
достижения наилучшего результата агрегирования, к вероятности по
лучения правдоподобных, но неверных результатов (многоэкстре
мальность процесса обучения многослойной нейросети аналогична
широко известной возможности уверенного получения диамет
рально противоположных выводов из одинаковой исходной инфор
мации15);
— обычно в процессе познания объекта происходит индуктивное
восхождение от частного к общему (от слоя к слою), причем роль де
дуктивной составляющей познания играют существующие (заданные
до начала изучаемого процесса познания) представления человека, ус
ловия восприятия и т.п. (то же, что весовые коэффициенты в искусст
венных нейронах сети), определяющие преимущественное внимание
к тем или иным чертам (характеристикам) изучаемого объекта.
Среди многообразия типов искусственных нейросетей одним из
наиболее предпочтительных по структуре образцов для построения
модели процесса историкотеоретического познания представляется
самообучаемая динамическая многослойная нейронная сеть гибрид
ного типа16.
Очевидно, что нейросеть процесса теоретического познания исто
рии должна быть представлена несколькими слоями искусственных
нейронов (далее — базовых элементов сети — БЭС, по аналогии с ма
тематическим — базовый процессорный элемент).
В соответствии с предложенным подходом структура модели фор
мируется таким образом, чтобы в процессе работы модели форми
ровался определенный образ исторического процесса или явления,
составленный из болееменее цельной системы ранжированных круп
ных понятий. Вследствие этого используемые в модели единицы ин
формации по большей части представлены разного рода понятиями и
должны относиться к одному из следующих видов:
1. Понятия исторических событий и явлений, как единичные, так
и болееменее обобщающие (они являются репрезентантами того, что
обычно называется историческими фактами). Условно в дальнейшем
будем обозначать их как «понятия1».
78
Основные характеристики имитационной…
2. Устоявшиеся старые понятия (не по абсолютному времени появ
ления, а относительно времени познавательной деятельности субъекта).
Возможно, имеет смысл объединение их под названием «система ста
рых понятий» или даже «мировоззрение», однако и то и другое, осо
бенно последнее, слишком туманны. В первом варианте модели этот
вид делится на две неопределенного размера части с нечеткими грани
цами: 1) понятия базовые, обычные, среднего уровня и 2) «теоретиче
ские (теоретизированные) понятия» — понятия, относящиеся к тео
ретическим обобщениям. Вряд ли стоит различать эти две группы
понятий по обычным канонам формальной логики — по содержанию
и объему. Элементы этого вида составляют две (по группам) матрицы
фильтров, с которыми согласуется (сравнивается, сопоставляется)
каждое понятие исторических событий (понятие1). Устоявшие старые
понятия обозначим как «понятия2» («понятия2с» и «понятия2т»). По
нятия2 входят как в состав фильтров, так и в число обрабатываемых
элементов.
3. Цель работы познающего субъекта (индивидуума или группы
ученых — в последнем случае речь идет об экстраполяции общепри
нятых в данную эпоху представлений). Этот элемент относится к группе
фильтров (весовых коэффициентов в терминологии нейросетей), и его
вариации условно сводятся к трем вариантам: 1) «найти объективную
истину»; 2) «найти верную истину» (в соответствии с установками,
в которые УВЕРОВАЛ исследователь/группа исследователей); 3) «ус
лужить и/или найти иллюстрации».
4. Степень уважения (почитания, следования) историографической
традиции. Этот элемент также выполняет только функции фильтра
и включает такие возможности обращения познающего субъекта к тра
диции: 1) «принимаем как истину в последней инстанции»; 2) «прини
маем, но предполагаем необходимость последующей корректировки»;
3) «отвергаем вообще». Начиная со времени сосуществования христи
анской философии истории и языческой науки и до нынешних дней
с некоторыми перерывами необходимо подразделять указанные вари
анты отношения к традиции в обращении со своей и инородной (чу
жой веры, чужой культуры и т.п.) традицией.
Количество и поведение искусственных нейронов в модели, обра
батывающих блоки информации описанных типов, характеризуются
следующими чертами:
НЕОГРАНИЧЕННОЕ количество потенциально готовых к работе
БЭС в каждом слое; большое, но все же ограниченное количество
79
Н.А. Полевой
работающих в каждый момент времени нейронов в слое; труднопред
сказуемый (хаотический) процесс включения/отключения работающих
БЭС; одновременное включение/отключение групп соседствующих
нейронов; обязательное «автоматическое» отключение части БЭС в каж
дом слое и включение в работу некоторого количества других нейронов
по достижении существенно нового теоретического результата (или лю
бого результата); эти отключенные БЭС переходят в состав группы
БЭС «пассивной памяти» и сохраняют информацию, с которой рабо
тали, а также могут быть задействованы в последующих циклах работы
модели, причем вероятность их активизации тем больше, чем больше
времени прошло от момента их последнего использования и отключе
ния; любой результат обязательно коррегирует процесс обработки
нейронами всех слоев последующей информации.
Схема работы нейросетевой модели исторического познания вы
глядит следующим образом.
В первом слое происходит обработка первичной информации, по
лученной органами чувств исследователя (сообщения о тех или иных
событиях, результаты осмотра или прочтения описания тех или иных
источников). Эта информация приобретает в первом слое некоторые
черты образов и в этом виде попадает во второй слой сети, где образные
результаты восприятия преобразуются в понятия, представляющие от
дельные атомизированные исторические явления и события (микро
понятия или понятия1).
Видимо, следует смириться с принципиальной невозможностью на
настоящем этапе конкретизации работы первого и второго слоев. Учи
тывая поставленную цель работы, видимо, можно считать эти два слоя
черным ящиком, на входе которого некоторое количество фактиче
ских событий и явлений (это утверждение не означает, что мы знаем
всю их совокупность, или даже что мы можем отличить действительно
имевшие место события от ирреальных), а на выходе — понятия1.
Понятия1 попадают на вход третьего слоя примерно так.
Каждый БЭС третьего слоя получает только одно понятие1 и сверяет
его с матрицей понятий2с по следующему алгоритму: понятие1 пос
ледовательно сравнивается с каждым из понятий2с, и выявляется некото
рое количество однородных ему (вероятно, по содержанию) поня
тий2сб; понятие1 сравнивается с каждым из этих близких понятий2сб,
и над ним производится одно из действий: 1) понятие1 урезается,
чтобы быть идентичным ближайшему понятию2сб; 2) понятие1 адап
тируется (произвольно видоизменяется) до ближайшего понятия2сб;
80
Основные характеристики имитационной…
3) понятие1 накладывается на ближайшее имеющееся понятие2сб, по
лучает от него, как через кальку, новые черты.
В случае сильного отличия понятия1 от каждого из понятий2с оно
остается и передается далее практически в неизменном виде (для выде
ления обозначим его индексом «н»).
На выходе каждого БЭС третьего слоя — понятие3, фактически
являющееся либо одним из понятий2, либо сильно не похожим ни на
одно из них. Кроме того, видимо, на выходе этого слоя присутствует
часть понятий2, ассоциативно близких проходившим понятиям1. В тре
тьем слое предусмотрена отдельная группа БЭС, реализующих память
и сохраняющих в каждом таком БЭС одно из понятий2с. Собственно,
из них и берутся понятия2с для сравнения с понятиями1.
Каждый БЭС четвертого слоя получает одно понятие3 и сверяет его
содержание с целью работы: если понятие не несет опасности для ожи
даемого результата, оно принимается и выдается на выход четвер
того слоя, в противном случае БЭС удаляет это понятие.
На вход пятого слоя поступают прошедшие через четвертый слой
понятия (условно обозначим их понятия4).
В пятом слое на каждый БЭС поступает одно понятие4, и затем
производится сортировка этих понятий в соответствии с имеющимися
в особо выделенной части данного слоя старыми теоретическими по
нятиями (понятия2т). Этот процесс коррегирует фильтр, учитывающий
уважение историографической традиции. В случае полного принятия
традиции сортировка понятий4 производится строго в соответствии
с понятиями2т, причем понятия4н, как правило, удаляются при малей
ших затруднениях сортировки. В случае полного неуважения традиции
происходит сортировка, решающее влияние на которую оказывают
практически случайные факторы, подбираемые в каждом случае инди
видуально. В частности, при данном варианте понятия4н не только
не удаляются, но могут составить основу выделения новых понятий
как среднего, так и теоретического уровня (понятия2сн и понятия2тн)
и, соответственно, существенно изменить процесс и результаты сорти
ровки остальных понятий. Остальные вариации находятся между ука
занными случаями.
На входе шестого слоя — понятия5, фактически представляющие
собою те первичные понятия, которые прошли сквозь «сито» предыду
щих пластов. БЭС в шестом слое путем проверки ассоциативных свя
зей определяют близость понятий5с и понятий5сн к понятиям2т и за
меняют все понятия(5с и 5сн), которые проверялись ассоциативно
81
Н.А. Полевой
близкими понятиями2т и крайне редко понятиями2тн. При этом если
для определенного понятия5 находится соответствующее понятие2т,
это последнее получает одну дополнительную «опору». Если же для
этого понятия5 нет соответствующих понятий2т, изпод наиболее про
тиворечащего нему понятия2т изымается одна «опора» (при условии
невозможности найти наиболее противоречивое понятие «опора» вы
бивается изпод любого произвольного понятия2т — таким образом
мы пытаемся смоделировать возникновение хорошо известного мно
гим исследователям когнитивного диссонанса, возникающего при оз
накомлении с фактами, происходящими из надежных источников, но
не укладывающимися в рамки любимой теории). В одном из вариан
тов модели в случае выявления противоречий понятий5 и понятий2т
«опоры» всегда выбиваются изпод случайно взятого понятия2т. На
данном этапе разработки модели исходное количество «опор» для каж
дого понятия2т принято равным пяти. При получении лишней, шес
той и т.п. «опоры», она игнорируется. При удалении последней опоры
соответствующее понятие2т удаляется.
В результате работы шестого слоя должен быть сформирован более
или менее целостный образ изучаемого исторического процесса, круп
ного явления или исторического процесса в целом (в зависимости от
стартовых масштабов). На формальном уровне этот образ представля
ется совокупностью отобранных понятий2т. Можно было бы назвать
этот образ системой, но, учитывая, что мы пока плохо представляем
себе структуру и специфические черты этого образа, следует признать,
что такое обозначение будет преждевременным и только запутывающим
дело. В последующем этот образ (система), как правило, вербализуется
исследователем в виде научного труда, содержащего (при сохранении
интересующего нас уровня абстракции) то, что в историографии назы
вается концепцией.
Очевидно, что вербализация и концептуализация полученного об
раза также определяются множеством факторов, и вследствие этого яв
ляется совершенно естественной возможность выработки почти про
тивоположных концепций на основе очень похожих образов. Как
было показано выше, до сих пор не существует удовлетворительного
описания закономерностей смены парадигм исторического познания.
Можно предполагать, что неудачи поисков могли быть связаны с тем,
что объектом исследования был вербализованный результат концептуа
лизации целостного образа, зависящий, как было сказано, от мно
жества трудноучитываемых факторов и находящийся довольно далеко
82
Основные характеристики имитационной…
от того, что в прямом значении слова подразумевалось Т. Куном в опре
делении научной парадигмы, как, впрочем и от исходного значения
этого слова в лингвистике17.
Есть основания полагать, что при исследовании поведения нейро
сетевой модели формирования образа — основы концептуальных
построений — и верификации модели на различных временных ин
тервалах по существенным изменениям ее параметров можно будет
выявить как существенные черты отдельных парадигм исторического
познания (в более или менее формализованной форме и терминах ней
росети), так и, возможно, инвариантные черты, присущие всем или
большинству существовавших парадигм, а также, самое главное, станет
возможным выявить «снизу», через механизмы формирования образов
истории, закономерности смены парадигм исторического познания.
Мы полагаем, что процесс вербализации образа также может быть
описан в дальнейшем нейросетевой моделью и стать вторым крупным
блоком представленного варианта нейросетевой модели развития ис
торикотеоретического познания.
Примечания
1
2
3
4
5
6
7
8
9
10
Цит. по: http://rudnevslovar.narod.ru/p2.htm
http://rudnevslovar.narod.ru
Кун Т. Структура научных революций. М., 1977; Шапиро А.Л. Историо
графия с древнейших времен до 1917 г. М., 1993. 761 с.
См.: Шапиро А.Л. Указ. соч.; Колесник І.І. Українська історіографія
(XVIII — початок XX століття). К., 2000. 256 с.
Кун Т. Указ. соч. С. 119–127.
См.: Плотинский Ю.М. Модели социальных процессов. М., 2001. 296 с.
Польовий М.А. Основні риси розвитку циклічних уявлень про історич
ний процес в російській і світовій історіографії // Наукові праці Одеської
національної юридичної академії. Одеса: Юридична література, 2002.
Т. 1. С. 314–322; Полевой Н.А. О возможных закономерностях развития
циклических представлений об историческом процессе // Информаци
онный бюллетень Ассоциации «История и компьютер». М., 2002. Вып. 30.
Специальный выпуск. Материалы VII конференции Ассоциации «Исто
рия и компьютер». С. 256–258.
Батуев А.С. Высшая нервная деятельность. СПб., 2002. 416 с.
Терехов В.А. Нейросетевые системы управления / В.А. Терехов, Д.В. Ефи
мов, И.Ю. Тюкин. М., 2002. С. 3–12.
Там же. С. 17–18.
83
Н.А. Полевой
11
12
13
14
15
16
17
См.: http://www.orc.ru/~stasson
Терехов В.А. Указ. соч. С. 22–35.
Терехов В.А. Нейросетевые системы управления / В.А. Терехов, Д.В. Ефи
мов, И.Ю. Тюкин. М., 2002. С. 25–36.
См.: Батуев А.С. Указ. соч.; Барбараш А.Н. Волновые процессы в живом:
основы стерогенетики и физиологии мышления. Одесса, 1998. 352 с.
Ср.: Фоменко А.Т. Критика традиционной хронологии античности и сред
невековья. М.: МГУ, 1993. 204 с.; История и антиистория. Критика «новой
хронологии» академика А.Т. Фоменко. М., 2000; Новиков С.П. Пcевдо
иcтория и пcевдоматематика: фантаcтика в нашей жизни // Уcпехи матема
тичеcких наук. 2000. Вып. 2.
Терехов В.А. Указ. соч. С. 16.
Кун Т. Указ. соч. С. 13–20; Ср.: http://elibrary.ehu.unibel.by/Art/Culture/
b207.htm.
Скачать