БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ На правах рукописи УДК 519.95 Полищук Анна Юрьевна Применение информационных технологий при прогнозировании экономических процессов с помощью нейронных сетей. Выпускная работа по «Основам информационных технологий» Магистранта кафедры математической информатики и математической экономики Специальность 1-25 80 08 — математические и инструментальные методы в экономике Научные руководители: кандидат технических наук, доцент Лапицкая Н.В., старший преподаватель Кожич П.П. Минск, 2013 СОДЕРЖАНИЕ Содержание .................................................................................................................. 2 Список обозначений .................................................................................................... 3 Введение ....................................................................................................................... 4 Глава 1 Теоретико-методологические основы приминения нейронных сетей при моделировании экономических процессов ............................................................... 7 1.1. Теоретические основы применения нейронных сетей при моделировании. Хронология возникновения науки о ИНС. ............................................................ 7 1.2 Основные макроэкономические показатели ................................................... 9 1.3 Анализ динамики результативных показателей национальной экономики Республики Беларусь ............................................................................................... 9 1.4 Современные методы прогнозирования ВВП............................................... 11 Глава 2 Использование современных информационных технологий в нейросетевом моделировании .................................................................................. 13 2.1 Программное обеспечение .............................................................................. 13 2.2 Прогнозирование ВВП с помощью пакета Neuroshell 2. ............................. 17 2.3 Прогнозирование комплексного показателя экономического развития с помощью МГУА..................................................................................................... 18 Глава 3 Эффективность прогнозирования .............................................................. 26 Заключение ................................................................................................................. 27 Библиографический список ...................................................................................... 29 Приложения................................................................................................................ 31 Приложение А ............................................................................................................ 31 Предметный указатель .............................................................................................. 31 Приложение Б ............................................................................................................ 32 Интернет ресурсы в предметной области исследования ....................................... 32 Приложение В ............................................................................................................ 39 Действующий в WWW личный сайт (гиперссылка) и Print Screen главной страницы ..................................................................................................................... 39 Приложение Г ............................................................................................................ 40 Граф научных интересов магистранта Полищук Анны Юрьевны ....................... 40 Приложение Д ............................................................................................................ 42 XML-формат тестовых вопросов по Основам информационных технологий ... 42 Приложение Е ............................................................................................................ 43 Презентация магистерской диссертации ................................................................ 43 2 СПИСОК ОБОЗНАЧЕНИЙ ИНС - Искусственная нейронная сеть ОМП - Основные макроэкономические показатели МГУА - Метод группового учета аргументов ИС - Информационная система ИТ - Информационные технологии ИИ - Искусственный интеллект ARIMA - autoregressive integrated moving average - интегрированная модель авторегрессии - скользящего среднего 3 ВВЕДЕНИЕ Искусственные нейронные сети прочно вошли и закрепились в нашей жизни. На данный момент нейросетевые инструменты и модели широко используются при решении самых различных задач там, где обычные алгоритмические решения оказываются неэффективными или вовсе невозможными. В списке задач, решение которых доверяют искусственным нейронным сетям (ИНС), можно назвать следующие: распознавание образов, кластеризация, психодиагностика, хемо информатика, игра на бирже, фильтрация спама, проверка проведения подозрительных операций по банковским картам, системы безопасности и видеонаблюдения — и это еще не все. Применение нейронных сетей показывает отличные результаты практически в каждой области применения. ИНС представляют собой систему соединённых и взаимодействующих между собой простых процессоров (искусственных нейронов). Такие процессоры обычно довольно просты, особенно в сравнении с процессорами, используемыми в персональных компьютерах. Каждый процессор подобной сети имеет дело только с сигналами, которые он периодически получает, и сигналами, которые он периодически посылает другим процессорам. И тем не менее, будучи соединёнными в достаточно большую сеть с управляемым взаимодействием, такие локально простые процессоры вместе способны выполнять довольно сложные задачи. Нейронные сети не программируются в привычном смысле этого слова, они обучаются. Возможность обучения — одно из главных преимуществ нейронных сетей перед традиционными алгоритмами. Технически обучение заключается в нахождении коэффициентов связей между нейронами. В процессе обучения нейронная сеть способна выявлять сложные зависимости между входными данными и выходными, а также выполнять обобщение. Это значит, что в случае успешного обучения сеть сможет вернуть верный результат на основании данных, которые отсутствовали в обучающей выборке, а также неполных и/или «зашумленных», частично искаженных данных. Способности нейронной сети к прогнозированию напрямую следуют из ее способности к обобщению и выделению скрытых зависимостей между входными и выходными данными. После обучения сеть способна предсказать будущее значение некой последовательности на основе нескольких предыдущих значений и/или каких-то существующих в настоящий момент факторов. 4 Современная ситуация в мировой экономике полна противоречий. Страны развиваются в условиях глобализации, интернационализации, укрепления внешнеторговых процессов и международной интеграции, возрастающей роли информационных технологий во всех сферах жизни общества. При этом все чаще возникают ситуации нестабильности и кризисов, касающиеся даже самых экономически устойчивых стран. В таких условиях основная цель каждого государства - обеспечить стабильный рост экономики, вовремя предугадать и распознать потенциальные «проблемные» зоны и процессы, требующие вмешательства. Макроэкономические показатели или индикаторы характеризуют состояние экономики. Четкое понимание экономической сущности этих показателей и их взаимного влияния друг на друга – это основа для разработки политики регулирования экономических процессов в государстве. В экономике государства одновременно действуют многочисленные макроэкономические процессы, и часто - в противоположных направлениях. Очень трудно охватить и понять всё это многообразие экономических явлений и процессов, тем более установить зависимости между ними. Для этого используется моделирование макроэкономических процессов, то есть построение макроэкономических моделей. Актуальность данной работы состоит в том, что адекватное и эффективное прогнозирование и моделирование макроэкономических процессов является целью любого государства, проблема точных самообучающихся моделей остро стоит перед министерством экономики любой страны; та же ситуация повторяется на уровне предприятий. Предмет исследования – ИНС как инструмент для построения модели с последующим прогнозированием основных макроэкономических показателей. Целью данной работы является нахождение состоятельной экономикоматематической модели выбранного показателя, на основе которой может быть проведен анализ и прогнозирование последующей оценкой динамики и влияющих на выходной параметр данных. Задачами работы являлись: рассмотрение основных существующих макроэкономических показателей экономики стран мира исследование методов нейросетевого моделирования прогнозирования экономических данных обзор основных программных продуктов, использующих нейросетевые алгоритмы разработка модели ВВП на основе ИНС анализ модели и оценка полученных данных на состоятельность 5 Теоретической и методологической базой исследования послужили фундаментальные и прикладные исследования в области экономикоматематического моделирования, изложенные в работах российских и зарубежных ученых; научные публикации по проблемам прогнозирования экономических показателей, материалы научных конференций. Эмпирическая база исследования представлена двумя блоками: статистические данные по динамике основных показателей экономики Республики Беларусь данные, полученные в результате составления модели для получения прогнозных показателей входных параметров с помощью модели ARIMA Научная новизна работы заключается в разработке новых теоретических и методических подходов к проблеме моделирования макроэкономических показателей как основы для составления прогноза. Практическая значимость работы состоит в разработке методических рекомендаций по составлению прогнозов и на их основе получении новых механизмов нахождения резервов роста и данных для регулирования экономики. В работе использовались теоретические и эмпирические методы, среди которых теоретический анализ, синтез, научное обобщение, аналогия, прогнозирование, анализ документов, контент-анализ прессы, сравнительный анализ научных источников и нормативно-правовой базы от международного до регионального уровня, вторичный анализ данных, полученных другими исследовательскими коллективами. Проверка и повышение надежности интерпретации осуществлялась путем сопоставления полученных данных с результатами исследований других работ подобного рода, результатами исследований, опубликованных в открытой печати. 6 ГЛАВА 1 ТЕОРЕТИКО-МЕТОДОЛОГИЧЕСКИЕ ОСНОВЫ ПРИМИНЕНИЯ НЕЙРОННЫХ СЕТЕЙ ПРИ МОДЕЛИРОВАНИИ ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ 1.1. Теоретические основы применения нейронных сетей при моделировании. Хронология возникновения науки о ИНС. Искусственные нейронные сети — математические модели, а также их программные или аппаратные реализации, построенные по принципу организации и функционирования биологических нейронных сетей — сетей нервных клеток живого организма. Это понятие возникло при изучении процессов, протекающих в мозге, и при попытке смоделировать эти процессы. Первой такой попыткой были нейронные сети Маккалока и Питтса[1]. Впоследствии, после разработки алгоритмов обучения, получаемые модели стали использовать в практических целях: в задачах прогнозирования, для распознавания образов, в задачах управления и др.[2] Хронология возникновения науки о ИНС: 1943 — У. Маккалок и У. Питтс формализуют понятие нейронной сети в фундаментальной статье о логическом исчислении идей и нервной активности[1]. 1948 — Норберт Винер вместе с соратниками публикует работу о кибернетике. Основной идеей является представление сложных биологических процессов математическими моделями. 1949 — Д. Хебб предлагает первый алгоритм обучения. В 1958 Ф. Розенблатт изобретает однослойный персептрон. Персептрон обретает популярность — его используют для распознавания образов, прогнозирования погоды и т. д. Казалось, что построение полноценного искусственного интеллекта уже не за горами. К моменту создания персептрона завершилось расхождение теоретических работ Маккалока с т.н. «кибернетикой» Винера. Маккалок и его последователи вышли из состава «Кибернетического клуба». В 1960 году Уидроу (англ.) совместно со своим студентом Хоффом на основе дельта-правила (формулы Уидроу) разработали Адалин, который сразу начал использоваться для задач предсказания и адаптивного управления. Адалин был построен на базе созданных ими же (Уидроу — Хоффом) принципиально новых элементах — мемисторах[3]. Сейчас Адалин 7 (адаптивный сумматор) является стандартным элементом многих систем обработки сигналов.[4] В 1963 году в Институте проблем передачи информации АН СССР. А. П. Петровым проводится подробное исследованием задач «трудных» для персептрона[5]. Эта пионерская работа в области моделирования ИНС в СССР послужила отправной точкой для комплекса идей М. М. Бонгарда — как «сравнительно небольшой переделкой алгоритма (персептрона) исправить его недостатки»[6]. Работы А. П. Петрова и М. М. Бонгарда весьма поспособствовали тому, что в СССР первая волна эйфории по поводу ИНС была сглажена. В 1969 году М. Минский публикует формальное доказательство ограниченности персептрона и показывает, что он неспособен решать некоторые задачи (Проблема "четности" и "один в блоке"), связанные с инвариантностью представлений. Интерес к нейронным сетям резко спадает. В 1973 - Б. В. Хакимов предлагает нелинейную модель с синапсами на основе сплайнов и внедряет её для решения задач в медицине, геологии, экологии. Хакимов Б. Б. Моделирование корреляционных зависимостей сплайнами на примерах в геологии и экологии. — М.: «МГУ», С-Пб.: «Нева»,2003, 144 с. 1974 Пол Дж. Вербос[7] и А. И. Галушкин[8] одновременно изобретают алгоритм обратного распространения ошибки для обучения многослойных персептронов. Изобретение не привлекло особого внимания. 1975 - Фукусима представляет Когнитрон — самоорганизующуюся сеть, предназначенную для инвариантного распознавания образов, но это достигается только при помощи запоминания практически всех состояний образа. 1982 - после периода забвения, интерес к нейросетям вновь возрастает. Дж. Хопфилд показал, что нейронная сеть с обратными связями может представлять собой систему, минимизирующую энергию (так называемая сеть Хопфилда). Кохоненом представлены модели сети, обучающейся без учителя (Нейронная сеть Кохонена), решающей задачи кластеризации, визуализации данных (самоорганизующаяся карта Кохонена) и другие задачи предварительного анализа данных. 1986 - Дэвидом И. Румельхартом, Дж. Е. Хинтоном и Рональдом Дж. Вильямсом[9] и независимо и одновременно С. И. Барцевым и В. А. Охониным (Красноярская группа)[10] переоткрыт и существенно развит метод обратного распространения ошибки. Начался взрыв интереса к обучаемым нейронным сетям. 2011 год - В России разработан и введен в действие первый в мировой практике стандарт по автоматическому обучению искусственных нейронных 8 сетей. Отечественный стандарт ГОСТ Р 52633.5-2011 «Защита информации. Техника защиты информации. Автоматическое обучение нейросетевых преобразователей биометрия-код доступа» построен на алгоритме обучения, имеющем линейную вычислительную сложность и высокую устойчивость.[2] 1.2 Основные макроэкономические показатели Дать полное представление о том, в каком состоянии сейчас находится экономика страны, наиболее полно охарактеризовать ее подъём или спад могут макроэкономические показатели экономики. Они дают возможность предсказывать тенденцию движения цен и будущую ситуацию на валютном рынке. К наиболее весомым данным относятся такие макроэкономические показатели, как: Валовой внутренний продукт (ВВП) - GDP Индекс промышленного производства (PMI) Индекс потребительских цен (CPI) Индекс промышленных цен (PPI) и др. 1.3 Анализ динамики результативных показателей национальной экономики Республики Беларусь Для того чтобы определить состояние национальной экономики, необходимо получить представление и проанализировать систему показателей, характеризующих макроуровень экономики. Более того, необходимо рассмотреть эти показатели в динамике, определив основную тенденцию экономики в текущем периоде. Для сравнительного анализа экономического развития и уровня жизни различных стран, координации их экономической и валютной политики, принятия решений по экономическому и научно-техническому сотрудничеству, по вопросам политического характера проводятся международные сопоставления ВВП. Они представляют также большой практический интерес для международных организаций для решения проблем формирования 9 бюджетов этих организаций, определения доли отдельных стран в финансировании тех или иных проектов, предоставления кредитов и т.д. В рамках ООН разработана программа международных сопоставлений, охватывающая более 80 стран, осуществление которой началось с 1970 г. Методологические принципы данной программы послужили базой для составления проекта международных сопоставлений в рамках стран СНГ. В основе международных сопоставлений обычно лежит ВВП, исчисленный методом конечного использования. Он представляет собой стоимость конечных товаров и услуг и является, следовательно, функцией двух наборов переменных величин — цен и количества (физического объема) товаров и услуг. По данным статистики Белорусского статистического комитета Республики Беларусь можно проанализировать, как изменялся валовой внутренний продукт с 2001 по 2011 гг. (Таблица 1): Таблица 1 - Анализ динамики ВВП Республики Беларусь за 2001-2011 гг. Год Валовой внутренний продукт: в текущих ценах, млрд. руб. Валовой внутренний продукт: в сопоставимых ценах, в процентах к предыдущему году Валовой внутренний продукт на душу населения, тыс. руб. 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 17173 26138 36565 49992 65067 79267 97165 129791 137442 164476 274282 104,7 105 107 111,4 109,4 110 108,6 110,2 100,2 107,7 105,3 1730 2650 3732 5138 6733 8253 10163 13622 14457 17331 28953 Проведем визуальный анализ данных их таблицы (Рисунки 1,2): Рисунок 1.1 - Динамика номинального ВВП за 2001-2011 гг. 10 Рисунок 1.2 - Динамика реального ВВП в сопоставимых ценах за 2001- 2011гг. Проанализировав данную таблицу и вышеприведенные графики можно сделать вывод, что за период 2001-2008 гг. темпы роста ВВП почти не менялись. Номинальный ВВП показывает положительную динамику на всей области исследования (Рисунок 1), тогда как реальный показатель в сопоставимых ценах (Рисунок 2) дает картину спада темпов роста показателя в 2009 и 2011 годах, что связано с экономическим кризисом и сопутствующим общим спадом экономической активности. По данным Белстата, в январе—декабре 2011 года объем ВВП Беларуси составил в текущих ценах Br 274,3 трлн., что выше итогов 2010 года в сопоставимых ценах на 5,3 %. Объем выпуска промышленной продукции в 2011 году составил Br 337 трлн. (на 9,1 % больше по сравнению с 2010 годом), сельскохозяйственной продукции — Br 56,7 трлн. (больше на 6,6 %). Понятно, что в динамике роста общего объема промышленного производства наилучшие показатели были отмечены в первом полугодии 2011 года. Для сравнения: по итогам этого периода ВВП Беларуси вырос на 11 % к аналогичному прошлогоднему уровню, в сфере производства прирост составил 11,9 %, в сфере услуг — 10,1 %[9]. 1.4 Современные методы прогнозирования ВВП В зарубежной практике прогнозирование ВНП (ВВП) осуществляется различными методами. Широко используются методы экстраполяции, дефляции, экономико-математические модели (факторные, межотраслевые "затраты -выпуск", эконометрические), производственный, распределительный методы и метод конечного использования ВВП. Эти методы получают широкое 11 распространение в странах СНГ, в том числе в Республике Беларусь. Рассмотрим основные положения указанных методов. Методы экстраполяции предполагают исследование возможных тенденций изменения рядов динамики показателей (ВВП и др.) с помощью различных временных функций (трендовых моделей - модель динамики производства, приближающаяся в той или иной степени к траектории роста, описываемой статистической совокупностью (динамикой фактического ряда). При сохранении условий экономического развития в будущем временные функции могут быть экстрапо-лированы и тем самым найдены прогнозные оценки динамики производства и отдельных факторов. Зависимость может быть линейной и нелинейной .Следует отметить, что линейная зависимость обычно не рассматривается как очень "глубокая" для целей прогнозирования. Суть факторных моделей экономического роста состоит в установлении количественных связей между объемом и динамикой производства ВВП и объемом и динамикой производственных ресурсов. Метод дефляции. Дефлирование осуществляется через индексы цен и структуру производства. Используются индексы потребительских цен, оптовых (отпускных) цен, цен экспорта, импорта и прогнозируемые объемы производства. В Республике Беларусь при разработке программы неотложных мер по выходу экономики из кризиса впервые для расчета ВВП и инфляции использовалась методика МВФ, в основе которой лежит макромодель прогноза ВВП па основе оценки изменения объемов и инфляции его элементов. Сущность методики заключается в следующем. Расчет производится по этапам. Вначале рассчитывается реальный ВВП. Все отрасли народного хозяйства подразделяются на две группы: сельское хозяйство и несельскохозяйственные отрасли. Такое деление связано с сезонностью сельскохозяйственного производства и существенными колебаниями производства по кварталам. Определяются темпы изменения объема производства по сельскому хозяйству и прочим отраслям по кварталам. При этом используются прогнозные расчеты министерств. В Республике Беларусь соотношение двух составляющих следующее: 20% - удельный вес сельскохозяйственной продукции и 80% прочие отрасли. По данному соотношению и темпам изменения объема производства по кварталам находятся годовые темпы изменения объема производства. После этого производится расчет реально-го ВВП на прогнозируемый период. На втором этапе определяется номинальный ВВП. [10] 12 ГЛАВА 2 ИСПОЛЬЗОВАНИЕ СОВРЕМЕННЫХ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В НЕЙРОСЕТЕВОМ МОДЕЛИРОВАНИИ 2.1 Программное обеспечение Механизмы метода нейронных сетей были реализованы в ряде программных продуктов, среди них: FAKE GAME Project — Программа на основе Open source (кроссплатформенное) приложение. В программе используется естественная эволюция развития моделей интеллектуального анализа данных. Она включает в себя несколько способов предварительной обработки, оптимизации и визуализации с целью упростить процесс поиска полезных знаний в "сырых" данных, который включает в себя вопросы подготовки данных, выбора информативных признаков, очистки, постобработки и интерпретации полученных результатов. [19] GEvom — Бесплатная программа для использования в академических целях. Совестима только с ОС Windows. Рисунок 2.1 - Окно программы GEvom Возможности GEvom: Анализ любых экспериментальных данных 13 Создание моделей и их применение для прогнозирования Использование 4-х различных методов конструкции нейронных сетей типа МГУА Получение полиномиальных математических функций Использование генетических алгоритмов для проектирования сети оптимальной структуры Применение SVD-метода (сингулярное разложение) для устранения любых особенностей данных [20] GMDH Shell — коммерческий продукт. Программный инструмент для интеллектуального анализа данных и прогнозирования на основе МГУА. С помощью GMDH Shell можно исследовать данные, построить регрессионную модель, применить ранее полученную модель для прогнозирования. [21] Рисунок 2.2 - Окно программы GMDH Shell PNN Discovery client – коммерческий продукт. Программа предназначена для поиска структурных закономерностей в виде полиномальных регрессионных уравнений как линейного, так и нелинейного вида произвольной степени. Ядром программы является алгоритм полиномиальных нейросетей PNN на основе Группового учета аргументов (МГУА) при построении регрессионных моделей. Структурная зависимость исходных данных выражается аналитическим полиномиальным уравнением. 14 Программа позволяет строить модели на основе вариаций следующих параметров: количество членов уравнения, максимальная степень полинома, робастность коэффициентов уравнения и другие параметры. Полученные модели можно использовать как для анализа закономерностей, так и для прогноза краткосрочных и длительных во времени решений. Алгоритм применяется в химии (QSAR), для анализа экономических систем, для прогноза финансовых инструментов (стоки, фьючерсы, валюты), для изучения рисков страхования, медицинской диагностики и т.д.[22] Рисунок 2.3 - Окно программы PNN Discovery client Sciengy RPF! — программа на основе Open source.Windows-приложение для анализа данных с помощью самоорганизующихся нейронных сетей. Работает с текстовыми файлами данных и имеет удобный пользовательский интерфейс. С помощью программы решаются задачи интеллектуального анализа данных классового распознавания, непрерывного прогнозирования значений и прогноза временных рядов. [23] 15 Рисунок 2.4 - Окно программы Sciengy RPF! NeuroShell 2 - это универсальный пакет, предназначенный для нейросетевого анализа данных. С его помощью можно решать широкий спектр задач, начиная с широко распространенных задач, таких как прогнозирование курсов акций (облигаций, фьючерсов, валют , цен на нефть и т.д. ), и заканчивая менее распространенными задачами, такими как, например, обратные задачи в геофизике и другие сложные задачи. Рисунок 2.5 - Окно программы NeuroShell 2 NeuroShell 2 включает в себя: Систему для начинающего Систему для профессионала Средства автономного использования 16 По итогам сравнения существующих программных продуктов, в которых реализован нейросетевой алгоритм, выбор был сделан в пользу NeuroShell 2. Это связано с доступностью программы для бесплатного использования, наличием русифицированной версии ПО с подробной нструкцией по применению, присутствием широких возможностей для ручной регулировки параметров модели, а также существованием модулей генерации программного кода на языке VBA и СИ. 2.2 Прогнозирование ВВП с помощью пакета Neuroshell 2. Руководствуясь целью – нахождение значимой модели для прогнозирования Валового внутреннего продукта – был осуществлен отбор параметров (X), влияющих на выходную переменную (Y). Данные были взяты с официального сайта Национального статистического комитета Республики Беларусь. Как в наибольшей степени влияющие на выходной параметр (ВВП), были выбраны следующие показатели: Численность населения Республики Беларусь, тысяч человек Экономически активное население, тысяч человек Реальные денежные доходы населения, в % к предыдущему году Реальная заработная плата, в % к предыдущему году Индекс промышленного произсодства, в сопоставимых ценах, в % к предыдущему году Индексы инвестиций в основной капитал, в сопоставимых ценах, в % к предыдущему году Розничный товарооборот торговли, в сопоставимых ценах, в % к предыдущему году Данные были взяты за 2001 – 2011 годы, в результате чего были получены временные ряды, представленные в Таблице 2: 17 Таблица 2 - Исходные данные Год Числ. нас. РБ. тыс. чел Эк-ки активное нас. тыс. чел 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 9956.7 9900.4 9830.7 9762.8 9697.5 9630.4 9579.5 9542.4 9513.6 9500 9481.2 4523.9 4506.4 4487.6 4437.6 4490.6 4534.4 4566.9 4654.2 4686.1 4705.1 4 663.5 Реальные Реальная ДД з\п. в % к населения. пред. в%к году пред. году 128.1 104.1 103.9 109.8 118.4 117.8 113.2 111.8 102.7 115.1 99.3 129.6 107.9 103.2 117.4 120.9 117.3 110 109 100.1 115 101.3 ИПП (в сопост. ценах; в %к пред. году) 105.9 104 106.7 115.3 110 111.2 108.6 111.3 96.9 111.7 109.1 Индексы инвестиций в ОК (в сопост. ценах; в % к пред. году) 96.5 106 120.8 120.9 120 132.2 116.2 123.5 104.7 115.8 113.3 Розничный товарооборо т торговли: в сопост. ценах. в % к пред. году 129.1 111.9 110.4 111.4 120.4 117.5 115 119.7 103.5 115.7 107.1 Построение модели МГУА будет осуществляться в два этапа: Прогнозирование входных параметров при помощи метода Авторегрессии-проинтегрированного скользящего среднего (ARIMA Autoregressive integrated moving average) Применение Метода группового учета аргументов на полученных с помощью ARIMA данных для составления прогноза выходного параметра. 2.3 Прогнозирование комплексного показателя экономического развития с помощью МГУА На базе полученных данных произведем составление модели типа МГУА, а на ее основе - прогнозирование при помощи NeuroShell2. По следующей схеме: Поиск минимумов и максимумов для последующей нормализации данных. Будет производиться приведение к интервалу (-1;1). Выбираем входы и выходы и рассчитываем граничные значения Выделение тестового, тренировочного и экзаменационного наборов Установка параметров МГУА После выбора параметров приступаем к тренировке (Рисунок 2.6): 18 Рисунок 2.6 – Тренировка МГУА Рисунок 2.7 – Легенда модели Как видно из вышеприведенного рисунка, после построения 10 слоев система выбрала составила уравнение. Начнем применение сети (Рисунок 2.8): Рисунок 2.8 – Применение сети 19 Как видно из рисунков, модель имеет очень хорошие показатели: R2= 0,9995 Относительная СКО = 0,723 % Все ошибки находятся в интервале от 0 до 5 %. Рассмотрим графики Исходных значений и смоделированных данных: Рисунок 2.9 – Графики исходного ряда и данных по модели Из иллюстрации видно, что модель получилась очень близкой к исходным данным, что свидетельствует о состоятельности модели. Однако данная модель является слишком громоздкой и слабо применима в условиях отсутствия сложной вычислительной техники. Также, основываясь на полученной модели, не представляется возможным выявление явных зависимостей между входными параметрами и итоговой переменной. В связи с этим проведем повторный прогон данных через систему, используя при этом критерий FCPSE (Квадратичная ошибка предсказания с полной сложностью), т.к. использование данного параметра исключает возможность создания слишком сложной модели. 20 Рисунок 2.10 – Тренировка МГУА Рисунок 2.11 – Легенда модели Проводим применение данной модели с новым условием : Рисунок 2.12 – Применение сети к файлу данных 21 Рисунок 2.13 – Графики исходного ряда и данных по модели Как можно отметить из графика, данная модель также имеет право на существование, однако ее показатели значительно хуже предыдущей модели, о чем свидетельствуют показатели СКО и увеличившаяся доля с ошибкой более 5%. Однако данная модель предельно проста и может быть хорошо интепритирована в экономическом смысле. Исходя из полученной модели, наибольшее влияние на ВВП оказывает Реальный денежный доход населения. Несомненно, тесная связь между данными показателями имеет место быть и в реальных условиях, однако подобная однофакторная модель не дает в полной мере картину формирования выходного показателя. После прогона данных через систему с критерием FCPSE получили итоговое уравнение: Изменим параметры тренировки полиномиальной сети для получения модели, которая при наличии хороших показателей модели, не была бы перегруженной избыточной сложностью. Для этого было решено выбрать следующие параметры тренировки (Рисунок 2.14): 22 Рисунок 2.14 – Параметры тренировки МГУА На рисунке 2.15 приведена лучшая формула с заданными параметрами после проведения тренировки и построения 5 слоев: Рисунок 2.15 – Тренировка МГУА Следует отметить, что система сама отбросила ненужные параметры (x1 и x5). После применения сети на исходных данных получены следующие показатели (Рисунок 2.15): 23 Рисунок 2.15 – Применение сети МГУА Как видно из данных рисунков, показатели модели получились близкими к первой модели, все ошибки лежат в интервале от 0 до 5 %, относительная СКО менее 1 %. Состоятельность модели так же можно определить, оценив графики исходных данных и данных по модели (Рисунок 2.16): Рисунок 2.16 – График зависимостей Как и требовалось, показатели данной модели намного лучше, если сравнивать с моделью, где внешним критерием был FCPSE, но допустимо хуже, где критерием была выбрана регулярность при большем числе кросспроизведений, количества переменных и степени вхождения. Эта модель более предпочтительна при отсутствии возможности использования сложной вычислительной техники, т.к. показывает хороший результат без перегрузки модели сложными сочетаниями переменных. 24 Сравним данные, полученные из вышеизложенных моделей (Таблицы 3,4.5) с данными, которые были спрогнозированы Министерством Экономики Республики (Таблицы 3-5) Таблица 3 - Выходные данные (Регулярность полная) Год ВВП в ценах 2011 года В % к предыдущему году 2011 2012 2013 2014 289801,67 305340,76 322056,91 340397,67 1,0566 1,0536 1,0547 1,0569 Таблица 4 - Выходные данные (FCPSE) Год ВВП в ценах 2011 года в % к предыдущему году 2012 2013 2014 2015 286456,49 300764,33 315232,39 329862,47 1,0444 1,0499 1,0481 1,0464 Таблица 5 - Выходные данные (Регулярность упрощенная) Год ВВП в ценах 2011 года в % к предыдущему году 2012 288034 1,05553 2013 303557 1,0539 2014 319488 1,05248 2015 335861 1,05125 По расчетам Института народнохозяйственного прогнозирования Российской академии наук, Института экономики и прогнозирования НАН Украины и Центра интеграционных исследований Евразийского банка развития (ЕАБР), которые приводятся в исследовании, в 2011—2015 годах среднегодовые темпы роста ВВП составят в Беларуси 4,7% На государственном уровне в Республике Беларусь утвержден прогноз на 2012 год, предусматривающий рост ВВП на уровне 5-5,5%. Программа социально-экономического развития на 2011—2015 годы предполагает, что за пятилетку ВВП Беларуси вырастет на 62—68%. Выполнение данной программы предполагает, что ежегодный рост ВВП Беларуси должен составлять около 10% [23] 25 ГЛАВА 3 ЭФФЕКТИВНОСТЬ ПРОГНОЗИРОВАНИЯ С ПОМОЩЬЮ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ Работа, проделанная в данном исследовании, показала, что инструменты прогнозирования с помощью искусственной нейронной сети являются чрезвычайно точными. Это касается как моделей, составленных на основе входных параметров (точность прослеживается исходя из графиков исходных данных и данных по модели), так и прогноза. Прогноз, созданный на основе МГУА показал, что спрогнозированные с его помощью данные находятся предельно близко к данным РАН и НАН Украины, что указывает на их состоятельность. Прогноз белорусских властей на 2012 год также сходится с прогнозом, прогноз же на пятилетку является излишне оптимистичным, особенно в сложившихся на данный момент условиях нестабильности национальной валюты и общей рецессии. Получившиеся модели можно использовать в различных случаях: при наличии персонального компьютера наиболее предпочтительной является первая модель, т.к. она показывает самые точные данные для прогноза с учетом массы показателей в различных сочетаниях, что позволяет нивелировать эффект, когда резкий скачек одного показателя нарушает модель и ухудшает ее способность к реальному прогнозу. При отсутствии достаточных вычислительных мощностей предпочтительнее использование третьей модели, т.к. при относительной простоте она также способна показать хорошие результаты. 26 ЗАКЛЮЧЕНИЕ Нейросети - это большей класс систем, архитектура которых имеет аналогию с построением нервной ткани из нейронов. Происходит имитация работы нейронов в составе иерархической сети, где каждый нейрон более высокого уровня соединен входами с выходами нейронов нижележащего уровня. На нейроны самого нижнего слоя подаются значения входных параметров, на основе которых нужно принимать какие-то решения, прогнозировать развитие ситуации и т.д. Эти значения рассматриваются как сигналы, передающиеся в следующий слой, ослабляясь или усиливаясь в зависимости от числовых значений (весов), приписываемых межнейронным связям. В результате на выходе нейрона самого верхнего слоя вырабатывается некоторое значение, которое рассматривается как ответ - реакция всей сети на введенные значения входных параметров. Для того чтобы сеть можно было применять в дальнейшем, её прежде надо "натренировать" на полученных ранее данных, для которых известны и значения входных параметров, и правильные ответы на них. Тренировка состоит в подборе весов межнейронных связей. В настоящий момент существует ряд программных продуктов, в которых реализованы алгоритмы нейронных сетей. Существенным недостатком нейросетевой парадигмы является то, что даже натренированная нейронная сеть представляет собой черный ящик. Знания, зафиксированные как веса нескольких сотен межнейронных связей, совершенно не поддаются анализу и интерпретации человеком (известные попытки дать интерпретацию структуре настроенной нейросети выглядят неубедительными - система "KINOsuite-PR"). Также проблема состоит в нахождении оптимальной сложности модели, т.к. излишне громоздкая модель затрудняет ее применение, а излишне простая не может в полной мере состоятельно описать данные. В работе были созданы модели ВВП Республики Беларусь, которые основывались на следующих входных параметрах: Численность населения Республики Беларусь, тысяч человек Экономически активное население, тысяч человек Реальные денежные доходы населения, в ценах 2011 года Реальная заработная плата, в ценах 2011 года Объем промышленного производства, в ценах 2011 года Объем инвестиций в основной капитал, в ценах 2011 года Розничный товарооборот торговли, в ценах 2011 года 27 В ходе работы были сформированы две модели: на основе критерия регулярности и FCPSE-критерия Анализ моделей и оценка полученных данных на состоятельность продемонстрировали, что первая модель (с критерием Регулярности) дала очень хорошие показатели модели, однако является чересчур громоздкой и затруднительно применима без наличия серьёзных программных средств, а также не поддается анализу с точки зрения выяснения закономерностей и связей между параметрами. Вторая модель (с критерием FCPSE) является простой и понятной для выявления закономерностей, однако не может в достаточной мере описать выходную переменную и также не может считаться полностью состоятельной. Третья модель сочетает в себе как качества первой, так и второй модели. При относительной простоте она показала хорошие результаты ключевых факторов, при этом не перегружаясь особой сложностью. Данные, которые были получены в результате использования обеих моделей сходятся прогнозом Российской академии Наук и Национальной Академии Наук Украины, что свидетельствует о ее состоятельности . Необходимо отметить, что метод группового учета аргументов является мощным инструментом для составления моделей, который даже не коротких выборках способен показать отличное качество модели. Благодаря очень широкому выбору критериев и возможности варьирования массы параметров модели, этот метод позволяет найти именно такую модель, которая отвечала бы начальным требованиям путем перебора различных комбинаций критериев и показателей. Существует масса еще не до конца проработанных внешних критериев модели, правильное применение которых дает возможность составления еще более точных моделей. Метод так же требует дальнейшего изучения в направлении исследования нечеткого алгоритма МГУА, который дает возможность проанализировать качество модели с помощью интервальных оценок параметров. Данная тема затронута в работах Ю.П. Зайченко и требует более детальной проработки. 28 БИБЛИОГРАФИЧЕСКИЙ СПИСОК 1. Мак-Каллок, У.С., Питтс, В. Логическое исчисление идей, относящихся к нервной активности // У. С. Мак-Каллок, В. Питтс— М.: Изд-во иностр. лит., 1956. — с.363-384. 2. Искусственная_нейронная_сеть //Википедия, свободная энциклопедия [Электронный ресурс]. – 2012. – Режим доступа: http://ru.wikipedia.org/wiki/ Искусственная_нейронная_сеть – Дата доступа: 25.11.2012. 3. Горбань, А.Н. Кто мы, куда мы идем, как путь наш измерить?, Пленарный доклад на открытии конференции Нейроинформатика-99, МИФИ, 20 января 1999. // А. Н. Горбань— М.: Машиностроение. — 2000. — № 4. — С. 10-14 4. Уидроу, Б., Стирнс С. Адаптивная обработка сигналов. / Б. Уидроу, С. Стирнс— М.: Радио и связь, 1989. — 440 c. 5. Петров, А.П. О возможностях перцептрона // Известия АН СССР, Техническая кибернетика./ А.П. Петров— 1964. — № 6. 6. Галушкин, А. И. Синтез многослойных систем распознавания образов. / А. И. Галушкин— М.: «Энергия», 1974. 7. Национальный статистический комитет Республики Беларусь [Электронный ресурс] – Минск, 2011. – Режим доступа: http://belstat.gov.by. – Дата доступа: 02.05.2012. 8. ВВП Беларуси за январь-апрель 2012 // Белта - Белорусское Телеграфное агентство [Электронный ресурс] Режим доступа: http://www.belta.by/ru/all_news/economics/VVP-Belarusi-za-janvar-aprel-vyros-na29-do-Br1458-trln_i_597180.html - Дата доступа: 15.04.2012. 9. Методы прогнозирования ВВП // Материалы, книги, пособия – портал для обучения [Электронный ресурс] – Режим доступа: http://ponauke.com/pip/023.html - Дата доступа: 15.04.2012. 10. Метод группового учета аргементов. Статья // Отдел ИТИМ [Электронный ресурс]. – 2011. – Режим доступа: http://www.mgua.irtc.org.ua/ru/index.php?page=gmdh - Дата доступа: 27.11.2011. 11. Метод группового учета аргументов//Википедия, свободная энциклопедия [Электронный ресурс]. – 2011. – Режим доступа: http://ru.wikipedia.org/wiki/ МГУА – Дата доступа: 25.11.2011. 12. Neuroshell 2: Практикум по работе с программой [Электронный ресурс] – 2011. – Режим доступа: http://www.neuroproject.ru/neuro.php – Дата доступа: 26.11.2011. 13. Метод группового учёта аргументов//Машинное распознавание [Электронный ресурс]. – 2011. – Режим доступа: 29 http://www.machinelearning.ru/wiki/index.php?title= МГУА – Дата доступа: 26.11.2011. 14. Метод группового учета аргументов М// CodeNet: Всё для программиста [Электронный ресурс]. – 2011. – Режим доступа: http://www.codenet.ru/progr/alg/ai/htm/gl3_7.php Дата доступа: 26.11.2011. 15. МГУА// Метод Группового Учета Аргументов [Электронный ресурс]. – 2011. – Режим доступа: http://www.gmdh.net/gmdh.htm Дата доступа: 26.11.2011. 16. NeuroShell 2: Подробнее о программе // Информационно аналитический портал о жизни денег [Электронный ресурс]. – 2011. – Режим доступа: http://www.forekc.ru/Ns/index_2.htm - Дата доступа: 27.11.2011. 17. Прогнозирование акций Сбербанка методом группового учета аргументов// Сайт финансового и инвестиционного анализа предприятий [Электронный ресурс] Режим доступа: http://www.beintrend.ru/2010-11-24-10-1219 - Дата доступа: 15.04.2012. 18. FAKE GAME Project Description// Source forge: find, create and publish Open Source Software for free [Electronic resource] Режим доступа: http://sourceforge.net/projects/fakegame/ - Дата доступа: 27.11.2011. 19. GMDH-type Neural Network Design by Evolutionary Method for Modelling // Department of Mechanical Engineering Faculty of Engineering, The University of Guilan [Electronic resource] Режим доступа: http://research.guilan.ac.ir/gevom/ Дата доступа: 27.11.2011. 20. Increase your accuracy and automation with GMDH forecasting algorithm.// GDMH SHELL [Electronic resource] Режим доступа: http://www.gmdhshell.com/ Дата доступа: 27.11.2011. 21. Knowledge Discovery and Data Mining with GMDH-type Polynomial Neural Network algorithm //Polynomial Neural Network Solutions [Electronic resource] Режим доступа: http://pnn.pnnsoft.com/index.html - Дата доступа: 27.11.2011. 22. Sciengy RPF! description// Source forge: find, create and publish Open Source Software for free [Electronic resource] Режим доступа: http://sourceforge.net/projects/sciengyrpf/- Дата доступа: 27.11.2011. 23. Articles, software, books and presentations about the Group Method of Data Handling [Electronic resource]. – 2011. – Режим доступа: http://www.gmdh.net/gmdh.htm - Дата доступа: 26.11.2011. 30 ПРИЛОЖЕНИЯ ПРИЛОЖЕНИЕ А Предметный указатель Искусственная нейронная сеть, 24, 25, 26, 27, 28, 52, 63 A М ARIMA, 26, 38 F Метод группового учета аргументов, 24, 33, 34, 38, 39, 41, 43, 44, 46, 48, 49, 52 Моделирование, 26, 27, 52 Модель, 25, 26, 27, 28, 31, 33, 34, 36, 38, 39, 40, 41, 42, 44, 46, 47, 48 Fake Game Project, 32, 50 G GDMH Shell, 33, 34 GEvom, 32, 33 Н N Нейронная сеть, 24, 25, 27, 28, 32, 33, 35, 46, 47 Норберт Винер, 27 Neuroshell 2, 36, 49 S П Sciengy RPF!, 35, 50 Прогнозирование, 26, 27, 31, 33, 35, 36, 38, 45, 46, 49 А Р Анализ, 28, 29, 32, 33, 34, 35, 36, 47, 49, 52 Республика Беларусь, 26, 29, 31, 32, 36, 37, 45, 47, 49 В Т Валовый Внутренний Продукт, 26, 29, 30, 31, 32, 36, 37, 42, 45, 47, 49 Технология, 24, 28 И Э Информационная система, 24 Информационные технологии, 25, 32, 52 Экономика, 25 31 ПРИЛОЖЕНИЕ Б Интернет ресурсы в предметной области исследования http://www.neuroproject.ru/neuro.php Нейропроект - сайт разработчиков ПО, реализующих инструменты ИНС. http://www.basegroup.ru/library/analysis/neural/ Сайт BaseGroup Labs – Технологии анализа данных. Анализ различных математических аппаратов по ИНС. http://www.aiportal.ru/articles/neural-networks/neural-networks.html Портал искусственного интеллекта. Новости, статьи, литература по ИНС и алгоритмам ИИ. http://www.statsoft.ru/home/textbook/modules/stneunet.html Сайт о ИНС, базовое понятие, применение, алгоритмы. http://habrahabr.ru/post/143668/ Нейронные сети для чайников. Сеть Кохонена. Приводятся алгоритмы самостоятельного программирования ИНС, распознающих образы. http://www.scintific.narod.ru/neural.htm Каталог научных ресурсов по искусственным нейронным сетям. http://www.statistica.ru/home/products/neuralnetwork/default.htm Обзор продуктов, использующих алгоритмы ИНС. http://algolist.manual.ru/ai/neuro/index.php Нейроинформатика, каталог статей по искусственным нейронным сетям. http://alglib.sources.ru/dataanalysis/neuralnetworks.php Кроссплатформенная библиотека численного анализа, поддерживающая несколько языков программирования. Реализация ИНС. http://www.gmdh.net/gmdh.htm Метод группового учета аргументов – концепция, ресурсы, ПО. http://www.mgua.irtc.org.ua/ru/index.php?page=gmdh Отдел информационных технологий индуктивного моделирования. Краткая характеристика МГУА, публикации по теме. http://ru.wikipedia.org/wiki/Искусственная_Нейронная_Сеть Википедия свободная энциклопедия. Базовые данные о ИНС. 32 http://ru.wikipedia.org/wiki/Искусственная_Нейронная_Сеть 33 Рисунок Б.1 – Print Screen созданной мной статьи о John Neumann 34 Рисунок Б.2 – Print Screen созданной мной статьи о Mikhail Kovalev 35 Рисунок Б.3 – Print Screen созданной мной статьи о Geoffrey Hilton 36 Рисунок Б.4 – Print Screen созданной мной статьи о Yann LeCun 37 Рисунок Б.5 – Print Screen созданной мной статьи о Alexey Ivakhnenko 38 ПРИЛОЖЕНИЕ В Действующий в WWW личный сайт (гиперссылка) и Print Screen главной страницы http://leit4ever.narod2.ru Рисунок В.1 — Print Screen главной страницы 39 ПРИЛОЖЕНИЕ Г Граф научных интересов магистранта Полищук Анны Юрьевны Смежные специальности 08.00.01 Экономическая теория 1. Теория внешних эффектов. 2. Теория информации, неопределенности и риска. 3. Теория деловых циклов и кризисов. 4. Теория экономического роста и экономического развития, их гуманизация и экологизация. 5. Теории международной экономики. 08.00.10 – Финансы, денежное обращение и кредит 1. Финансы инвестиционного процесса, финансовый инструментарий инвестирования. 2. Деньги и денежные системы. 3. Денежное обращение. Основная специальность Сопутствующие специальности 08.00.13 – Математические и инструментальные методы экономики 1. Построение и прикладной экономический анализ экономических и компьютерных моделей национальной экономики и ее секторов. 2. Математическое моделирование экономической конъюнктуры, деловой активности, определение трендов, циклов и тенденций развития. 3. Теория и методология экономикоматематического моделирования, исследование его возможностей и диапазонов применения: теоретические и методологические основы отображения социальноэкономических процессов и систем в виде математических, информационных и компью- 01.01.05 – Теория вероятностей и математическая статистика 1. Статистика случайных процессов, полей и временных рядов. 2. Вероятностностатистическое моделирование. 3. Случайные процессы специального вида, включая процессы массового обслуживания. 40 01.01.09 – Дискретная математика и математическая кибернетика 1. Теоpия функциональных систем 2. Теоpия гpафов 3. Теоpия pасписаний, теоpия очеpедей и массового обслуживания 4. Теоpия и методы минимизации функций 5. Теоpия и методы pешения задач математического пpогpаммиpования терных моделей. 08.00.14 – Мировая экономика 1. Интернационализация, транснационализация производства и капитала. 2. Глобализация экономических отношений. 3. Международные корпорации. 4. Международная экономическая интеграция. 5. Новая мировая экономика, международная сетевая экономика. 6. Глобальные проблемы экономики. 09.00.11 – Социальная философия 1. Власть как социокультурный феномен и формы его проявления в современных обществах. 2. Духовная жизнь общества, формы и уровни ее организации. 3. Культура и ценностный мир человека в традиционных и современных обществах. 19.00.01 – Общая психология, психология личности, история психологии 1. психология смысла; 2. Внутренние конфликты личности; 3. Психоаналитическое направление в исследованиях личности; 41 ПРИЛОЖЕНИЕ Д XML-формат тестовых вопросов по Основам информационных технологий <question type="close" id="067"> <text> Язык HTML был разработан:</text> <answers type="request"> <answer id="313759" right="0"> Эдвардом Фриментом </answer> <answer id="313760" right="1"> Тимом Бернерсом-Ли </answer> <answer id="313761" right="0"> Питером Брайенсом </answer> <answer id="313762" right="0"> Брайаном Олберсом </answer> </answers> </question> <question type="close" id="676"> <text>Искусственные нейронные сети обладают способностью: </text> <answers type="request"> <answer id="313759" right="0"> Обучаться </answer> <answer id="313760" right="0"> Выявлять сложные зависимости между входными и выходными данными </answer> <answer id="313761" right="0"> Выполнять обобщение </answer> <answer id="313762" right="1"> Все вышеперечисленное </answer> </answers> </question> 42 ПРИЛОЖЕНИЕ Е Презентация магистерской диссертации 43 44