УДК 004.032.26 Радионова Юлия Викторовна студент группы АПМ-09-2, Химико-металлургический факультет

advertisement
УДК 004.032.26
Радионова Юлия Викторовна
студент группы АПМ-09-2,
Химико-металлургический факультет
Научный руководитель: Певнева Анна Геннадьевна
доц., к.т.н.
кафедра Информатики и компьютерных технологий
Санкт-Петербургский государственный горный институт
г. Санкт-Петербург
НЕЙРОННЫЕ СЕТИ, ИХ СУЩНОСТЬ, СФЕРА ПРИМЕНЕНИЯ И
РЕАЛИЗАЦИЯ
NEURAL NETWORKS, THEIR ESSENCE, SCOPE OF APPLICATION
AND REALIZATION
Методы нейронных сетей получают все большее распространение в
самых различных областях, начиная от фундаментальных исследований и
заканчивая задачами синтеза данных, прогнозирования в различных
сферах человеческой деятельности, управления рисками, инженерными
приложениями и многих других областях [1]. Этот метод во многом хорош
для выведения наиболее продуктивного результата при большом
количестве исходных данных.
При рассмотрении нейронных сетей нужно представлять, что
нейронная сеть - это одно из направлений исследований в области
искусственного интеллекта, основанное на попытках воспроизвести
нервную систему человека. Это понятие
возникло при изучении
процессов, протекающих в человеческом мозге, при попытке
смоделировать эти процессы и обеспечить их обучаемость [2]. Модель
нейронных сетей также сконструирована на основе структуры и
функциональности человеческих нейронов, что позволяет представить
саму нейронную сеть как набор нейронов, соединенных между собой. Где,
как правило, передаточные функции всех нейронов в нейронной сети
фиксированы, а веса являются параметрами нейронной сети и могут
изменяться. На рис. 1 представлена модель нейрона с тремя входами,
некоторые из которых помечены как внешние входы нейронной сети, а
некоторые выходы - как внешние выходы. Подавая любые числа на входы
нейронной сети, мы получаем какой-то набор чисел на выходах.
76
Рис. 1.
Таким образом, работа нейронной сети состоит в преобразовании
входного вектора в выходной, причем это преобразование задаётся весами
нейронной сети.
Представим нейронную сеть как взвешенный ориентированный граф.
Узлы в этом графе соответствуют нейронам, а ребра — связям между
нейронами. С каждой связью ассоциирован вес (рациональное число) —
который отображает оценку возбуждающего или тормозящего сигнала,
передаваемого по этой связи на вход нейрона-реципиента, когда нейронпередатчик возбуждается. Наиболее подробно это можно представить с
помощью структурной модели нейрона. Учитываем, что Х1, Х2, Х3входные сигналы, причем связи этих входов имеют определённые веса w1,
w2, w3. Сила выходного импульса равна y = f(x) = f(w1x1 + w2x2 + w3x3).
Таким образом, нейрон полностью описывается своими весами wk и
передаточной функцией f(x). Получив набор чисел (вектор) x k в качестве
входов, нейрон выдает некоторое число y на выходе, то есть реализуем
задачу оптимизации.
Большим преимуществом данного метода является его обучаемость.
Обучить нейронную сеть – означает, сообщить ей, чего мы от нее
добиваемся. Этот процесс очень похож на обучение ребенка алфавиту.
Показав ребенку изображение буквы "А", мы спрашиваем его: "Какая это
буква?" Если ответ неверен, мы сообщаем ребенку тот ответ, который мы
хотели бы от него получить: "Это буква А". Ребенок запоминает этот
пример вместе с верным ответом, то есть в его памяти происходят
некоторые изменения в нужном направлении. Мы будем повторять
процесс предъявления букв снова и снова до тех пор, когда все 33 буквы
будут твердо запомнены. Такой процесс называют "обучение с учителем"
[3]. При обучении нейронной сети мы действуем совершенно аналогично.
После многократного предъявления примеров веса нейронной сети
стабилизируются, причем нейронная сеть дает правильные ответы на все
(или почти все) примеры из базы данных. В таком случае говорят, что
"нейронная сеть выучила все примеры", "нейронная сеть обучена". В
77
программных реализациях можно видеть, что в процессе обучения
величина ошибки (сумма квадратов ошибок по всем выходам) постепенно
уменьшается. Когда величина ошибки достигает нуля или приемлемого
малого уровня, тренировку останавливают, а полученную нейронную сеть
считают натренированной и готовой к применению на новых данных.
Обучение нейронных сетей - сложный и наукоемкий процесс. Алгоритмы
обучения нейронных сетей имеют различные параметры и настройки, для
управления которыми требуется понимание их влияния.
Для реализации нейронных сетей используется программа Deductor.
Скачав демонстрационную бесплатную версию этой программы,
предложенную компанией Base Group можно изучить каким образом
происходит решение задач c применением нейронных сетей в Deductor.
Deductor – это технологическая платформа для создания законченных
аналитических решений. В нем сосредоточены самые современные методы
извлечения, манипулирования, визуализации данных, кластеризации,
прогнозирования и многие другие технологии интеллектуального анализа
данных. Реализованные в Deductor технологии позволяют на базе единой
архитектуры пройти все этапы построения аналитической системы: от
создания хранилища данных до автоматического подбора моделей и
визуализации полученных результатов. Особенностью является то, что
интерфейс Deductor во многом напоминает интерфейс Excel, что позволяет
легко ориентироваться в новой программе. На рис. 2 изображен интерфейс
программы Deductor.
Рис. 2.
Реализованные в Deductor технологии могут использоваться как в
комплексе, так и по отдельности для решения широкого спектра проблем.
78
Мастер обработки программы позволяет сконструировать нейронную сеть
с заданной структурой, определить ее параметры и обучить с помощью
одного из доступных в системе алгоритмов обучения. В результате будет
получен эмулятор нейронной сети, который может быть использован для
решения задач прогнозирования, классификации, поиска скрытых
закономерностей, сжатия данных и многих других целей.
В платформе Deductor рассматривается пример «Выявление
особенностей регионов», учитывая, что в качестве обучающего набора
данных выступает база данных, содержащая информацию о регионах.
Целью работы является анализ базы данных содержащий
информацию о различных характеристиках регионов: экологоэкономические, социально-экономические, эколого-географические и
демографические факторы. Все факторы изначально разбиваются на
кластеры.
Эколого-экономический кластер включает в себя характеристики
предприятий горно-добывающей промышленности, цветной и чёрной
металлургии, атомной отрасли в зависимости от интенсивности их
производства и объем выбросов в атмосферу.
Социально-экономический кластер объединяет следующие факторы:
размер среднедушевого дохода, размер заработной платы и пенсии,
отношение размера заработной платы к величине прожиточного
минимума, объем валового внутреннего продукта.
Эколого-географический кластер включает в себя принадлежность к
определённой климатической зоне, площадь региона, физикогеографические условия: низкие температуры воздуха, недостаточный
уровень солнечной радиации, многолетняя мерзлота, повышенная
сейсмичность территории, ее заболоченность, обводненность грунтов, их
слабая несущая поверхность, сильные холодные ветры, слабая
устойчивость территории к техногенному воздействию, плохая
проходимость местности.
К демографическим факторам относятся: уровень рождаемости,
уровень младенческой смертности, доля населения с величиной дохода
ниже прожиточного минимума, уровень зарегистрированной безработицы,
приблизительный уровень фактической безработицы, ожидаемая
продолжительность жизни мужчин, ожидаемая продолжительность жизни
женщин, средняя ожидаемая продолжительность жизни, плотность
населения, отношение среднего размера пенсий к величине прожиточного
минимума.
Для анализа базы данных и кластеризации факторов применяются
аппарат нейронных сетей, в частности персептрон и сеть Кохонена –
компьютерные модели нейронных сетей. Эти модели реализованы в уже
упомянутом программном комплексе Deductor Academic. В ходе работы
выявляются неочевидные взаимозависимости между факторами, например,
зависимость фактической безработицы от физико-географических условий
79
или ожидаемая продолжительность жизни мужчин и женщин от
интенсивности производства. Кроме того выявляются взаимовлияния
внутри каждого кластера, например, влияние особенностей производства
и объёмов выбросов в атмосферу. На основе полученных данных можно
построить модель, которая сможет дать наглядное представление о
выявленных зависимостях.
Общую структуру реализации нейронной сети в программе Deductor
можно представить в виде трёх этапов.
Первый этап – «Мастер обработки данных», где выбирается метод
обработки – «Нейросеть», а также настраиваются назначения столбцов,
задав входные и выходные столбцы.
Второй этап – «Разбиение данных и настройка обучения сети». Здесь
назначается разбиение исходного набора данных на тестовое и обучающее
множество, задаются структура сети, количество нейронов в слоях и вид
активационной функции, выбираются алгоритм и параметры обучения, а
также критерии расстановки обучения.
Третий
этап – «Настройка обучения сети», где запускается
непосредственно процесс обучения сети и отображается результат в виде
таблицы сопряженности. На рис. 3 представлен этап настройки процесса
обучения нейронной сети.
Рис. 3
Deductor предоставляет аналитикам инструментальные средства,
необходимые для решения самых разнообразных аналитических задач:
корпоративная отчетность, прогнозирование, сегментация, поиск
закономерностей. Deductor является идеальной платформой для создания
систем поддержки принятия решений.
80
Можно отметить, что на сегодняшний день нейронные сети являются
одним из приоритетных направлений исследований в области
искусственного интеллекта.
Литература
1. Электронный учебник по промышленной статике. – М.: StatSoft.
2001.
–
[Электронный
источник]
–
режим
доступа:
http://www.statsoft.ru/home/textbook/modules/stneunet.html
2. Саймон Хайкин. Нейронные сети. – М.: Вильямс, 2006.
3. Круглов В.В., Борисов В.В. Искусственные нейронные сети.
Теория и практика. – М.: Горячая Линия – Телеком, 2001.
Аннотация
В ходе разнообразных исследований есть необходимость обработки
большого количества информации с целью выявления различных
тенденций и наиболее благоприятных вариантов развития. Изучая
системы принятия решений, автором была выявлена эффективность
применения нейронных сетей для анализа процессов, так как работа
нейронной сети имитирует работу человеческого мозга. При мониторинге
информационных систем была исследована платформа «Deductor»,
содержащая модуль реализации нейронных сетей. На основе этой
программы автором была рассмотрена задача о выявлении неявных
особенностей регионов. Для анализа базы данных и кластеризации
факторов применены аппарат нейронных сетей, в частности персептрон и
сеть Кохонена - компьютерные модели нейронных сетей. Эти модели были
реализованы в программном комплексе Deductor Academic. Преимущество
программы – высокая информационная гибкость и возможность
конвертирования различных форматов.
During various researches there is a necessity of processing of a
considerable
quantity of the information for the purpose of revealing of various tendencies
and optimum variants of development. Studying decision-making systems, the
author had been revealed efficiency of application of neural networks for the
analysis of processes as work of a neural network simulates work of a human
brain. At monitoring of information systems the platform «Deductor»,
containing the module of realization of neural networks has been investigated.
On the basis of this program the author had been considered a problem about
revealing of implicit features of regions. To the analysis of a database and
clustering factors are applied the device of neural networks, in particular
perceptron and a network of Kohonen - computer models of neural networks.
These models have been realized in program complex Deductor Academic.
Advantage of the program – high information flexibility and possibility of
converting of various formats.
81
Ключевые слова
искусственный интеллект,
нейронные сети,
анализ процессов,
кластеризация
neural networks, artificial intelligence, the analysis of processes, clustering
82
Download