Нейронные сети. Классификатор.

advertisement
Нейронные сети.
Классификатор.
Основные понятия
Рисунок 1. Математическая
модель нейрона
X –Входы, группа синапсов
W-Вес синаптической связи
S -Текущее состояние нейрона,
определяется взвешенная сумма его входов
Y-Выход нейрона, определяется функцией
активации F(S)
Рисунок 2. Функция активации
Постановка Задачи
На базе программно-аппаратного комплекса OpenTS-СКИФ
построить нейронную сеть – классификатор.
Сеть распознает представленные ей образы, например
графические файлы с изображением цифр.
1
2
3
Реализация
Гранула
параллелизма
Рисунок 3. Однослойный персептрон
Гранула параллелизма группа из Np нейронов
Np=N/Nproc, где
N-общее количество нейронов
Nproc – количество процессоров в системе
Проблемы реализации и их решение
Проблемы:
1. Большой объем передачи данных
2. Малая вычислительная сложность гранул параллелизма
Решение:
1.1. Первоначальная загрузка весовых коэффициентов
1.2. Выбор размерности типа данных изображения
2.1. Выделение гранул параллелизма с большим количеством нейронов
2.2. Выбор функции активации (если требуется)
Результаты
Вычислительная сложность:
jMax –количество аксонов (входов)
jMax –количество нейронов (выходов)
Ncpu –количество процессоров
N –количество нейронов в грануле параллелизма
Последовательный вариант:
Параллельный вариант:
Количество вычислительных операций:
Количество вычислительных операций:
сложение
iMax*jMax
сложение
iMax*N
умножение
iMax*jMax
умножение
iMax*N
функция активации iMax*jMax
функция активации iMax*N
время выполнение операции: V
время выполнение операции: V
Итого: 3*V* iMax*jMax
Количество операций пересылки данных:
iMax+N+iMax*N
время выполнение операции: 10V
Итого: 3*V*iMax*N+10V(iMax+N+iMax*N)
Результаты
Расчетная вычислительная сложность:
jMax –количество аксонов (входов)
100
jMax –количество нейронов (выходов) 1000
Ncpu –количество процессоров
10
Последовательный вариант:
Параллельный вариант:
Время выполнения 400 000 тактов
Время выполнения с загрузкой весовых коэфицентов 95 000
Увеличение скорости в 4.21
Время выполнения без загрузки весовых коэфицентов 1250
Увеличение скорости в 8
Download