Нейросетевые технологии распознавания пиксельных изображений Мальчевский Михаил Андреевич, 545 группа Научный руководитель: д.т.н., проф. А.В. Тимофеев Рецензент: д.ф.-м.н., проф. Т.М. Косовская Введение Распознавание изображений ◦ ◦ ◦ ◦ Номера автомобилей Дорожные знаки Рукописный текст Стерео- и мультизрение Традиционные проблемы и подходы ◦ Проблема - размерность задачи ◦ Решение - фильтр + классификатор Постановка задачи Разработка системы для построения нейросетевых распознавателей Алгоритмы ускорения обучение Алгоритмы повышения качества распознавания Построение классификатора Описание работы Ускорение обучения ◦ Последовательный и пакетный режимы ◦ Подсчет Гессиана ◦ Обучение с моментом Повышение качества распознавания ◦ Применение эластичных искажений (размытие, поворот, масштабирование) к изображениям Отличия от прочих систем Ориентированность на распознавание изображений Решение разных задач классификации изображений Возможность расширения системы Тестирование База рукописных цифр MNIST ◦ 60000 + 10000 изображений ◦ 28х28 в градациях серого Результаты, сравнимые с лучшими (<1% несовпадений) Время распознавания – доли секунды, время обучения ~ 8 часов Итоги Реализована система для построения распознавателей Изучены и внедрены необходимые алгоритмы Система протестирована на реальных данных