Malchevskiy_slides

реклама
Нейросетевые технологии
распознавания пиксельных
изображений
Мальчевский Михаил Андреевич, 545 группа
Научный руководитель: д.т.н., проф. А.В. Тимофеев
Рецензент: д.ф.-м.н., проф. Т.М. Косовская
Введение

Распознавание изображений
◦
◦
◦
◦

Номера автомобилей
Дорожные знаки
Рукописный текст
Стерео- и мультизрение
Традиционные проблемы и подходы
◦ Проблема - размерность задачи
◦ Решение - фильтр + классификатор
Постановка задачи
Разработка системы для построения
нейросетевых распознавателей
 Алгоритмы ускорения обучение
 Алгоритмы повышения качества
распознавания

Построение классификатора
Описание работы

Ускорение обучения
◦ Последовательный и пакетный режимы
◦ Подсчет Гессиана
◦ Обучение с моментом

Повышение качества распознавания
◦ Применение эластичных искажений
(размытие, поворот, масштабирование) к
изображениям
Отличия от прочих систем
Ориентированность на распознавание
изображений
 Решение разных задач классификации
изображений
 Возможность расширения системы

Тестирование

База рукописных цифр MNIST
◦ 60000 + 10000 изображений
◦ 28х28 в градациях серого
Результаты, сравнимые с лучшими
(<1% несовпадений)
 Время распознавания – доли секунды,
время обучения ~ 8 часов

Итоги
Реализована система для построения
распознавателей
 Изучены и внедрены необходимые
алгоритмы
 Система протестирована на реальных
данных

Скачать