Использование машинного зрения для управления компьютером

advertisement
Секция: Информатика
Название учебного заведения, от которого представлена работа: ГБОУ Московский городской
Дворец детского (юношеского) творчества (ГБОУ МГДД(Ю)Т)
Проект: «Использование машинного зрения для управления компьютером»
Автор: Спасенкин Евгений
Класс:11
Научный руководитель: Лёвин Константин Михайлович, педагог дополнительного образования
ГБОУ МГДД(Ю)Т
Использование машинного зрения для управления компьютером
Цель работы.
1. Разработать алгоритм, который способен:
a.
Определить направление взгляда пользователя по видеоизображению с камеры
b. Переместить курсор в точку экрана, куда предположительно смотрит человек;
2. Создать программу, реализующую данный алгоритм;
3. Оптимизировать данный алгоритм для работы в режиме реального времени.
Существуют аналоги, например программа EnableViacam (eViacam), заменяющая
использование компьютерной мыши на управление при помощи движений головы пользователя,
отслеживаемых обычной веб-камерой. Недостатки: постоянное движение головой через
некоторое время доставляет дискомфорт, трудно осуществляется перемещение курсора в
крайние части экрана, невозможно использование при болезнях шеи, головы.
Основным назначением разрабатываемой программы (по сравнению с аналогами) является
разработка бесплатной программы с открытым кодом, не требующей дополнительного
периферийного оборудования (кроме веб-камеры).
Описание работы:
Для создания программы выбран язык программирования C++ и открытая библиотека
машинного зрения OpenCV. Для работы программы необходима web- камера.
Программа использует различные математические алгоритмы распознавания образов,
реализованные в библиотеке OpenCV. Они позволяют покадрово обрабатывать видеопоток,
осуществлять распознавание лиц, глаз и зрачков.
Программа «Использование машинного зрения для управления компьютером» определяет
степень отклонения центра зрачка от центра глаза и просчитывает направление взгляда
пользователя. В дальнейшем, можно осуществлять перемещение курсора в нужное место экрана.
Реализован алгоритм, который работает следующим образом:
1.
2.
3.
4.
5.
На видео, получаемом в режиме реального времени с web- камеры, определяется лицо;
Выделяется верхняя половина лица (конструируется новое изображение);
На полученном изображении определяются глаза и зрачки;
Вычисляются координаты центров полученных объектов;
Определяется смещение центра зрачка относительно центра глаза, и определяется
направление взгляда.
Сценарии применения:
1. Альтернатива классическим манипуляторам – клавиатуре и мыши. Поможет людям с
ограниченными физическими способностями.
2. На основе алгоритма можно создать систему помощи водителю. Она будет реагировать, если
водитель надолго отвлекается от дороги.
Основные отличия данной работы от аналогов:
● Простота конструкции (для использования необходима только web- камера)
● Низкая стоимость проекта (при сохранении всех функциональных особенностей работ
данного типа).
Результаты работы:
В итоге проделанной работы получена программа, позволяющая:
1) Распознавать образы (лицо, глаза, зрачки);
2) Отслеживать перемещение взгляда;
3) Управлять курсором без стандартных манипуляторов.
Download