Разработка программы распознавания действий человека. Работа с видеопотоком и классификатором. Выделение особенностей и структуры сверточной нейронной сети. Функции активации искусственного нейрона. Выделение контура из изображения и определение движения.
Аннотация к работе
Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования Программа классификации психофизиологической двигательной активности человека, основанная на нейронной сети глубокого обученияДанная работа фокусируется только на действиях человека без учета внешней среды и взаимодействия с окружением, а также на действиях с участием тела человека, что исключает сужения данной работы до задачи распознавания жестов. В EMGUCV для работы с изображениями используется специальный класс Image, где TCOLOR - класс цвета изображении, а TDEPTH - глубина цвета. Библиотека предоставляет разработчику как низкоуровневые функции для работы с данными с датчиков, так и высокоуровневые функции для работы с абстракциями, такими как объекты на изображении. Выделение локальных точек интереса на изображении позволяет абстрагироваться от изображений, тем самым делая выделение объекта на изображении необязательным этапом. В последние два десятилетия глубокие нейронные сети вновь возродили интерес к нейронным сетям, показывая хорошие результаты при решении таких задач, как определение объекта на изображении [37, 38], работа с аудио [14] и других [36].В ВКР разработана программа классификации психофизиологической двигательной активности человека, основанная на нейронной сети глубокого обучения - сверточной нейронной сети. Программа показывает хорошие результаты классификации заданных действий человека - взмахи двумя руками, взмахи правой и левой руки, хлопки руками и прыжки на месте. Kinect SDK предоставляет богатый API для работы с сенсором Kinect, что позволяет без лишних трудностей работать с входными изображениями, накладывая ограничение только на операционную систему и среду разработки.