Обзор основных алгоритмов и методов распознавания лиц. Архитектура средств динамического отслеживания лиц в видеопоследовательности. Результаты тестирования на больших объемах видеоданных. Разработка алгоритмов и методов динамического отслеживания лиц.
Аннотация к работе
Мероприятия по безопасности труда и сохранению работоспособности Обеспечение требований эргономики и технической эстетики Обеспечение оптимальных параметров воздуха рабочих зон 5.4.5 Обеспечение режимов труда и отдыхаОсновной задачей дипломного проекта является разработка алгоритмического обеспечения для динамического отслеживания лиц в видеопоследовательностях. Второй путь заключается в распознавании лица, как объекта, и дальнейшем его отслеживании на всей последовательности кадров.Обучением называется предварительная настройка и задание параметров метода для обнаружения интересующего объекта. Под обучающим цифровым изображением понимается изображение It(h, w) с дополнительной информацией о наличии или отсутствии на нем искомого объекта. На сегодняшний день существуют различные методы обнаружения объектов на цифровом изображении It(h, w): каскадный классификатор Виолы и Джонса, обобщенное преобразование Хафа, метод Капура-Винна и другие. Однако методы обнаружения объекта, имеющие высокие показатели надежности и устойчивости, требуют значительных временных и машинных ресурсов для обучения на новых объектах. Методы обнаружения объекта на цифровом изображении It(h, w), по способу отнесения участка изображения к области интересов Obt(X, Y), можно разделить на две большие группы: обобщающие (generative) и различающие (discriminative).Методы второго класса, наоборот, основываются на группировании сходных векторов из оптического потока в области, которые подаются на выход алгоритма в качестве движущихся объектов. Большинство классических методов анализируют не сами кадры видеопоследовательности, а оптический поток (поле видимых смещений пикселей изображений), построенный по этим кадрам. Для сравнительного анализа построим данные методы на базе широко используемой в компьютерном зрении общедоступной библиотеки OPENCV, содержащей реализации для некоторых шагов исследуемых методов, таких как построение оптического потока, вычисление градиента и поиск контуров, а также простой и удобный интерфейс для работы с камерами и вывод результата на экран. сравнение вектора оптического потока в каждой точке кадра с векторами в соседних точках (сравнение ведется только с точками снизу и справа от текущей точки, поскольку сравнение с точками слева и сверху уже было выполнено при рассмотрении предыдущих точек); Конечно же, например, для метода объединения областей несложно придумать кадры, оптический поток которых имеет шахматный порядок, и анализ таких кадров будет, как минимум, кубической сложности.Высокие требования к ошибке первого рода - система распознавания должна находить изображения соответствующие данному человеку, по возможности не пропустив ни одного такого изображения. Обычно в большой базе данных (104-107 изображений) требуется найти изображения, наиболее похожие на заданное. Для этого можно предложить применение нейронных сетей (НС) для извлечения ключевых признаков изображений и адаптацию НС для сравнения двух изображений. Т.е. эти виды сетей не надо специально обучать на изображениях с различными масштабами объекта, обучившись некоторому изображению один раз, они способны затем распознавать объект на изображении при любых изменениях масштаба. В остальных методах инвариантность к изменениям масштаба достигается на этапе предобработки (приведение к стандартному масштабу), либо в обучающую выборку включаются изображения с различным масштабом.Она используется для решения разнообразных задач связанных с 2D графикой, распознанием лиц и предметов на фото, распознание лиц и предметов на видео и др. AFORGE.NET является основой C # и предназначен для разработчиков и исследователей в области компьютерного зрения и искусственного интеллекта - обработка изображений, нейронные сети, машинное обучение, робототехника и т.д. Структура основывается на AFORGE.NET, предназначена для обработки изображений, используются новые инструменты и библиотеки. в режиме реального времени лицо сравнивается с эталонами «контрольного списка»; В зависимости от конфигурации, Visage Technologies Face Track может отслеживать контур рта, подбородка, контуры бровей, вращение и закрытие глаз.Компания Intel выпускает новый продукт Intel® Perceptual Computing SDK 2013 призванный помочь разработчикам приложений расширить возможности взаимодействия с конечным пользователем. В первой версии продукта уже доступны простые интерфейсы для поддержки: - распознавание лиц;Комплект VERILOOK Surveillance SDK адресован разработчикам биометрического программного обеспечения, реализующего распознавание пользователей по изображениям их лиц, используя видео потоки, полученные с цифровых видеокамер высокого разрешения в режиме реального времени. Этот комплект основан на VERILOOK технологии распознавании пользователей по изображениям их лиц и используется для так называемой пассивной идентификации - то есть, когда проходящие люди не прилагают никаких усилий для их распознавания. К сферам использования данного продукта относятся: правоохранительные органы, охрана, контроль до
План
Оглавление
Введение
Глава 1. Обзор литературы и постановка задачи
1.1.Постановка задачи
1.2. Существующие алгоритмы и методы
1.2.1.Алгоритмы и методы определения объектов в видеопоследовательностях
1.2.2. Алгоритмы и методы динамического отслеживания объектов в видеопоследовательностях
1.2.3. Алгоритмы и методы распознавания лиц
1.3.Существующие программные средства
1.3.1.Emgu CV
1.3.2.AFORGE.NET
1.3.3.Cognitec FACEVACS SDK и FACEVACS VIDEOSCAN
1.3.4. Visage Technologies Face Track
1.3.5.Kinect Face Tracking (Microsoft)
1.3.6.Microsoft Research Face SDK
1.3.7.Intel Perceptual Computing SDK
1.3.8.VERILOOK Surveillance SDK
1.3.9. Signal Processing Toolbox
1.3.10. Wavelet Toolbox
1.3.11. OPENCV
1.4. Вывод по разделу
Глава 2. Разработка алгоритмического обеспечения
2.1. Архитектура средств динамического отслеживания лиц в видеопоследовательности
2.2. Выбор базовых программных средств
2.3. Разработка алгоритмов и методов динамического отслеживания лиц
Глава 3. Экспериментальные результаты54
3.1. Результаты функционального тестирования
3.1.1. Описание тестовых баз лиц
3.1.2. Результаты тестирования алгоритма идентификации лиц
3.1.3. Результаты тестирования алгоритма поиска лиц на изображениях
3.1.4.Результаты тестирования. Отслеживание лиц в видеопоследовательности.
3.1.5. Распознавание лиц в видеопоследовательности
3.2. Результаты тестирования на больших объемах видеоданных
3.3. Выводы по разделу
Глава 4. Организационно-экономическая часть
4.1. Технико-экономическое обоснование объекта проектирования
4.2. Состав конструкторской группы и их должностные оклады
4.3. Перечень работ, выполняемых в процессе разработки алгоритма динамического отслеживания лиц и программной документации
4.4. Расчет сметы затрат на разработку алгоритмического обеспечения комплекса программных средств для динамического отслеживания лиц
4.4.1. Смета затрат на основные и вспомогательные материалы
4.4.2. Расчет заработной платы инженерно-технических работников
4.4.3. Расчет страховых взносов
4.4.4. Прочие денежные расходы
4.4.5. Смета затрат
4.5. Вывод по разделу
Глава 5. Безопасность и экологичность проектных решений
5.1. Цель и решаемые задачи
5.2. Опасные и вредные факторы при работе с ПЭВМ
Список литературы
Введение
На данный момент проблеме распознавания человека по изображению лица посвящено множество работ, однако в целом она еще далека от разрешения. Основные трудности состоят в том, чтобы распознать человека по изображению лица независимо от изменения ракурса и условий освещенности при съемке, а так же при различных изменениях, связанных с возрастом, прической и т.д. Распознавание изображений пересекается с распознаванием образов. Такие задачи не имеют точного аналитического решения. При этом требуется выделение ключевых признаков, характеризующих зрительный образ, определение относительной важности признаков путем выбора их весовых коэффициентов и учет взаимосвязей между признаками. Изначально эти задачи выполнялись человеком-экспертом вручную, путем экспериментов, что занимало много времени и не гарантировало качества. В новых методах выделение ключевых признаков осуществляется путем автоматического анализа обучающей выборки, но, тем не менее, большинство информации о признаках задается вручную. Для автоматического применения таких анализаторов выборка должна быть достаточно большой и охватывать все возможные ситуации.
Существует два класса методов: методы распознавания и отслеживания лиц и методы распознавания и отслеживания объектов.
У каждого из методов есть свои преимущества и недостатки. Методы распознавания и отслеживания объектов, в частности, удобны тем, что позволяют разпознать человека при разных углах его поворота относительно камеры, например, боком или спиной.
Распознавание человека по изображению лица выделяется среди биометрических систем тем, что, во-первых, не требуется специальное или дорогостоящее оборудование. Для большинства приложений достаточно персонального компьютера и обычной видеокамеры. Во-вторых, не нужен физический контакт с устройствами. Не надо ни к чему прикасаться или специально останавливаться и ждать срабатывания системы. В большинстве случаев достаточно просто пройти мимо или задержаться перед камерой на небольшое время. К недостаткам распознавания человека по изображению лица следует отнести то, что сама по себе такая система не обеспечивает 100%-ой надежности идентификации. Там, где требуется высокая надежность, применяют комбинирование нескольких биометрических методов.
В настоящее время активно развиваются биометрические технологии.
Их целью является разработка автоматизированных систем идентификации человека на основе биометрических признаков: отпечатков пальцев, характеристик голоса и речи, рисунка радужной оболочки глаза, изображения лица. Это связано с тем фактом, что на данный момент основным препятствием для дальнейшего развития информационных сред, различного рода виртуальных сервисов и т.п. является проблема надежной идентификации (верификации) пользователя. Ожидается, что применение подобных систем существенно уменьшит количество преступлений, связанных с несанкционированным доступом, в том числе и в компьютерных сетях, причем именно технология идентификации человека на основе изображений лиц признана наиболее приемлемой для массового применения, так как она не требует физического контакта с устройством, ненавязчива, естественна и, в потенциале, может обладать высокой надежностью и скоростью. Поиск в базах данных по фотопортретам человека, автоматизированный контроль удостоверений личности особенно актуальны для правоохранительных органов большинства стран в контексте увеличения количества террористических актов и уголовных преступлений на фоне повышения общей мобильности населения.[1]