Основные классы задач в распознавании человека по изображению лица. Поиск изображения в больших базах данных, задача контроля доступа. Нейросетевые методы распознавания человека по изображению лица. Архитектура нейронных сетей, разработка алгоритма.
Аннотация к работе
Компьютерное зрение - вид деятельности, в которой для извлечения данных применяются статистические методы и используются модели, построенные с помощью геометрии, физики и теории обучения. Компьютерное зрение применяется довольно широко как в относительно старых областях (например, управление мобильными роботами, военные приложения, промышленные средства наблюдения), так и в сравнительно новых (взаимодействие человек/компьютер, поиск изображения в библиотеках, анализ медицинских изображений и реалистичная передача смоделированных сцен в компьютерной графике). Например, такой аспект компьютерного зрения, как определение структуры по движению, позволяет из серии изображений получить представление о том, как движется камера и что изображено на рисунке. В этом случае сведения об области, где используется робот, обычно не представляют значительного интереса, важно лишь нахождение робота в этой области. Это, например, работа с медицинскими изображениями: создание программных систем, которые могут улучшать набор изображений, выявлять на них важные моменты или события либо визуализировать информацию, полученную из изображений.В отличие от них биометрические системы основываются на уникальных биологических характеристиках человека, которые трудно подделать и которые однозначно определяют конкретного человека. Распознавание человека по изображению лица выделяется среди биометрических систем тем, что, во-первых, не требует специального дорогостоящего оборудования. К недостаткам распознавания человека по изображению лица следует отнести то, что сама по себе такая система не обеспечивает 100%-ной надежности идентификации. Основные трудности состоят в том, чтобы распознать человека по изображению лица независимо от изменения ракурса и условий освещенности при съемке, а также при различных изменениях, связанных с возрастом, прической и т.д. В данной работе исследованы методы распознавания человека по изображению лица и возможности использования их совместно с нейросетевыми методами: дан обзор нейросетевых методов распознавания изображений и их применения к распознаванию человека по изображению лица, описаны различные способы представления изображения и учета его свойств.Высокие требования к ошибке первого рода - распознавания система должна находить изображения, соответствующие данному человеку, по возможности не пропустив ни одного такого изображения. Обычно в большой базе данных (10?-10?изображений) требуется найти изображения, наиболее похожие на заданное. Одно из решений состоит в хранении в базе данных небольших наборов заранее извлеченных ключевых признаков, максимально характеризующих изображение.Система распознавания не должна распознавать незнакомых людей как знакомых, возможно даже за счет увеличения ошибок первого рода (отказов в доступе знакомым людям). Имеется небольшая группа лиц (5-50 человек), которых система должна распознавать по изображению лица и открывать им доступ в некоторое помещение. Людей, не входящих в эту группу, система не должна пропускать. При этом от системы требуется высокая достоверность распознавания, возможно даже за счет увеличения числа отказов на знакомые объекты.Формулировать требования к ошибкам первого и второго рода как к системе верификации или распознавания здесь будет некорректно, поскольку система распознавания никогда не имела дело с поступающими на вход классами. Но желательно, чтобы система не совершала ошибок при сравнении. Требуется сравнить изображение лица человека, полученное в данный момент, с фотографией из какого-либо документа.Нейросетевые методы, основанные на применении различных типов искусственных нейронных сетей (ИНС, в дальнейшем просто нейронные сети, НС), в последнее время получили широкое распространение. Основные задачи, решаемые при помощи нейронных сетей: · Разбиение пространства признаков на области, соответствующие классам (классификация, распознавание, кластеризация); Основные преимущества, которыми обладают нейронные сети, следующие. Таким образом, не требуется вручную определять параметры модели (выбирать ключевые признаки, учитывать их взаимоотношение и т.п.) - НС извлекает параметры модели автоматически наилучшим образом в процессе обучения. В задачах классификации при этом происходит неявное выделение ключевых признаков внутри сети, определение значимости признаков и системы взаимоотношений между ними.Здесь х?. xn - значения, поступающие на входы (синапсы) нейрона, W1. Wn - веса синапсов (могут быть как тормозящими, так и усиливающими), S - взвешенная сумма входных сигналов: IMG_c32b2147-b3ad-4952-90b9-a3c90058da22 где T - порог нейрона (во многих моделях обходятся без него), F - функция активации нейрона, преобразующая взвешенную сумму в выходной сигнал IMG_3f9bdce1-c476-47c9-af0d-2550d8a8e305 . Взвешенная сумма входных сигналов может быть интерпретирована как проекция входного вектора на вектор весов, где ? - угол между этими векторами. Искусственные нейронные сети способны выполнять любые логические операции и вообще любые преобразования, реа
План
Оглавление
Введение
1. Аналитическая часть
1.1 Основные классы решаемых задач в распознавании человека по изображению лица
1.1.1 Поиск изображения в больших базах данных
1.1.2 Задача контроля доступа
1.1.3 Задача контроля фотографии в документах
1.2 Нейросетевые методы распознавания человека по изображению лица
2. Конструкторская часть
2.1 Архитектура нейронных сетей
2.2 Разделение пространства признаков на области и извлечение ключевых признаков
2.2.1 Многослойные нейронные сети
2.2.2 Нейронные сети высокого порядка и моментные НС
2.2.3 Радиально-базисные нейронные сети
2.3 Распознавание с учетом топологии пространства
2.3.1 Когнитрон
2.3.2 Неокогнитрон
2.3.3 Сверточные нейронные сети
3. Технологическая часть
3.1 Алгоритм
3.2 Результаты
3.2.1 Архитектура и обучение
3.3 Руководство пользователя
Заключение
Список литературы
Приложение
Введение
Компьютерное зрение - вид деятельности, в которой для извлечения данных применяются статистические методы и используются модели, построенные с помощью геометрии, физики и теории обучения. Компьютерное зрение применяется довольно широко как в относительно старых областях (например, управление мобильными роботами, военные приложения, промышленные средства наблюдения), так и в сравнительно новых (взаимодействие человек/компьютер, поиск изображения в библиотеках, анализ медицинских изображений и реалистичная передача смоделированных сцен в компьютерной графике).
Отличительная черта компьютерного зрения - это извлечение описаний из изображений или последовательности изображений. Например, такой аспект компьютерного зрения, как определение структуры по движению, позволяет из серии изображений получить представление о том, как движется камера и что изображено на рисунке. В индустрии развлечений подобные методы применяются для отсеивания движения и построения трехмерных компьютерных моделей здания с сохранением структуры. С помощью небольшого числа фотографий можно получить хорошие, простые, точные и удобные модели. Рассмотрим другую ситуацию: люди, желающие контролировать работу мобильных роботов. В этом случае сведения об области, где используется робот, обычно не представляют значительного интереса, важно лишь нахождение робота в этой области. Таким образом, здесь отсеивается информация о структуре и отслеживается движение, что позволяет определить точное местонахождение робота.
Есть еще целый ряд других важных областей применения компьютерного зрения. Это, например, работа с медицинскими изображениями: создание программных систем, которые могут улучшать набор изображений, выявлять на них важные моменты или события либо визуализировать информацию, полученную из изображений. Другая важная область - различные технические проверки, когда по изображениям объектов определяется, соответствуют ли объекты спецификации. Третья сфера применения компьютерного зрения - интерпретация фотографий, сделанных со спутника, как в военных целях, так и в гражданских. Четвертая область - это упорядочение и структурирование коллекций картин. Обработка библиотек статических или движущихся изображений на сегодняшний день имеет ряд серьезных, нерешенных вопросов.
Компьютерное зрение сейчас находится в особой точке своего развития. Только сравнительно недавно появилась возможность создания практичных программ, использующих идеи компьютерного зрения. Быстродействие современных цифровых устройств и возможность параллельных вычислений делают возможной реализации многих алгоритмов работы с библиотеками цифровых изображений. Таким образом, проводить серьезные исследования и решать многие повседневные задачи (например, упорядочить коллекцию фотографий, создать трехмерную модель окружающего мира, управлять и вносить изменения в коллекцию видеозаписей) теперь можно с помощью методов компьютерного зрения.