Нейросетевые технологии как средства организации обработки изображений (на примере идентификации лица человека) - Дипломная работа

бесплатно 0
4.5 209
Анализ существующих методов решения задачи распознавания человеческих лиц. Обнаружение местоположения лица на изображении методом цветового сегментирования. Моделирование процесса обучения искусственной нейронной сети на языке программирования C .


Аннотация к работе
Теория распознавания образов - раздел кибернетики, развивающий теоретические основы и методы классификации и идентификации предметов, явлений, процессов, сигналов, ситуаций и т. п. объектов, которые характеризуются конечным набором некоторых свойств и признаков. Такие задачи решаются довольно часто, например, при переходе или проезде улицы по сигналам светофора. В процессе биологической эволюции многие животные с помощью зрительного и слухового аппарата решили задачи распознавания образов достаточно хорошо. Необходимость в таком распознавании возникает в самых разных областях - от военного дела и систем безопасности до оцифровки всевозможных аналоговых сигналов. Можно выделить два основных направления: · Изучение способностей к распознаванию, которыми обладают живые существа, объяснение и моделирование их;Можно придумать много вариантов постановки задачи распознавания лиц. Предположим, что имеется некоторая тренировочная коллекция, состоящая из 400 фотографий (по 10 фотографий для 40 людей при разных условиях). Тогда задачу распознавания лиц можно сформулировать следующим образом. Необходимо выдать один из следующих ответов: · Изображение не является лицом При всем многообразии различных алгоритмов и методов распознавания изображений, типичный метод распознавания состоит из трех компонент, рис.Выбор первых M главных компонент разбивает векторное пространство на главное (собственное) пространство , содержащее главные компоненты, и его ортогональное дополнение (рис. Собственные вектора, вычисленные для всего набора изображений лиц, называются собственными лицами (eigenfaces). Собственные лица имеют полезное свойство, заключающееся в том, что изображение, соответствующее каждому такому вектору имеет лицеподобную форму, рис. DIFS - distance in feature space, расстояние в собственном пространстве, DFFS - distance from feature space, расстояние до проекции в собственном пространстве; б) типичный спектр собственных чисел и его разбиение на два ортогональных подпространства С помощью вычисленных ранее матриц входное изображение разлагается на набор линейных коэффициентов, называемых главными компонентами.При несоблюдении этих условий главные компоненты не будут отражать межклассовые вариации, и классы перестают представлять собой кластеры в собственном пространстве. Например, при различных условиях освещенности, метод собственных лиц практически неприменим, поскольку первые главные компоненты преимущественно отражают изменения освещения, и сравнение выдает изображения, имеющие похожий уровень освещенности. Линейный дискриминантный анализ (линейный дискриминант Фишера, Linear Discriminant Analysis, LDA), который описывается ниже, выбирают проекцию пространства изображений на пространство признаков таким образом, чтобы минимизировать внутриклассовое и максимизировать межклассовое расстояние в пространстве признаков, рис 1.5. Как можно увидеть из рисунка, в этом случае проецирование на собственное пространство смешивает классы, что делает распознавание невозможным, а линейный дискриминант выбирает проекцию на пространство признаков таким образом, чтобы разделить разные классы. Поскольку работа непосредственно с матрицей затруднительна изза ее размерности, используют предварительное уменьшение размерности с помощью метода главных компонент, и затем вычисления производятся в пространстве меньшей размерности: где Wpca - матрица для проецирования в пространство меньшей размерности (пространство главных компонент).Контуры обычно извлекаются для линий головы, ушей, губ, носа, бровей и глаз. Контуры представлены ключевыми позициями, между которыми положение точек, принадлежащих контуру вычисляются интерполированием. Для локализации контуров в различных методах используется как априорная информация, так и информация полученная в результате анализа тренировочного набора. Затем извлекалась информация об интенсивности пикселей, лежащих на линии, перпендикулярной контуру для каждой точки контура. Таким образом, извлекался не просто контур, а контур черт лица.В этом методе лицо представляется в виде графа, вершины которого расположены на ключевых точках лица, таких как контуры головы, губ, носы и их крайних точках, рис. В каждой такой точке вычисляются коэффициенты Габоровых функций для пяти различных частот и восьми ориентаций. Каждый коэффициент для точек из одной области различных изображений, характеризуется амплитудой , которая медленно меняется с изменением положения точки и фазой , которая вращается со скоростью, пропорциональной частоте волнового вектора базисного вейвлета. Кроме того, чтобы для одного и того же лица представить различные вариации его изображения в одном и том же графе, для каждой точки используются несколько джетов, каждый из которых может соответствовать различным локальным характеристикам данной точки, например открытому и закрытому глазу. Процесс распознавания неизвестного лица состоит в сравнении графа изображения лица со всеми остальными графами из набора при помощи функции подобия: Левая сумма харак

План
Оглавление

Введение

I. Исследование методов обработки изображений для решения задачи распознавания человеческих лиц

1.1 Исследование и формирования задачи распознавания человеческих лиц

1.2 Сравнительный анализ методов распознавания человеческих лиц

1.2.1 Метод главных компонент

1.2.2 Линейный дискриминантный анализ

1.2.3 Гибкие контурные модели лица

1.2.4 Сравнение эластичных графов

1.2.5 Методы, основанные на геометрических характеристиках лица

1.2.6 Скрытые Марковские модели

1.3 Нейросетевые технологии решения задачи распознавания изображений

1.4 Обучение нейронных сетей

1.5 Нейронные сети обратного распространения

1.6 Цель и задачи выпускной квалификационной работы

Выводы по главе I

II. Разработка распознающей модели системы распознавания лиц на основе нейросетевых технологий

2.1 Предварительная обработка изображения

2.2 Решения задачи обнаружения человеческого лица

2.3 Формирования признакового пространства с извлечением ключевых характеристик изображения

2.4 Построение нейросетевого классификатора для решения задачи распознавания лиц

Выводы по главе II

III. Разработка программного обеспечения распознающей модели человеческих лиц

3.1 Описание выбранного инструментария

3.2 Руководство программиста

3.3 Руководство пользователя

Выводы по главе III

IV. Безопасность жизнедеятельности

4.1 Влияние метеорологических условий производственной среды на организм человека.

4.1.1 Понятие о микроклимате производственных помещений

4.1.2 Основные параметры микроклимата

4.1.3 Создание требуемых параметров микроклимата

4.2 Чрезвычайные ситуации. Защита предприятия в чрезвычайных ситуациях и ликвидация последствий

4.2.1 Чрезвычайные ситуации

4.2.2 Классификация чрезвычайных ситуаций

4.2.3 Ликвидация последствий ЧС

Выводы по главе IV

Заключение

Литература

Приложение
Заказать написание новой работы



Дисциплины научных работ



Хотите, перезвоним вам?