Этапы разработки системы реального времени для распознавания лиц на статическом изображении в условиях сложных сцен. Основные понятия алгоритма AdaBoost. Использование примитивов Хаара для описания свойств изображений. Среда разработки "Borland Delphi".
Аннотация к работе
Мы живем в мире трех измерений, или, говоря современным языком, в 3D-пространстве. Когда мы смотрим на окружающий мир, два независимых изображения, воспринимаемые нашими глазами под различными углами, анализируются мозгом, и, таким образом, происходит восприятие дистанции и глубины.Анализ проблемы проводится с помощью пяти этапов: 1) Достижение соглашения об определении проблемы. 2) Выделение основных причин-проблем, стоящих за проблемой. Подробно останавливаясь на каждом этапе: Этап 1. Выделение основных причин-проблем, стоящих за проблемой Эти группы обычно имеют разные точки зрения на проблему и разные потребности, которые должны учитываться в решении.Алгоритм ADABOOST представляет собой эффективное средство обучения классификации. Алгоритм обучения ADABOOST строит решающее правило в виде линейной комбинации выходных значений слабых классификаторов, при этом достигается экспоненциальное уменьшение ошибки с увеличением числа свойств на обучающем наборе [3]. Если представить слабый (элементарный) классификатор двух классов и , , полученный на основе описанных выше простых свойств, в виде hk( )=?yk ? ,hk( ) R(1.2) классифицирующее свойство, которого проявляется в смене знака на границе классов: hk (x)= (1.3) то в результате обучения будет получен классификатор вида h( )= (1.4) где T - число специальным образом отобранных простых классификаторов из общего их числа. Такой классификатор, с учетом приведенного выше в качестве примера способа формирования простых свойств, может представлять собой полином любой степени относительно исходных характеристик распознаваемых объектов (признаков) х1,…,xn, что теоретически позволяет получить решающее правило любой сложности. Выбирается лучший элементарный классификатор дающий минимальную ошибку на обучающем наборе с учетом текущих весов объектов минимальную ошибку на обучающем наборе с учетом текущих весов объектов D .Основными критериями качества признака для решения широкого круга задач, и в особенности задач распознавания зрительных образов, являются его разделительные свойства и сложность его получения, учитывая необходимость быстрого поиска области объекта, что предполагает классификацию большого числа кандидатов при обработке одного изображения [5]. С точки зрения необходимости использования достаточно простых алгоритмов получения признаков, перспективным является использование Хаар-подобных свойств, в отличие от предложенных в [4] и [6], представляющих собой результат сравнения яркостей в двух прямоугольных областях изображения (рис. Рисунок 1 - Вид прямоугольных свойств, используемых в качестве признаков при обнаружении объектов: а) - области не пересекаются; б) - области пересекаются Значение признака для данной области изображения или отклик области изображения на данное свойство вычисляется на основе следующего выражения: R= (1) в случае непересекающихся областей (рис. Здесь индексы Ч и Б означают черную и белую области соответственно, а Ч ? Б обозначает область пересечения областей черного и белого цвета; S - сумма яркостей пикселей изображения, находящихся под областью; N - число пикселей изображения, находящихся под областью.Исследования эффективности предложенных свойств для решения задач обнаружения объектов на изображениях проводились на задаче обнаружения лиц. Для обучения использовалась база данных изображений лиц, содержащая 2000 изображений. Для формирования базы изображений фона была разработана специальная программа, которая на основе сформированного набора изображений разного размера (около 400 изображений), не содержащих лица, случайным образом формировала 100 000 изображений. Необходимость подобной программы объясняется тем фактом, что после обучения ошибка ложного обнаружения должна быть очень низкой (порядка <10-6), а соответственно число обучающих объектов фона как минимум больше 106, что при использовании алгоритма обучения ADABOOST влечет значительные вычислительные затраты, существенно затрудняющие анализ получаемых результатов. В ходе обучения необходимо учитывать необходимость включения в исследуемый набор свойств и классификаторов, которые с точки зрения классификации взвешенного обучающего набора не имеют смысла, например, классифицируют все изображения как 1 объект.Разрабатываемая система, по сути, представляет собой своеобразный «конвейер», на вход которого подается изображение. Далее происходит сам процесс распознавания лиц, используя алгоритм ADABOOST и примитивы Xaapa. Для этого применяется определенный набор симметричных сверток в заданном диапазоне масштабов изображения, после чего видеоизображение обрабатывается нейросетью. На этом этапе с использованием алгоритма анализа контуров производится выделение на видеоизображении лица его основных признаков: глаз, носа, рта и т. После выделения основных признаков лица, его изображение приводится к стандартному виду: для надежного распознавания изображение лица должно иметь определенные размеры, необходимо выдержать расстояние между глазами, положение лица относительно центра.Это ин
План
Содержание
Введение
1. Анализ проблемы
2. Теоретическая часть
2.1 Цель и постановка задачи
2.2 Основные понятия алгоритма ADABOOST
2.3 Использование примитивов Хаара для описания свойств изображений
2.4 Обучение классификации
2.5 Концептуальная модель системы
3 Реализация программной системы
3.1 Среда разработки «Borland Delphi»
Список использованной литературы
Введение
Мы живем в мире трех измерений, или, говоря современным языком, в 3D-пространстве. Благодаря бинокулярному зрению мы можем видеть предметы, ощущая их "трехмерность". Когда мы смотрим на окружающий мир, два независимых изображения, воспринимаемые нашими глазами под различными углами, анализируются мозгом, и, таким образом, происходит восприятие дистанции и глубины. Именно эту иллюзию объемного восприятия и пытается воссоздать стереоизображение. Ведь по своей сути - стереоизображение - это лишь информация об образе, хотя и довольно точно имитирующая те зрительные ощущения, которые возникают при непосредственном, живом восприятии окружающего мира.
Стереоизображение появилась ненамного позже "обычной" двухмерной фотографии. Но увидеть стереоизображение без специальных очков или другого оборудования удалось только в начале 20 века.