Необходимость разработки программного комплекса. Обзор методов восстановления трёхмерных сцен: алгоритмы Shape from Shading. Сравнительный анализ методов восстановления 3D сцен. Перспективная проекция. Совмещение результатов восстановления с моделью.
Аннотация к работе
Повышение быстродействия, резкий рост вычислительных ресурсов (оперативной памяти и дискового пространства), и доступность вычислительных средств, в настоящее время открывают новые возможности в области цифровой обработки изображений и их практической применимости в сферах робототехники и искусственного интеллекта. Если ранее усилия сосредоточивались на быстрых, однопроходных алгоритмах с минимальными затратами вычислительных ресурсов, которые, естественно, не могли обеспечить глубокой интеллектуальной переработки поступающей видеоинформации, то в настоящее время методы, которые ранее мало использовались в обработке изображений изза больших вычислительных затрат и расхода ресурсов, сейчас стали стандартной частью систем обработки видео-и фото-материала. В этих условиях возникает возможность разработки алгоритмов и аппаратно-алгоритмических комплексов, обеспечивающих детальную переработку видео данных от исходных изображений, до символического описания сцены, как перечня распознанных объектов, их положения, перемещений, поведения и изменения. В целом алгоритмы восстановления трехмерных сцен называют "Shape from X" (восстановление формы из X), где X-может принимать разные значения, основными подклассами этой большой группы алгоритмов являются: - "Shape from shading" - восстановление формы (глубины) сцены по одиночному изображению на основе анализа изменения яркости. "Shape from from Focusing and Defocusing" - восстановление формы (глубины) сцены по набору изображений, снятых неподвижной камерой при различной степени расфокусировки (фокусировка на фрагменты сцены, расположенные на различном расстоянии от камеры);Местоположение самолета на местности сейчас определяет спутниковая система навигации GPS - обеспечивающие измерение времени и расстояния навигационные спутники; глобальная система позиционирования) или российский аналог ГЛОНАСС. Здесь главная проблема состоит в том, что эти системы контролируются военными учреждениями США и РОССИИ соответственно, то есть в случае военных действий использование этих систем на мирные цели может быть ограничено или прекращено совсем, системы могут быть уничтожены.Для осуществления этой цели должны быть выполнены следующие задачи: реализовать метод детектирования и сопровождения характеристический точек на серии изображений, по характеристическим точкам восстановить трехмерная сцену, построить карту высот, визуализировать получившуюся сцену.Они основаны на том обстоятельстве, что для ламбертовых поверхностей яркость в каждой точке не зависит от положения наблюдателя и пропорциональна косинусу угла между нормалью к поверхности и направлением на источник освещения. Вектор нормали к поверхности Z(x,y) тогда записывается в виде: Здесь p и q - компоненты вектора градиента поверхности в направлении x и y соответственно. Пусть сцена освещается плоскопараллельным пучком в направлении где И - угол между направлением на источник излучения и осью z (зенитный угол, slant of the illuminant), ф-угол между проекцией направления на источник излучения от объекта на плоскость xy и осью x (азимутальный угол, tilt of the illuminant). С учетом спекулярного рассеяния, наиболее общее выражение выглядит так [12]: Здесь в = arccos([n,s]) - угол между нормалью к поверхности и биссектрисой угла между направлениями на источник освещения s и точку изображения b, у-ширина диффузной части спекулярного рассеяния (specular lobe), Иі, фі и Иr, фr - зенитный и азимутальные углы источника излучения и направления зрения (точки изображения) соответственно. Если условия освещения не известны, они могут быть восстановлены из самого изображения с помощью группы алгоритмов IDE (Illumination Direction Estimation), однако, в этом случае, приходится делать определенные допущения для статистических свойств поверхности, например, о равной вероятности уклонов поверхности для всех направлений, или локальной сферичности поверхности.Алгоритмы восстановления формы сцены по фокусировке и дефокусировке, основываются на конечности глубины резкости оптических систем. Действительно, пусть расстояние до точки объекта равно z, а фокусное расстояние объектива - f, тогда изображение этой точки будет резким только в случае, когда выполняется соотношение тонкой линзы: где L - расстояние от линзы до плоскости изображения. Так как для неплоского объекта расстояния от объектива до его различных точек разные, то оптическая система может быть наведена на резкость только для части точек объекта. Достижимое этими методами пространственное разрешение сцены, вдоль оси камеры (оси z), может быть оценено, исходя из выражения для глубины резкости [20]: Здесь r - радиус входного зрачка объектива, Д - диаметр кружка в плоскости изображения, которым представляется точка объекта, в цифровых системах изображение можно считать резким, если Д меньше размера пикселя фоточувствительной матрицы.По типу обрабатываемых особенностей, алгоритмы восстановления формы сцены на основании стереоизображений делятся на три класса: алгори
План
Содержание
Введение
1. Общая часть
1.1 Обоснование необходимости разработки программного комплекса
1.2 Постановка задачи
1.3 Обзор методов восстановления трехмерных сцен
1.3.1 Алгоритмы Shape from Shading
1.3.2 Алгоритмы Shape from Focus and Defocusing
1.3.3 Алгоритмы Shape from Stereo
1.3.4 Алгоритмы Shape from Motion
1.3.5 Экзотические методы
1.4 Сравнительный анализ методов восстановления 3D сцен
2. Система трехмерного зрения
2.1 Общая структура алгоритма восстановление 3D сцен
2.2 Обнаружение характеристических точек
2.2.1 Метод SIFT
2.2.2 Метод SURF
2.3 Восстановление 3D сцен по последовательности цифровых изображений методом факторизации матриц
3.2 Структура программы восстановления трехмерных сцен
3.3 Совмещение результатов восстановления с моделью
3.4 Оценка точности восстановления
3.4.1 Первая синтетическая модель
3.4.2 Вторая синтетическая модель
3.4.3 Третья синтетическая модель
3.5 Тестирование на реальных изображениях
3.6 Результат
4. Экономическая часть
4.1 Определение целесообразности разработки алгоритмов и программных продуктов
4.2 Определение трудоемкости и затрат на создание алгоритмов и ПП
4.3 Оценка экономической эффективности
5. Обеспечение условий труда в отделе обработки изображений
Заключение
Список использованных источников
Приложение А Приложение Б программный трехмерный проекция
Введение
Повышение быстродействия, резкий рост вычислительных ресурсов (оперативной памяти и дискового пространства), и доступность вычислительных средств, в настоящее время открывают новые возможности в области цифровой обработки изображений и их практической применимости в сферах робототехники и искусственного интеллекта. Если ранее усилия сосредоточивались на быстрых, однопроходных алгоритмах с минимальными затратами вычислительных ресурсов, которые, естественно, не могли обеспечить глубокой интеллектуальной переработки поступающей видеоинформации, то в настоящее время методы, которые ранее мало использовались в обработке изображений изза больших вычислительных затрат и расхода ресурсов, сейчас стали стандартной частью систем обработки видео- и фото- материала. Считается, что производительность микропроцессоров возрастает вдвое каждые два года. Рост оперативной памяти и систем постоянного хранения информации идет, по-видимому, еще быстрее. В этих условиях возникает возможность разработки алгоритмов и аппаратно-алгоритмических комплексов, обеспечивающих детальную переработку видео данных от исходных изображений, до символического описания сцены, как перечня распознанных объектов, их положения, перемещений, поведения и изменения.
Задача восстановления и распознавания трехмерных сцен в настоящее время интенсивно разрабатывается большим числом исследователей и организаций. Область применения этих алгоритмов также чрезвычайно широка. Это задачи навигации роботов и управления автомобилем [1], [2], [3], [4], предотвращение столкновений [5], лабораторные и промышленные системы измерения [6],[7]. Широкое приложение алгоритмы восстановления трехмерных сцен в последнее время находят также в аэрокосмической отрасли.
Разработано огромное количество методов и алгоритмов, однако все они имеют ограниченные области применения и "работают" не для всех сцен. В целом алгоритмы восстановления трехмерных сцен называют "Shape from X" (восстановление формы из X), где X-может принимать разные значения, основными подклассами этой большой группы алгоритмов являются: - "Shape from shading" - восстановление формы (глубины) сцены по одиночному изображению на основе анализа изменения яркости. Как правило, используется ламбертовская модель рассеяния света объектом;
- "Shape from from Focusing and Defocusing" - восстановление формы (глубины) сцены по набору изображений, снятых неподвижной камерой при различной степени расфокусировки (фокусировка на фрагменты сцены, расположенные на различном расстоянии от камеры);
- "Shape from Stereo" - восстановление формы (глубины) сцены из стереопары изображений;
- "Shape from Motion" - восстановление формы сцены из последовательности изображений, снятых с разных позиций и в разные моменты времени (часто положения камеры тоже считаются неизвестными и восстанавливаются в ходе решения задачи);
- "Shape from Zoom" - восстановление формы сцены на основе последовательности изображений, снятых при фиксированном расположении камеры с различной степенью оптического увеличения. Более детальный обзор этих методов будет дан в следующем разделе.