Потребность в разработке систем распознавания буквенно-символьной информации документов. Формирование цифровых изображений двумерных или трехмерных сцен с помощью датчиков. Модификация пикселей в малых окрестностях. Изменение тонового распределения.
Основную часть информации о внешнем мире человек получает по зрительному каналу и далее весьма эффективно обрабатывает полученную информацию при помощи аппарата анализа и интерпретации визуальной информации.При этом уже сейчас становится ясно, что от успешного решения ряда сложных и неоднозначных задач компьютерного зрения зависит автоматизация множества процессов и операций, которые до этого управлялись и контролировались только человеком. Однако смысл, скрывающийся за всеми этими определениями, один - это попытка научить компьютер видеть мир глазами человека, воспринимать его как человек и выполнять в связи с этим различные действия так же, как делал бы это человек, тем самым подменяя или полностью исключая последнего. История появления изображений и стремления передачи информации посредством изображений уходит корнями в ранний период развития цивилизации, когда наборы изображений, заменяя первые лингвистические опыты, служили простейшим средством коммуникации или обмена информацией. К первой области относятся исследования и разработки в области компьютерного зрения, связанные с информацией, поступающей от одной камеры или от каждой камеры отдельно. К наиболее значимым из них относятся зрение роботов, средства автоматизации обработки визуальных данных и информации, биометрия и безопасность, распознавание буквенно-символьной информации, распознавание жестов, детектирование наличия движущихся объектов в поле зрения камеры, распознавание зрительных образов, задачи мультисенсорного распознавания, задачи медицинской диагностики, различного рода системы мониторинга, пакеты программ по обработке изображений общего назначения и ряд других направлений.Свет, отраженный от объектов, а иногда и прошедший сквозь них, формирует изображение на сетчатке каждого глаза. Двумерное цифровое изображение представляет собой массив значений интенсивности света, отраженного или прошедшего сквозь объекты: это изображение обрабатывается машиной или компьютерной программой с целью формирования решений относительно сцены. Если цифровое изображение состоит из 500 строк и 500 столбцов однобайтных значений яркости, то для хранения такого изображения потребуется массив размером четверть миллиона байт. Иногда ПЗС-камера подключается к компьютерной плате, называемой фреймграббером, которая содержит память для изображения и, возможно, предоставляет средства для управления камерой. Видеокамеры предназначены для получения изображения для человеческого восприятия путем записи последовательностей изображений с типичной частотой 30 раз в секунду, что позволяет представить изображение движение объекта в течении времени, а не только пространственные характеристики объекта, которые можно представить одиночными изображениями или кадрами.В этом разделе я рассмотрю методы обработки изображений как для использования человеком, так и для дальнейшей автоматической обработки. Например, эти методы могут потребоваться для понижения шума на изображении или для усиления или подавления некоторых деталей изображения. Основная идея состоит в том, что считается, что наряду с некоторым сигналом или структурой, которую необходимо извлечь, изображение содержит неважные или нежелательные данные, которые требуется подавить. Данный метод легко расширить таким образом, чтобы пользователь мог указать несколько различных областей изображения и применить к каждой из них различные функции преобразования-функции тонового распределения. На рисунке 6 показано изображение, для которого была применена операция расширения динамического диапазона для растяжения диапазона используемых значений интенсивности в соответствии с двумя различными функциями тонового распределения.Заводя разговор о функциональной начинке FINEREADER, первым делом следует вкратце рассказать о трех базовых принципах - целостности, целенаправленности и адаптивности (Integrity, Purposefulness and Adaptability, сокращенно IPA), лежащих в основе OCR-решений ABBYY и применяющихся на всех стадиях и уровнях обработки документов. Согласно первому правилу - принципу целостности (integrity) - наблюдаемый объект всегда рассматривается как целое, состоящее из множества взаимосвязанных частей. Третий принцип - адаптивности (adaptability) - подразумевает способность системы к самостоятельному обучению и умению использовать ранее накопленные знания об объектах. В соответствии с ключевыми положениями IPA, разбираемый ABBYY FINEREADER фрагмент изображения, согласно принципу целостности, будет интерпретирован как некий объект (символ), только если на нем присутствуют все структурные элементы с соответствующими взаимосвязями. В случае обработки документов с подложенными текстурами и фоновыми рисунками в дело вступает система адаптивной бинаризации (Adaptive Binarization, AB), исследующая яркость фона и насыщенность черного цвета на протяжении всей строки или слова и подбирающая оптимальные параметры преобразования для каждого фрагмента изображения по отдельности.В представленной квалификационной работе было рассмотрено понятие
Введение
Основную часть информации о внешнем мире человек получает по зрительному каналу и далее весьма эффективно обрабатывает полученную информацию при помощи аппарата анализа и интерпретации визуальной информации. Поэтому встает вопрос о возможности машинной реализации данного процесса.
За счет возрастания сложности решаемых научно-технических задач, автоматическая обработка и анализ визуальной информации становятся все более актуальными вопросами. Данные технологии используются в весьма востребованных областях науки и техники, таких как автоматизация процессов, повышение производительности, повышение качества выпускаемых изделий, контроль производственного оборудования, контроль качества выпускаемой продукции, интеллектуальные робототехнические комплексы, системы управления движущимися аппаратами, биомедицинские исследования и множество других.
Целью данной работы является систематизирование знаний на тему компьютерного зрения и обработки цифровых изображений, изучение областей применения алгоритмов работы специализированного программного обеспечения.
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы