Разработка алгоритма повышенной точности для оптического распознавания символов с изображений паспортов с использованием библиотеки OCR Tesseract и словарного контроля полученных результатов - Дипломная работа

бесплатно 0
4.5 348
Оптическое распознавание символов: процесс, обзор существующих приложений (Abbyy FineReader, CuneiForm, OCRopus и пр.). Трудности распознавания символов. Определение фиксированного шага и сегментация слов. Разделение соединенных и повреждённых символов.


Аннотация к работе
В настоящее время компьютеризация в нашем обществе растет очень быстрыми темпами и играет очень значимую роль в повседневной деятельности человека. При помощи компьютерных технологий сейчас делаются попытки автоматизировать широкий круг процессов, которые в недалеком прошлом возлагались на умственную способность человека, поскольку информационные технологии используются повсеместно, в связи с чем программисты всего мира разрабатывают новые и совершенствуют уже зарекомендовавшие себя на практике алгоритмы автоматизации рутинных процессов. приложение распознавание символ finereader Одной из актуальных проблем на данный момент является неэффективная работа различных государственных организаций, таких как «Пенсионный Фонд», городские поликлиники, различные организации бухгалтерского учета, поскольку все делается в ручном режиме. Избежать этого можно, используя программное обеспечение, позволяющее автоматизировать данный процесс. Иллюстрацией выше изложенного служит практическая деятельность компаний, фиксирующих персональные данные граждан: коммунальные службы, паспортные столы, бухгалтерия по месту работы, т.д.В данной главе рассматриваются основные понятия в сфере оптического распознавания символов, методы распознавания печатных букв, программные средства для распознавания и приложения, способные распознавать русские символы. Оптическое распознавание имеет широкие границы применения: для конвертации книг и документов в электронный вид, для автоматизации систем учета в бизнесе или для публикации текста на веб-странице. Над преобразованным в электронный вид при помощи оптического распознавания текстом можно совершать множественные манипуляции: редактировать, осуществлять поиск слова или фразы, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь при помощи соответствующего программного обеспечения. Первые системы оптического распознавания текста нуждались в постоянной калибровке для работы с каждым конкретным шрифтом; в ранних версиях для распознавания было необходимо изображение каждого символа. Под улучшением качества изображения предполагается: уменьшение шумов на изображении, повышение контрастности, определение границ символов, различные фильтрации и вращения отдельных областей интереса.На данный момент уже существуют готовые программные решения по оптическому распознаванию символов. В данном разделе будет рассмотрено решение безоговорочного лидера в данной сфере IT технологий, компании ABBYY: Abbyy FINEREADER, а также некоторые небольшие приложения по преобразованию печатных символов в электронный вариант на базе собственных движков распознавания. FINEREADER - коммерческий продукт для оптического распознавания символов разработанный российской компанией ABBYY и безусловный лидер в сфере оптического распознавания символов.Изначально программа CUNEIFORM была разработана компанией COGNITIVETECHNOLOGIES как коммерческий продукт. Однако после нескольких лет перерыва в разработке, 12 декабря 2007 года анонсировано открытие исходных текстов программы, которое состоялось 2 апреля 2008 года. На данный момент CUNEIFORM позиционируется как шрифтонезависимая система преобразования электронных копий бумажных документов и графических файлов в редактируемый вид с возможностью сохранения структуры и гарнитуры шрифтов оригинального документа в автоматическом или полуавтоматическом режиме. OCROPUS - система оптического распознавания символов, изначально направленная на преобразование в электронный вид большого объема документов на базе собственного распознающего ядра, начиная с версии 0.4.Tesseract - одноименная со своим ядром распознавания, свободно распространяемая программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х, а затем на 10 лет проект был приостановлен.[10,20] В августе 2006 года компания Google выкупила ее и открыла исходные тексты под лицензией Apache 2.0 для продолжения работы над перспективным проектом.После рассмотрения четырех наиболее примечательных приложений по распознаванию символов, были сделаны следующие выводы: 1. Многие из приложений обладают не вполне интуитивно понятным интерфейсом и слишком большим числом функций, что иногда может оказаться недостатком Не у всех имеется возможность предварительной обработки изображения с целью улучшения качества Разнообразие языков, символов, и способов изображать их. В каждом языке имеются символы, обладающие схожими чертами друг с другом и цифрами.Распознавание структурированных (печатных) символов различных изображений обеспечивает решение ряда научных и прикладных задач при идентификации объектов различной природы.Алгоритм работы данных методов заключается в разбиении исходного образа на составные части, описываемые как стабильные идеальные элементы.

План
Оглавление

Введение

Глава 1. Метериалы и методология

1.1 Оптическое рапознавание символов

1.2 Процесс рапознавания символов

1.3 Обзор существующих приложений по оптическому распознаванию символов

1.3.1 Abbyy FINEREADER

1.3.2 CUNEIFORM

1.3.3 OCROPUS

1.3.4 Tesseract

1.3.4 Выявленные недостатки приложений

1.4 Основные трудности рапознавания символов

1.5 Методы распознавания символов

1.5.1 Структурные методы

1.5.2 Шаблонные методы

1.5.3 Признаковые методы

1.5.4 Нейросетевые методы

1.6 Tesseract OCR

1.6.1 Метод обнаружения линий

1.6.2 Метод выбора базовой линии

1.6.3 Определение фиксированного шага и сегментация слов

1.6.4 Обнаружение слов

1.6.5 Распознавание слов

1.6.6 Разделение соединенных символов

1.6.7 Распознавание поврежденных символов

1.6.8 Статический классификатор символов

1.6.9 Классификация

1.6.10 Обучение данных

1.6.11 Лингвистический анализ

1.6.12 Адаптивный классификатор

1.7 Фильтр Гаусса

1.8 Алгоритм Канни

Глава 2. Описание разработанной системы

2.1 Общее описание приложения и принципа его работы

2.2 Tesseract

2.3 Исходные данные

2.4 Предварительная обработка изображения

2.5 Распознавание данных

2.5.1 Выделение границ нахождения данных

2.5.2 Алгоритм локальной адаптивной бинаризации

2.5.3 Оценка высоты текста

2.5.4 Удаление линий

2.6 Обучение данных

2.7 Результат работы программы

2.8 Описание графического интерфейса пользователя

2.9 Тестирование функции распознавания паспортных данных

2.9.1 Процесс тестирования

2.9.2 Результат тестирования

Заключение

Список литературы
Заказать написание новой работы



Дисциплины научных работ



Хотите, перезвоним вам?