Системы оптического распознавания, обеспечивающие обработку сканированных документов стандартных форм и их экспорт в базы данных - Курсовая работа

бесплатно 0
4.5 241
Основные задачи потокового ввода документов стандартных форм. Этапы загрузки и обработки форматированных документов. Технологии распознавания значимых полей. Групповая верификация для проверки цифровых данных. Анализ подсистемы экспорта результатов.

Скачать работу Скачать уникальную работу

Чтобы скачать работу, Вы должны пройти проверку:


Аннотация к работе
Помимо выигрыша в стоимости и качестве ввода, технологии сканирования и распознавания документов имеют и другое существенное преимущество - корректно идентифицированный поток документов, включающий распознанную информацию и графические образы, может составлять основу электронного архива, представляющего функции быстрого поиска документа, извлечения, пересылки и печати графического образа документа (по качеству аналогичной ксерокопии документа). Скорость работы машины была 1500 документов в минуту: она проверяла каждый документ, исключая те, которые она не смогла обработать правильно. По существу, имеется следующая проблема: есть документ, на котором есть, с одной стороны, данные, которые присущи всем документам этого типа, и эти данные являются статическими. На Западе вместо понятия «система обработки форм» используется термин «Document Capturing» (т.е. захват документа). Поскольку производится обработка образов документов, с распознаванием содержащихся в них данных, они должны быть спроектированы с учетом максимально удобного сканирования, а данные - внесены таким образом, чтобы их было удобно распознавать.В деятельности большого количества государственных, акционерных и частных предприятий возникает необходимость обработки структурированных и неструктурированных форм документов, изначально выполненных на бумаге. Обычно под этим понимается первоначальный ввод информации с бумажного документа в информационную систему предприятия и, затем, собственно обработка данных в СУБД и прикладных информационных системах. Стандартными формами являются однотипные, имеющие априорную структуру документы, которые классифицируются по таким признакам: способ нанесения информации, геометрическая вариативность полей и наличие явных разделителей полей. Среди основных систем обработки форм можно выделить следующие: обработка факсов, обработка государственных форм, обработка различных счетов и заказов на товары, маркетинговые исследования и опросы, обработка банковских платежных поручений и др. Причем сам процесс обработки формы включает именно сегментацию изображения формы и извлечение данных из значимых полей.

Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность
своей работы


Новые загруженные работы

Дисциплины научных работ





Хотите, перезвоним вам?