Основные задачи потокового ввода документов стандартных форм. Этапы загрузки и обработки форматированных документов. Технологии распознавания значимых полей. Групповая верификация для проверки цифровых данных. Анализ подсистемы экспорта результатов.
При низкой оригинальности работы "Системы оптического распознавания, обеспечивающие обработку сканированных документов стандартных форм и их экспорт в базы данных", Вы можете повысить уникальность этой работы до 80-100%
Помимо выигрыша в стоимости и качестве ввода, технологии сканирования и распознавания документов имеют и другое существенное преимущество - корректно идентифицированный поток документов, включающий распознанную информацию и графические образы, может составлять основу электронного архива, представляющего функции быстрого поиска документа, извлечения, пересылки и печати графического образа документа (по качеству аналогичной ксерокопии документа). Скорость работы машины была 1500 документов в минуту: она проверяла каждый документ, исключая те, которые она не смогла обработать правильно. По существу, имеется следующая проблема: есть документ, на котором есть, с одной стороны, данные, которые присущи всем документам этого типа, и эти данные являются статическими. На Западе вместо понятия «система обработки форм» используется термин «Document Capturing» (т.е. захват документа). Поскольку производится обработка образов документов, с распознаванием содержащихся в них данных, они должны быть спроектированы с учетом максимально удобного сканирования, а данные - внесены таким образом, чтобы их было удобно распознавать.В деятельности большого количества государственных, акционерных и частных предприятий возникает необходимость обработки структурированных и неструктурированных форм документов, изначально выполненных на бумаге. Обычно под этим понимается первоначальный ввод информации с бумажного документа в информационную систему предприятия и, затем, собственно обработка данных в СУБД и прикладных информационных системах. Стандартными формами являются однотипные, имеющие априорную структуру документы, которые классифицируются по таким признакам: способ нанесения информации, геометрическая вариативность полей и наличие явных разделителей полей. Среди основных систем обработки форм можно выделить следующие: обработка факсов, обработка государственных форм, обработка различных счетов и заказов на товары, маркетинговые исследования и опросы, обработка банковских платежных поручений и др. Причем сам процесс обработки формы включает именно сегментацию изображения формы и извлечение данных из значимых полей.
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы