Подбор разметки документа таким образом, чтобы сгенерированный вариант как можно меньше отличался от оригинала - основная задача системы распознавания. Microsoft Word - наиболее популярное программное приложение для работы с текстовой информацией.
При низкой оригинальности работы "Оценка качества работы алгоритма поиска логической структуры документа при оптическом распознавании", Вы можете повысить уникальность этой работы до 80-100%
При восстановлении структуры документа основной задачей является подбор таких параметров оформления текста и разбиения его на потоки, чтобы полученный документ как можно меньше отличался от исходного. Также полезно иметь возможность сравнивать структуры одного документа, полученные от разных программ или от разных версий одной программы. Логическая структура документа - структурное представление содержимого документа в виде определенных элементов, которое учитывает их роль в документе, логические взаимосвязи между ними, порядок чтения документа пользователем и т.д. Таким образом, логическая структура документа представлена в виде дерева, корнем дерева является сам документ, далее идет ветвление: секция-> поток-> абзац-> строка. В левой колонке таблицы 1 приведены ошибки, которые используются в системе ABBYY Fine Reader для оценки качества распознавания логической структуры документа, с добавлением еще двух видов ошибок, которые исправили недостатки существовавшего подхода (были добавлены ошибки «разрыв колонтитула» и «неверная роль потока»).
Список литературы
1. Зуев К.А., Технология анализа документа // Компьютерная хроника, 1996г.
2. Зуев К.А., Система идентификации структуры печатных документов // Дис. канд. тех. наук. - М.: МГУЛ, Москва, 1999.
3. Hu T., Ingold R. A mixed approach toward an efficient logical structure recognition from document images // ELECTRONIC PUBLISHING, VOL. 6(4), 1993.
4. Rangoni Y., Belaid A. Document Logical Structure Analysis Based on Perceptive Cycles // Springer-Verlag Berlin Heidelberg, 2006.
5. Song M., Rosenfeld A., Kanunugo T. Document Structure Analysis Algorithms: A Literature Survey // Proc. SPIE Electronic Imaging, VOL. 5010, 2003.
Размещено на .ru
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы