Объектное представление электронных текстовых документов - Статья

бесплатно 0
4.5 108
Статья Литература Литература Размещено: 09.01.2019
Рассматривается проблема формализации содержимого электронных текстовых документов. Охарактеризованы объекты контейнеров и атомарных объектов. Исследование особенностей отображения топологического и информационного аспектов содержимого документа.


Аннотация к работе
Документы представляются в виде совокупности объектов двух видов - объектов контейнеров и атомарных объектов. Thus documents move in the form of set of objects of two kinds - objects of containers and atomic objects. При этом документы представляются в виде совокупности объектов двух видов - объектов контейнеров и атомарных объектов. Задачи исследования следующие: разработка спецификации объектов контейнеров и атомарных объектов; разработка методики определения того, какие фрагменты исходного документа необходимо отнести к объектам того или иного типа и какие отношения между этими объектами могут быть установлены. Если каждый элемент документа или часть элемента интерпретировать как объект, то документ можно представить в виде неупорядоченного множества объектов: Di = {?1, ?2, … , ?ni}, i = 1, … ,N, где, ni - количество объектов в i - ом документе.В ходе работы разработан оригинальный подход формализации содержимого электронных текстовых документов. В основе этого подхода лежит объектный подход, а сами документы представлены как совокупности атомарных объектов и объектов контейнеров. Данный подход позволяет также получить некоторое универсальное представление для документов с различным исходным форматом и упрощает задачу идентификации данных, содержащихся в текстовых документах.
Заказать написание новой работы



Дисциплины научных работ



Хотите, перезвоним вам?