Семантическая разметка собраний сочинений. Указатель как способ структурирования информации. Вспомогательные указатели и их типология. Анализ алгоритма семантической разметки именного указателя Льва Толстого. Основные проблемы семантической разметки.
При низкой оригинальности работы "Семантическая разметка указателя академического собрания сочинений", Вы можете повысить уникальность этой работы до 80-100%
Цель данной работы состоит в проектировании и разработке алгоритма семантической разметки критического аппарата текста, а именно именного указателя одного академического собрания сочинений - Полного собрания сочинений Л.Н. В последнее десятилетие активно развивается такое направление, как Digital Humanities (в русскоязычной литературе - "цифровые гуманитарные науки", "цифровая гуманитаристика", "электронное представление гуманитарного знания", "цифровые технологии в гуманитарных науках"). Любая работа в рамках Digital Humanities основывается на таких принципах, как открытый доступ к данным и метаданным, их интероперабельность - способность открыто взаимодействовать с другими ресурсами, свободное распространение методов, программного обеспечения, результатов исследования [Манифест Digital Humanities]. Но Digital Humanities занимается не просто оцифровкой данных, но и их обработкой и представлением в "дружественном" пользователю виде. При помощи компьютерных технологий, в первую очередь, проектируются и реализуются электронные ресурсы, позволяющие сохранять и представлять доступ любому желающему к гуманитарному знанию (например, в виде корпуса, электронной базы данных и т.п.).Поэтому появилась необходимость в наполнении контента метаданными, в структуризации и обработке этих метаданных, а также в создании и реализации алгоритмов автоматической обработки данных с целью выполнению пользовательских поисковых задач любой сложности. Семантическая разметка должна быть исчерпывающей и предсказывать любой запрос пользователя. Сейчас в связи с активным внедрением цифровых технологий в гуманитарное знание семантическая разметка также становится необходимой составляющей электронных публикаций текстов русских классиков. В противном случае необходимо создавать инструменты, которые будут находить, обрабатывать и структурировать метаинформацию о тексте самостоятельно, не опираясь на опубликованные собрания сочинений. Соответственно, цифровой формат данных и их семантическая разметка предоставит читателю доступ не только к самому тексту, но и к внешней информации о тексте.Традиционной практикой при подготовке издания к публикации было и есть оформление его критического (в другой литературе - справочного) аппарата: написание комментариев, указателей, биографии писателя, научных статей, посвященных его творчеству. В указателях традиционно представлены различные имена собственные: имена реальных людей, вымышленных персонажей, топонимы, названия художественных текстов, печатных изданий, организаций и т.п. Ни одно издание, претендующее на полноту и высокое качество подготовки текстов, не обходится без указателей. Раньше указатели готовились вручную: редакторы собирали имена для указателей, вычитывая тексты. Соотношение имени и личности, определение, о каком именно Петре Андреевиче идет речь в тексте, действительно, сложно и во многих случаях требовало от редактора широкого кругозора, глубокого погружения в творчество и личную жизнь писателя.Грот, создавая общий указатель к собранию сочинений Державина, не имел никаких общепринятых стандартов перед глазами, то впоследствии эти стандарты были выработаны и зафиксированы в ГОСТЕ 7.78-99. Общий указатель - указатель, в котором представлены разные объекты; в раздельном же - только определенные группы объектов (например, имена можно найти в именном указателе, предметы - в предметном). Указатель, помещенный в отдельный том, принято называть сводным. Среди них представлены два современных, до сих пор не изданных до конца собраний сочинений - собрания сочинений В.А. Ниже представлена сводная таблица (Таблица 1), в которой каждое собрание сочинений характеризуется по типу и месту указателя в собрании сочинений.Можно встретить такие варианты названия именного указателя, как "указатель имен", "указатель личных имен", "указатель имен собственных", "указатель имен и названий", "алфавитный указатель". Именные указатели различаются содержательно, т.е. по тем типам имен собственных, которые включаются в именной указатель: личные имена и псевдонимы, географические названия, названия художественных, музыкальных произведений, названия картин, имена литературных, фольклорных и мифологических персонажей, названия издательств, театров, торговых домов, школ, музеев и других организаций, названия периодических изданий, исторические события. В указатель включены только имена реальных людей (ПСС В.А. В указатель включены имена реальных людей и вымышленных персонажей (Сочинений в трех томах К.Н. В указатель включены имена реальных людей и вымышленных персонажей, а также географические названия (ПСС Е.А.Прежде чем сформулировать алгоритм, было проанализировано соотношение имен из указателя с именами в тексте оригинального издания. Проблемы поиска имени из индекса в тексте разделены на две группы. Имя в указателе всегда записывается в современной орфографии, однако в тексте можно найти и дореформенную орфографию
План
Содержание
Введение
§ 1. Семантическая разметка собраний сочинений
§ 2. Указатель как способ структурирования информации. Первые указатели