Анализ структуры и синтаксиса связного текста. Классификация и типизация информационных запросов. Разработка дескрипторных языков индексирования, тезаурусов и словарей. Описание внелингвистических факторов, влияющих на создание предметизационных систем.
Аннотация к работе
Автореферат диссертации на соискание ученой степени доктора филологических наук Разработка семантико-синтаксических схем индексирования информации в документальных системах Диссертация выполнена в Научно-исследовательском отделе информатики и автоматизации Библиотеки Российской академии наук Официальные оппоненты: доктор филологических наук, профессор Мартыненко Григорий Яковлевич доктор филологических наук, профессор Шайкевич Анатолий Янович доктор педагогических наук, профессор Соколов Аркадий Васильевич Защита состоится 8 ноября 2007 г. 16 часов на заседании диссертационного совета Д 212.232.18 по защите диссертаций на соискание ученой степени доктора филологических наук при Санкт-Петербургском государственном университете по адресу: 199034, г.Непосредственной целью исследования ставилось: •исследование семантических схем информации и наиболее известной из них - предметно-аспектной модели S-Attr-P-Instr-Loc при разработке дескрипторных языков индексирования. Актуальность и практическая значимость диссертации заключается в том, что в связи с бурным развитием сети Интернет и также активной на переломе веков разработкой в России автоматизированных библиотечно-информационных систем (АБИС, электронные каталоги) объемы индексационных, а также словарных (тезаурусы, авторитетные файлы) работ постоянно растут. Вместе наблюдавшееся в 90-е годы прошлого века сокращение исследований и числа публикаций по этой тематике имели следствием уменьшение качества индексирования во многих отечественных ИПС (Ф.С. Научная новизна диссертации заключается в том, что впервые с позиций лингвистической прагматики описаны все основные виды работ по созданию лингвистических средств ИПС. Все вышеназванные элементы ЛО в двух разработанных диссертантом системах (по огнеупорам и по сохранности документов) построены на одном лингвистическом основании - схеме анализа информации S-Attr-P-Instr-Loc, что обеспечивает их хорошую согласованность и сбалансированность.В литературе по информатике данные элементы как наиболее важные при индексировании в том или ином виде представлены в схемах анализа информации Ю.А. К предметно-аспектной модели близки, например, описания языков индексирования, в которых каким-либо образом различают понятия предмет и аспект, и с последним понятием связывается главным образом процессная лексика. Предметно-аспектный подход к информации обосновывался тем, что ключевые слова и дескрипторы, рассматриваемые сами по себе и безотносительно к какой-либо схеме, не выражают информации в обиходном и полезном для информатики смысле как сообщения чего-то о чем-то. Содержание понятия ‘предмет информации’ осмыслено только тогда, когда это понятие рассматривается в линейном ряду ‘предмет’ - ‘аспект’ информации, то есть оно относится к числу таких парных понятий, как подлежащее и сказуемое, тема и рема и др. Справа от описания моделей дескрипторов приводится их частотность в тезаурусе, а символом Ш обозначено нулевое словесное выражения процессной семантики в сложных по содержанию дескрипторах, как ‘Ш стихийные бедствия’, ‘Ш свойства’, ‘Ш биологические объекты’: ‘опер.’ н.‘опер.’ - 182; ‘вещ-во’ н.‘вещ-во’ - 133; ‘док-ты’ н.‘док-ты’ - 124; ‘мат-л’ н.‘мат-л’ - 91; ‘часть док-та’ н.‘часть док-та’ - 41; ‘оборуд.’ н.‘оборуд.’ - 34; ‘опер.’ н.‘Ш оборуд.’ - 32; ‘опер.’ н.‘Ш вещ-во’ - 25; ‘люди’ н.‘люди’ - 25; ‘Ш методы’ н.‘Ш методы’ - 19; ‘Ш Loc’ н.‘Ш Loc’ - 19; ‘проц.’ н.‘проц.’ - 16; ‘Ш св-ва’ н.‘Ш св-ва’ - 15; ‘фонды хр.’ н.‘фонды хр.’ - 14; ‘опер.’ н.‘Ш биол. объекты’ - 13; ‘Ш вещ-во’ н.‘Ш вещ-во’ - 12; ‘Ш опер.’ н.‘Ш стихийн.бедств.’ - 7; ‘Ш биол. объек.’ н.‘Ш биол. объек.’ - 7; ‘опер.’ н.‘Ш мат-л’ - 5; ‘опер.’ н.‘Ш часть док-та’ - 5; ‘Ш пятна’ н.‘Ш пятна’ - 5; ‘мат-л’ н.‘док-ты’ - 4; ‘Ш Loc’ н.‘Ш опер.’ - 4; ‘опер.’ н.‘Ш док-ты’ - 3; ‘Ш стих. бедст.’ н.‘Ш стих. бедст.’ - 3; ‘Ш Loc’ н.‘Ш оборуд.’ - 3; ‘проц.’ н.‘Ш пятна’ - 2; ‘Ш св-ва’ н.‘Ш методы’ - 2; ‘часть док-та’ н.‘вещ-во’ - 2; ‘Ш Loc’ н.‘Ш св-ва’ - 2.