Основные компоненты информационно-поисковых систем: предметная рубрика и информационно-поисковый язык. Виды синонимии в языке предметных рубрик. Формирование предметной рубрики и ее структура. Правила составления предметной рубрики, область применения.
Аннотация к работе
Информация - ценнейший ресурс наряду с такими традиционными видами ресурсов, как нефть, газ, полезные ископаемые и другие. Переход к информационному обществу XXI века породил беспрецедентный рост объемов и концентрации информации в глобальных компьютерных сетях. Это резко обострило проблему создания информационно-поисковых систем (ИПС) и их эффективного использования. Информационно-поисковая система (ИПС) - это упорядоченная совокупность документов (массивов документов) и информационных технологий, предназначенных для хранения и поиска информации - текстов (документов) или данных (фактов) . Информационно-поисковый язык - знаковая система, предназначенная для описания (путем индексирования) основного смыслового содержания текстов (документов) или их частей, а также для выражения смыслового содержания информационных запросов с целью реализации информационного поиска.Язык предметных рубрик - это информационно-поисковый язык, предназначенный для индексации (частей) документов и информационных запросов посредством предметных рубрик. Предметная рубрика - элемент ИПЯ, представляющий собой краткую формулировку темы на естественном языке. При создании словаря предметных рубрик в него вводятся все синонимы и эквивалентные по смыслу выражения, возможные в естественном языке. Например, “аэропланы см. самолеты” - эта запись означает, что из двух возможных слов для предметизации разрешается использовать только термин “самолеты”. Помимо лексических синонимов и эквивалентных по смыслу выражений можно отметить еще несколько видов синонимии, которую необходимо учитывать в языке предметных рубрик: сокращенная и полная форма термина, выраженного словосочетанием.Предметная рубрика прошла трудный путь эволюции. В зависимости от лексических единиц в предметной рубрике различают простую и сложную. Простая предметная рубрика - предметная рубрика, состоящая из одной лексической единицы - из заголовка. Сложная предметная рубрика - предметная рубрика, состоящая из нескольких лексических единиц, т.е. кроме заголовка предметной рубрики она содержит один и более подзаголовков. Адекватная предметная рубрика - предметная рубрика, формулировка которой выражает объем понятия, наиболее точно соответствующий объему понятий о предмете документа.Чтобы информационно-поисковый язык мог в полной мере осуществить свою поисково-информационную функцию, предметная рубрика, являясь его основным элементом, должна соответствовать определенным требованиям и формулироваться по правилам. Особое место здесь при составлении предметных рубрик выражается в умении адекватного понимания мыслей и чувств, выраженных автором. Эвристичной - на первом месте в предметной рубрике должно стоять слово, несущее максимальную смысловую нагрузку Предметные рубрики и их подзаголовки, как правило, формулируются в именительном падеже: Расселение народов мира Сокращения в предметных рубриках: названия, имеющие полную и краткую формы отражаются в полной форме.В мировой практике описаны два подхода к созданию национальных списков предметных рубрик: Оригинальная разработка списка (Великобритания, Германия, Польша, Финляндия) В России основой Национального авторитетного файла предметных рубрик является авторитетный файл предметных рубрик Российской национальной библиотеки, созданный на базе предметного каталога, отражающего фонды данной библиотеки с начала 20-х годов ХХ века. Национальный авторитетный файл предметных рубрик является универсальным, так как охватывает все отрасли знаний: естествознание, физико-математические и химические науки, технику и технологию, общественные науки, отрасли экономики и культуры, искусствоведение, произведения об исторических лицах и событиях, фольклорные произведения. Авторитетный файл предметных рубрик включает предметные рубрики, присвоенные документам (книги, журналы, ГОСТЫ) на русском языке (с 1931 г) и на иностранных европейских языках (книги, журналы) (с 1918 г), хранящиеся в фондах Российской Национальной библиотеки с 2004 г., в авторитетный файл предметных рубрик включен ряд предметных рубрик для нотных, картографических изданий, видеоизданий. В авторитетном файле предметных рубрик представлены следующие категории авторитетных записей предметных рубрик: Личные имена (включая литературные образы, имена мифологических и вымышленных персоналией);Информационно-поисковая система (ИПС) - это упорядоченная совокупность документов и информационных технологий, предназначенных для хранения и поиска информации. ИПС можно представить как базу данных с огромным количеством различной информации, которая, как правило, требует разработки собственного информационно-поискового языка, адекватного для каждой предметной области. Для общения пользователя с компьютером и оказания ему помощи в поиске нужной информации среди ее большого потока разрабатываются специальные искусственные языки, так как естественный язык в этом качестве пока не может быть использован без специального предварительного преобразования.
План
Содержание
Введение
1. Понятие информационно-поискового языка
2. Формирование предметной рубрики
2.1 Структура предметной рубрики
2.2 Правила составления предметной рубрики
3. Область применения
Заключение
Список литературы
Введение
Сегодня, в век информатизации и компьютеризации информация является таким же ресурсом, как трудовые, материальные и энергетические. Информация - это разъяснение, осведомленность, изложение. Информация - ценнейший ресурс наряду с такими традиционными видами ресурсов, как нефть, газ, полезные ископаемые и другие.
Переход к информационному обществу XXI века породил беспрецедентный рост объемов и концентрации информации в глобальных компьютерных сетях. Это резко обострило проблему создания информационно-поисковых систем (ИПС) и их эффективного использования.
Информационно-поисковая система (ИПС) - это упорядоченная совокупность документов (массивов документов) и информационных технологий, предназначенных для хранения и поиска информации - текстов (документов) или данных (фактов) . Информационно-поисквыми системами являются любые определенным образом организованные хранилища информации. Причем информационно-поисковые системы могут быть и неавтоматизированными. Главное - это целевая функция: хранение и поиск информации.
Важнейшим компонентом информационно-поисковых систем является информационно-поисковый язык. Информационно-поисковый язык - знаковая система, предназначенная для описания (путем индексирования) основного смыслового содержания текстов (документов) или их частей, а также для выражения смыслового содержания информационных запросов с целью реализации информационного поиска.
Человек, чтобы отобрать из массива документов нужные, должен прочитать или просмотреть их содержимое. Для ускорения и упрощения этой процедуры появились различные формы сокращенной записи содержания документов - аннотации, рефераты, каталоги. Но во всех этих случаях при отборе документов по их сокращенным описаниям используется естественный язык. Хорошо известны такие "недостатки" языковых знаков, как омонимия, синонимия, многозначность. Точное значение многих слов можно понять только в контексте. Это препятствует использованию естественного языка для фиксации и отождествления понятийной информации. Поэтому формальные системы, предназначенные для хранения документальной информации с целью последующего поиска, потребовали создания специальных информационных языков. Информационно-поисковые языки представляют собой знаковые системы со своим алфавитом, лексикой, грамматикой и правилами пользования. Все искусственные языки, так или иначе, создавались и создаются на основе естественных языков. История автоматизированных информационно-поисковых систем исчисляется полувеком. Типичная ИПС первых лет - это человеко-машинная система, где анализ и описание содержания документов (индексирование) выполняется вручную, а поиски проводятся машиной. Первоначально основу ИПС составляли информационно-поисковые языки (ИПЯ), основным элементом которых являются дескрипторные словари и тезаурусы. Сегодня, однако, большинство работающих ИПС относится к классу вербальных систем бестезаурусного типа, когда индексационные термины выбираются непосредственно из текстов документов. Актуальность данной работы объясняется тем, что лавинообразный рост объемов электронной документальной информации, ее видовое, тематическое и языковое разнообразие являются как причиной кризиса современного информационного поиска, так и стимулом его совершенствования.
Целью данной работы является знакомство и понятие языка предметных рубрик.
Вывод
Информационно-поисковая система (ИПС) - это упорядоченная совокупность документов и информационных технологий, предназначенных для хранения и поиска информации. ИПС можно представить как базу данных с огромным количеством различной информации, которая, как правило, требует разработки собственного информационно-поискового языка, адекватного для каждой предметной области. Для общения пользователя с компьютером и оказания ему помощи в поиске нужной информации среди ее большого потока разрабатываются специальные искусственные языки, так как естественный язык в этом качестве пока не может быть использован без специального предварительного преобразования. В естественном языке присутствуют: синонимия, омонимия и полисемия, избыточность, субъективность и другие свойства, препятствующие его автоматизированной обработке. А информационно-поисковый язык - это искусственный язык, в котором отсутствуют недостатки естественного языка, но он строится на его принципах и понятен пользователю. Основное назначение ИПЯ - установить принадлежность того или иного документа к определенной группе понятий. Одним из таких ИПЯ является язык предметных рубрик, предназначенный для облегчения тематического поиска. Предметные рубрики, входящие в состав ИПЯ, отражают наименование отраслей знания, научных дисциплин, процессов, явлений, событий, личных имен (персоналий) и т.д. Предметная рубрика должна соответствовать определенным требованиям и правилам. И от того, насколько правильно составлена, оформлена и сгруппирована предметная рубрика зависит выполнение поисково-информационной функции языка.
Список литературы
1. Демидова С.Е. Предметные указатели к документам: учебно-методическое пособие для студентов вузов - М.: ИПО Профиздат, 2002