Компьютерная лингвистика и ее исследования. Проблемы автоматической обработки текстовой информации, представленной на естественных языках. Моделирование процесса понимания смысла текстов. Точность в памяти ЭВМ декларативных и процедурных средств.
Министерство образования и науки Российской Федерации Владивостокский государственный университет экономики и сервиса филиал в г. Реферат по дисциплине "Основы стандартизации и компьютерное делопроизводство"Но развитие информационных технологий происходит весьма неравномерно: если современный уровень вычислительной техники и средств связи поражает воображение, то в области смысловой обработки информации успехи значительно скромнее. Эти успехи зависят, прежде всего, от достижений в изучении процессов человеческого мышления, процессов речевого общения между людьми и от умения моделировать эти процессы на ЭВМ. Когда речь идет о создании перспективных информационных технологий, то проблемы автоматической обработки текстовой информации, представленной на естественных языках, выступают на передний план.В современном мире при проведении различных лингвистических исследований все более активно используется компьютерная лингвистика.Компьютерная лингвистика - это область знаний, связанная c решением задач автоматической обработки информации, представленной на естественном языке. Центральными научными проблемами компьютерной лингвистики являются проблема моделирования процесса понимания смысла текстов (перехода от текста к формализованному представлению его смысла) и проблема синтеза речи (перехода от формализованного представления смысла к текстам на естественном языке). Эти проблемы возникают при решении ряда прикладных задач и, в частности, задач автоматического обнаружения и исправления ошибок при вводе текстов в ЭВМ, автоматического анализа и синтеза устной речи, автоматического перевода текстов с одних языков на другие, общения с ЭВМ на естественном языке, автоматической классификации и индексирования текстовых документов, их автоматического реферирования, поиска документов в полнотекстовых базах данных. К декларативной части относятся словари единиц языка и речи, тексты и различного рода грамматические таблицы, к процедурной части - средства манипулирования единицами языка и речи, текстами и грамматическими таблицами. Так в ряде стран(Россия, США, Япония, и др.) построены экспериментальные и промышленные системы машинного перевода текстов с одних языков на другие, построен ряд экспериментальных систем общения с ЭВМ на естественном языке, ведутся работы по созданию терминологических банков данных, тезаурусов, двуязычных и многоязычных машинных словарей (Россия, США, Германия, Франция и др.), строятся системы автоматического анализа и синтеза устной речи (Россия, США, Япония и др.), ведутся исследования в области построения моделей естественных языков.Построение лингвистических процессоров, обеспечивающих общение пользователей с автоматизированными интеллектуальными информационными системами (в частности, с экспертными системами) на естественном языке, или на языке, близком к естественному; Эта комплексная задача может быть условно расчленена на три задачи - задачи орфографического, синтаксического и семантического контроля текстов. В дальнейшем это понятие трансформировалось и термином "индексирование" стали называть процесс перевода описаний документов и запросов с естественного языка на формализованный, в частности, на язык "поисковых образов". Поисковые образы документов стали, как правило, оформляться в виде перечней ключевых слов и словосочетаний, отражающих их тематическое содержание, а поисковые образы запросов - в виде логических конструкций, в которых ключевые слова и словосочетания соединялись друг с другом логическими и синтаксическими операторами. Здесь также приходится выделять ключевые слова и словосочетания из текста и нормализовать слова, входящие в текст запроса.Вскоре после этого в промышленно развитых странах мира были начаты исследования и разработки, направленные на создание систем машинного перевода (систем МП). Из достижений компьютерной лингвистики следует выделить, прежде всего, систему под названием RETRANS. Первая промышленная версия этой системы была разработана в 1993 году и стала использоваться в ряде государственных учреждений России, Франции, США и Англии. Система, работающая в среде текстового процессора MS Word-2000. Вторая модификация системы может служить эффективным средством общения с системой Internet для лиц, знающих русский язык, но не знающих английского, или, наоборот, знающих английский язык, но не знающих русского.В интерактивном режиме работы пользователь имеет возможность просматривать все варианты перевода слов и словосочетаний содержащиеся в словарях, изменять их приоритет, добавлять новые переводные эквиваленты, а также выполнять другие операции над промежуточными результатами перевода. Система, работающая в среде текстового процессора MS Word 2000 (система Word Vista). Система массового обслуживания, устанавливаемая на сервере IIS 4.0 и выше и используемая в режиме удаленного доступа стандартными Windows-клиентами (например, MS Word, MS Internet Explorer и любыми другими приложениями, способными копировать текст в "Буфер Обмена
План
Содержание
Введение
1. Компьютерная лингвистика в лингвистических исследованиях
1.1 Понятие компьютерной лингвистики
1.2 Задачи компьютерной лингвистики
2. Современные интерфейсы компьютерной лингвистики
2.1 Описание системы Web Vista
3. Гипертекстовые системы
3.1 Элементы типологии гипертекста
Заключение
Список использованных источников
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы