Система семантического разбора для естественно-языковых текстов - Дипломная работа

бесплатно 0
4.5 120
Понятие семантики; обзор и анализ существующих средств семантического разбора естественно-языковых текстов. Разработка алгоритма работы системы на основе семантического анализа, его реализация на языке программирования; проектирование интерфейса системы.


Аннотация к работе
1. Обзор и анализ существующих средств семантического разбора естественно-языковых текстов 2. Постановка задачи 3 Анализ алгоритмов для системы обработки естественно-языковых текстов 3.1 Графематический анализ 3.1.1 Входные и выходные данные 3.1.2 Графематические дескрипторы 3.1.3Деление на предложения 3.2 Морфологический анализ 3.3 Синтаксический анализ 3.4 Семантический анализ 4. Использования н-граммного словаря msr 5.1 Методы хранения словарей 5.2 Описание морфоанализатора для словаря 5.3 Таблицы кодирования постоянных грамматических характеристик 5.4 Таблицы кодирования переменных грамматических характеристик 6. Алгоритмы анализа системы 6.1 Алгоритм графематического разбора 6.2 Алгоритм морфологического разбора 6.3 Алгоритм синтаксическо-семантического разбора и построения сети 7. Структура программного обеспечения 9. Листинг программы ВВЕДЕНИЕ Наиболее естественным для человека способом общения является естественный язык (ЕЯ), Предлагаемые методы ориентированы на решение поставленной проблемы путем создания русскоязычных онтологических информационных систем. Данные исследования постепенно приближаются к такому уровню обработки текста, на котором уже возможно представление текста не просто в виде последовательности слов, а единым целым, обладающим неким смыслом, что уже соответствует человеческому восприятию. Это могут быть базы данных с таблицами и полями, электронные формы и карточки объектов, тексты программ на формальных языках и инструкции (программы) в машинных кодах. Лингвистический процессор выполняет обработку полнотекстовой информации в соответствии со следующими этапами изображенных на рисунке 1.1. Как это можно использовать? информационно-аналитическая система АРИОН позволяет эффективно решать Таблица 3.8 Макросинтаксические дескрипторы CS? ставится на конце УП, тип которого не определен CS ставится на конце простого УП HDNG ставится на конце заголовка CS_AUX ставится на конце УП, заключенного в скобки CS_PRNT ставится на конце УП, заканчивающегося на двоеточие DOC ставится на нулевой строке графематической таблицы 3.1.3 Деление на предложения Этот алгоритм включен в модуль графематики, поскольку на результаты его работы опирается макросинтаксический анализ. Например, у словоформы стали две интерпретации: - {СТАЛЬ, C, но, (жр,ед,рд, жр,ед,дт, жр,мн,им, жр,мн,вн) }; - {СТАТЬ, Г, нп,св, (мн,дст,прш)}. Формат записи семантического отношения следующий: R(А,B), где R - название семантического отношения, А - зависимый член отношения, B - управляющий член отношения.
Заказать написание новой работы



Дисциплины научных работ



Хотите, перезвоним вам?