Обучение с нуля грамматики связей русского языка - Статья

бесплатно 0
4.5 90
Рассмотрение вероятностной модели языка, основанной на грамматике связей и самообучающегося алгоритма, позволяющего устанавливать связи между словами в предложении. Перплексивность, сглаживание параметров, лингвистические ограничения. Качество модели.


Аннотация к работе
В данной работе изучаются вероятностные грамматики связей, относительно новый контекстно-свободный формализм (относительно грамматик непосредственно составляющих [Chomsky, 1957] и грамматик зависимостей [Mel"chuk, 1979]), которые впервые были предложены в работе [Sleator et al., 1991], а применимость для русского языка была показана в работе [Протасов, 2005]. Формализм грамматики связей содержит n-грам модели как подкласс и одновременно допускает наличие дальних связей [Lafferty et al., 1992]. В данной работе рассмотрена концепция грамматики связей, ее вероятностная модель и обучающий алгоритм. Соединенные коннекторы образуют связи и граф, где узлы - слова, а дуги - связи с названиями коннекторов. Если всему языку грамматики назначить полную вероятность, равную 1, тогда каждое предложение языка будет иметь свою вероятность появления, и мы сможем оценивать, какова вероятность того, что данная последовательность слов и связей между ними принадлежит языку.В данной работе был рассмотрен метод получения вероятностной грамматики связи только лишь на основе анализа корпуса языка. Оригинальная модель языка [Lafferty et al., 1992] была упрощена до небольшого числа дизъюнктов и одного типа коннекторов.
Заказать написание новой работы



Дисциплины научных работ



Хотите, перезвоним вам?