Компьютерная лингвистика как область знаний, связанная с решением задач автоматической обработки информации, представленной на естественном языке. Основные типы корпусов текстов. Анализ достоинств и недостатков автоматизированного машинного перевода.
Аннотация к работе
Компьютерная лингвистика - область знаний, связанная с решением задач автоматической обработки информации, представленной на естественном языке.Компьютерная лингвистика - сравнительно молодая наука, зародилась в середине 40-х годов ХХ века вместе с первыми идеями по машинному переводу. Во многом история происхождения такой науки, как компьютерная лингвистика отождествляется с историей создания систем МП.. Корпус языка - собрание текстов на данном языке в электронной форме, специальным образом обработанное («аннотированное»), так, чтобы исследователь языка мог быстро и в полном объеме найти в корпусе интересующую его информацию о языке. Затем данный текст обрабатывается компьютером, анализируется и выводится на том языке, который нужен в данный момент пользователю. При данном виде машинного перевода человек является центральным звеном процесса перевода, а компьютер является своего рода инструментом, позволяющим человеку быстрее и эффективнее переводить текст.