Технологии преобразования текста в системах машинного перевода - Реферат

бесплатно 0
4.5 118
Идея перевода текста, речи без использования труда людей-переводчиков. Системы машинного перевода на основе модели "большого словаря со сложной структурой". Системы машинного перевода на основе модели "Смысл Текст". Формальная грамматика языка.

Скачать работу Скачать уникальную работу
Аннотация к работе
Министерство общего и профессионального образования ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ РЕФЕРАТ по теме: «ТЕХНОЛОГИИ ПРЕОБРАЗОВАНИЯ ТЕКСТА В СИСТЕМАХ МАШИННОГО ПЕРЕВОДА»Перевод имеет долгую историю. Своими корнями он восходит к тем далеким временам, когда праязык начал распадаться на отдельные языки и возникла необходимость в людях, знавших несколько языков и способных выступать в роли посредников при общении представителей разных языковых общин. Переводом называется процесс и результат создания на основе исходного текста на одном языке равноценного ему в коммуникативном отношении текста на другом языке. При этом коммуникативная равноценность, или эквивалентность, понимается как такое качество текста перевода, которое позволяет ему выступать в процессе общения носителей разных языков в качестве полноправной замены исходного текста (оригинала) в сфере действия языка перевода [1]. В XX веке эти мечты начинают становиться реальностью: в век глобализации, когда книги и тексты на иностранном языке, деловая электронная переписка с иностранными компаниями или же личная переписка с жителями других стран, просмотр передач и фильмов на другом языке перестали быть чем-то из ряда вон выходящим, активно развиваются системы машинного перевода (СМП), т.к. объемы текстов, которые необходимо переводить ежедневно становятся все больше, так же, как и количество языков, с которых требуется получать перевод.Соответственно программы, которые осуществляют перевод, носят название систем машинного перевода (СМП). HAMT (Human-assisted machine translation) - машинный перевод при участии человека; MAHT (Machine-assisted human translation) - перевод, осуществляемый человеком с использованием компьютера. Первая группа СМП подразумевает то, что в компьютер вводится текст на одном языке, а затем он выдает полностью корректно переведенный текст на другом языке. После того, как компьютер сделал перевод, люди опять-таки редактируют «грубый» машинный перевод, делая текст на выходном языке правильным.Уивер писал: «I have a text in front of me which is written in Russian but I am going to pretend that it is really written in English and that it has been coded in some strange symbols. All I need to do is strip off the code in order to retrieve the information contained in the text» («У меня перед глазами текст, написанный по-русски, но я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков. Аналогия между переводом и дешифрованием была естественной в контексте послевоенной эпохи, если учитывать успехи, которых достигла криптография в годы Второй мировой войны. Тьюрингом знаменитый тест на разумность («тест Тьюринга») фактически заменил вопрос о том, может ли машина мыслить, на вопрос о том, может ли машина общаться с человеком на естественном языке таким образом, что тот не в состоянии будет отличить ее от собеседника-человека. В январе 1954 года на машине IBM-701 была продемонстрирована первая система машинного перевода IBM Mark II, базирующуяся на словаре из 250 слов и 6 синтаксических правил и обеспечивающую перевод 49 заранее отобранных предложений.Модель «большого словаря со сложной структурой» (входной текст переводится с помощью специальных алгоритмов с использованием больших словарей, описывающих широкий круг морфологических явлений: фонетическая реализация слова, акцентная парадигма, большое число словообразовательных аффиксов);Чтобы успешно работать, система машинного перевода включает в себя, во-первых, двуязычные словари, снабженные необходимой информацией (морфологической, относящейся к формам слова, синтаксической, описывающей способы сочетания слов в предложении, и семантической, т.е. отвечающей за смысл), а во-вторых - средства грамматического анализа, в основе которых лежит какая-нибудь из формальных, т.е. строгих, грамматик. На первом этапе осуществляется ввод текста и поиск входных словоформ (слов в конкретной грамматической форме, например дательного падежа множественного числа) во входном словаре (словаре языка, с которого производится перевод) с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря). В школьном грамматическом разборе предложения мы опираемся и на значения слов, составляющих предложение (например, отыскивая подлежащее, задаем вопрос: о чем говорится в предложении?).

План
СОДЕРЖАНИЕ

ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ

ВВЕДЕНИЕ

1. МАШИННЫЙ ПЕРЕВОД

2. ИСТОРИЯ РАЗВИТИЯ МАШИННОГО ПЕРЕВОДА

3. КОНЦЕПЦИИ РАЗВИТИЯ СИСТЕМ МАШИННОГО ПЕРЕВОДА

3.1 Системы машинного перевода на основе модели «большого словаря со сложной структурой»

3.1.1 Формальные операции

3.1.2 Translation Memory

3.2 Системы машинного перевода на основе модели «Смысл Текст»

ЗАКЛЮЧЕНИЕ

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

Повысить уникальность
своей работы







Хотите, перезвоним вам?