Система автоматичної оцінки якості машинного перекладу, що базується на алгоритмі метрики BLEU - Дипломная работа

бесплатно 0
4.5 172
Переваги систем машинного перекладу, методи його автоматичної оцінки. Розробка інтелектуальної системи автоматичної оцінки якості машинного перекладу з використанням метрики BLEU. Проблема кореляції автоматичної та експертної оцінки машинного перекладу.

Скачать работу Скачать уникальную работу

Чтобы скачать работу, Вы должны пройти проверку:


Аннотация к работе
У міру того як розширюється інформатизація сучасного суспільства при переході до суспільства майбутнього, зростає значення компютерної (обчислювальної, інженерної) лінгвістики, науки, що знаходиться на стику глибоко людяної, гуманітарної науки лінгвістики (мовознавства), що вивчає закони розвитку і користування могутнім засобом мислення і комунікації мовою, - і компютерного знання, за допомогою якого машині передається все більша частина інтелектуальної праці людини. Людина звикла автоматизовувати процеси, щоб полегшити виконання роботи або отримання необхідної інформації. Системи машинного перекладу (СМП) текстів з одних природних мов на інші моделюють роботу людини-перекладача. Однак незважаючи на усі успіхи і переваги машинного перекладу, якість перекладу залишається на досить низькому рівні в порівнянні з перекладами, зробленими людиною.Програмний комплекс системи машинного перекладу (СМП) включає в себе двомовні словники, забезпечені граматичною інформацією (морфологічною, синтаксичною та семантичною), необхідної для передачі перекладних відповідників, а також засоби граматичного аналізу. Програми перекладу (системи машинного перекладу) зявилися у відповідь на потреби користувачів в оперативному перекладі різної комерційної, технічної або INTERNET-інформації, яка подана в електронному вигляді. Крім перекладу з іноземних мов, важливе значення має переклад з української (російської) мови іншими мовами, зокрема англійською. Аналізуючи програми машинного перекладу, потрібно відразу уточнити, що вимоги до них не повинні бути такими ж, як і до перекладу, який виконує людина. Переклад, зроблений компютером, поки що далеко не ідеальний, але текст, отриманий в результаті роботи електронного перекладача, дозволяє в більшості випадків зрозуміти суть документа, який перекладався.Найбільш відповідні слова з вихідного мови просто замінюються словами мови перекладу. Існує твердження, що для успішного вирішення проблеми машинного перекладу, необхідно вирішити проблему розуміння тексту природною мовою. Як правило, метод перекладу заснований на правилах використовує символічне уявлення (посередника), на основі якого створюється текст на мові перекладу. Системи машинного перекладу засновані на правилах - загальний термін, який позначає системи машинного перекладу на основі лінгвістичної інформації про вихідний і перекладному мовах в основному отримані з (двомовних) словники і граматики, що охоплюють основні семантичні, морфологічні, синтаксичні та закономірності кожної мови. Незважаючи на свою примітивність цей підхід дає непогані результати при перекладі між близькоспорідненими мовами, де відсутність глибинного аналізу речень компенсується схожістю синтаксичних структур мов.Якість машинного перекладу в першу чергу залежить від обсягу словника і вірному підбору тематичного спрямування перекладного тексту у відповідності з обраним словниковим запасом бази даних: значну роль відіграє обсяг перекладної інформації, в якій можуть бути обєднані різні тематики, і - синоніми слів, при цьому, можуть бути підібрані алгоритмом програми не зовсім вірно; від старанності складання і перевірки роботи алгоритмів аналізу та синтезу приписуваного лексичним одиницям тексту, а також від ефективності програмного забезпечення залежить і якість. Важливу роль для правильності і якості машинного перекладу грає і грамотність складеного (вихідного для переказу) тексту, з вірним підбором слів і словосполучень в передачі бажаного і описуваного образу, сюжету, події чи дії. Говорячи про якість машинного перекладу, слід зазначити, що вона безпосередньо залежить від складності тексту, мовних пар, а також його стилістичної спрямованості. А тексти технічного характеру, за наявності спеціалізованих словників і налаштування програми перекладу під особливості тексту, переводяться задовільно і потребують лише незначною редакторської правки. Найкращого якості перекладу досягають тексти, складені в офіційно-діловому стилі, а також тексти технічної спрямованості (всякого роду інструкції, описи, керівництва) і максимально формалізовані.Ним користуються в тих випадках, коли важливіше зрозуміти зміст документа, ніж перекласти текст відповідно до літературних критеріїв. Машинний переклад обіцяє стати важливим інструментом для розвитку міждержавної торгівлі, тому що він спроможний значно спростити і прискорити одержання інформації про товари, що випускаються в інших країнах. Сучасні системи перекладу пропонують користувачам приблизно однаковий спектр можливостей: - редагування тексту в багатомовному режимі з розбиттям екрана так, що в кожному вікні знаходиться текст відповідною мовою; Це дуже легко оцінити: якщо ви звертатаєтеся до професійних перекладачів, доводиться платити за кожну сторінку перекладеного тексту (залежно від регіону і рівня кваліфікації перекладача сторінка перекладу буде коштувати від 5 до 20 доларів), або ви наймаєте штатного перекладача, яким треба платити зарплату.

План
Зміст

Вступ

1. Огляд предметної області

1.1 Машинний переклад

1.1.1 Підходи до реалізації систем машинного перекладу

1.1.2 Якість машинного перекладу

1.1.3 Основні переваги систем машинного перекладу

1.2 Методи оцінки машинного перекладу

1.2.1 Субєктивні методи оцінки

1.2.3 Інженерно-лінгвістичні методи оцінки

1.2.4 Програмні методи оцінки

1.3 Постановка задачі

2. Розробка інтелектуальної системи автоматичної оцінки якості машинного перекладу з використанням метрики BLEU

2.1 Специфіка автоматичної оцінки машинного перекладу

2.2 Розповсюджені метрики оцінки машинного перекладу

2.3 Проблема кореляції автоматичної та експертної оцінки машинного перекладу

2.4 Оцінка якості перекладу PROMT і Pragma за метрикою BLUE

2.4.1 Характеристики системи машинного перекладу PROMT

2.4.2 Характеристики системи машинного перекладу Pragma

2.5 Програмна реалізація

2.6 Організація експерименту

2.7 Результати

3. Техніко-економічне обгрунтвання розробки

3.1 Опис обєкта розробки

3.2 Опис програмного продукту

3.3 Оцінка ринку збуту

3.4 Розрахунок витрат на розробку програмного продукту

3.4.1 Визначення потреби в матеріальних ресурсах

3.4.2 Витрати на оплату праці

3.4.3 Розрахунок додаткової заробітної плати

23.4.4 Розрахунок амортизації

3.4.5 Відрахування на соціальні заходи

3.4.6 Загальновиробничі витрати

3.4.7 Адміністративні витрати

3.4.8 Витрати на збут

3.4.9 Калькуляція собівартості

3.5 Фінансовий план

3.6 Висновки по розділу 3

4. Охорона праці і навколишнього середовища

4.1 Загальні питання

4.2 Виробнича санітарія

4.3 Параметри мікроклімату

4.4 Виробниче освітлення

4.5 Вимоги до рівнів шуму та вібрації

4.6 Вимоги щодо рівня неіонізуючих електромагнітних випромінювань, електростатичних та магнітних полів

4.7 Електробезпека

4.8 Пожежна безпека

4.9 Охорона навколишнього середовища

4.10 Висновки

Висновки

Список джерел інформації

Додаток

Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность
своей работы


Новые загруженные работы

Дисциплины научных работ





Хотите, перезвоним вам?