Роботожурналистика в русскоязычном контексте: анализ современного состояния и перспективы развития - Магистерская работа

бесплатно 0
4.5 186
Основные этапы развития роботожурналистики. Принципы восприятия аудиторией текстов, сгенерированных роботами. Морфологические и синтаксические особенности языков. Рекомендации по разработке алгоритмов автоматической генерации русскоязычных текстов.


Аннотация к работе
Федеральное государственное автономное образовательное учреждение высшего образования Роботожурналистика в русскоязычном контексте: анализ современного состояния и перспективы развития направлению подготовки 42.04.02 Журналистика Выполнил: студент магистратуры2.3 Морфологические особенности русского, английского и немецкого языков3.1 Общие сведения Формирование коллекции текстовЕжеквартально роботы Associated Press пишут более 3500 текстов, основанных на данных финансовых отчетов различных компаний. По сравнению с данными 2012 года, в период проведения предыдущих выборов главы государства, материалы авторов The Washington Post принесли газете лишь 15% от трафика, обеспеченного алгоритмом. Осенью 2017 года информационное агентство ТАСС заявило о запуске алгоритма, генерирующего заметки о событиях в области финансов и экономики. роботожурналистика автоматический генерация текст Ключевые функции, которые исследователи отнесли к «плюсам», - увеличение скорости и объемов производства материалов, а также возможность передать алгоритмам рутинную работу. Зарубежные исследователи перешли к проведению опросов и экспериментов, направленных на оценку качества заметок, написанных роботами-журналистами (Джанг Дж., Сонг Х., Ким Ю., Им Х., Ох С., Клерволл К.), в то время как российское научное сообщество продолжает исследовать возможности пишущих роботов и последствия их применения в редакциях СМИ.Одно из последних достижений искусственного интеллекта в области работы с текстами - умение отвечать на вопросы. В феврале 2018 года компания Microsoft совместно с Оборонным научно-техническим университетом Китая (NUDT) представила систему, выполняющую задачу поиска ответа по тексту. Система представляет собой алгоритм, обученный на опубликованной части базы SQUAD, сформированной исследователями Стэнфордского университета в 2016 году и состоящей из небольших фрагментов англоязычных статей Википедии. Статьи разбиты на абзацы, к каждому из которых заданы вопросы, и там же, во фрагментах, содержатся ответы. Задача - придумать вопрос и указать ответ на него, кликнув на начало и конец подходящего фрагмента текста.Синонимичны ей термины алгоритмическая и роботизированная журналистика, значение которых «сводится к указанию на использование особых автоматизированных инструментов («роботов», «ботов», и в том числе «алгоритмов») для выполнения журналистских функций по сбору и обработке информации, а также для написания готовых текстов без участия человека».Во-первых, она применяет статистические модели бейсбола для выявления знаковых событий: «Используя счет, алгоритм воссоздает динамику игры, выделяет ключевые моменты, ключевых игроков, ищет соответствующие цитаты и генерирует из этих элементов текст. Скорость создания заметки зависела от способа передачи данных: или робот получал информацию автоматически, посредством современных судейских систем, внедренных сразу в нескольких лигах, или репортер через интерфейс сайта вручную вводил результаты матча, после чего начиналась генерация текста. После двухлетнего перерыва редакция газеты Los Angeles Times возобновила работу над проектом об убийствах, впервые применяя алгоритмы автоматической генерации текстов. Кроме того, в 2010 году компания STATSHEET, ранее специализирующаяся на статистическом анализе футбольных, баскетбольных и матчах по другим видам спорта, сообщает о запуске платформы STATSHEET Network, алгоритмы которой автоматически генерировали заметки о проведенных играх. Применение программного продукта в работе редакции Forbes позволило увеличить объемы производства текстов (по сравнению с заметками, написанными журналистами вручную), что привело к расширению охвата аудитории, увеличению трафика на сайте и рекламных доходов.Это программное обеспечение или компьютерные системы, которые автоматически производят из репрезентативной вычислительной информации понятный человеку (естественный) язык.Алгоритм выгружает данные с определенного сайта или базы, выполняет обработку с точки зрения статистики и анализа данных и заменяет переменные на слова или числа, полученные в ходе обработки массива. Предположим, речь пойдет о скачке курса валют, наиболее успешной игре за всю историю существования спортивного клуба, автомобильном коллапсе на дорогах или аномальном похолодании в регионе. В большинстве случаев шаблонные алгоритмы основаны на простых грамматических и синтаксических правилах, генерируют тексты на одном языке и адаптированы под определенную тему. К 2016 году в мире насчитывалось 11 специализированных компаний, разрабатывающих сервисы автоматической генерации текстов с достаточно понятным в использовании интерфейсом (Automated Insights, Narrative Science, Retresco, Text-On, Tencent, Arria, Syllabs и другие). В частности, алгоритм AX Semantics выгружает и обрабатывает данные, затем формирует структуру текста на основе словарей и правил (знания получены в процессе машинного обучения) и полностью генерирует заметку с учетом показателей, выявленных при статистическом анализе.

План
Содержание

Введение

Глава 1.Теоретические основы роботожурналистики

1.1 История развития роботожурналистики

1.2 Основные термины

1.3 Этапы развития автоматизированной журналистики

1.4 Математические модели и методы роботожурналистики

1.4.1 Шаблонный тип алгоритмов

1.4.2 Нейросетевые алгоритмы

1.4.3 Требования к разработке роботов-журналистов

1.5 Лингвистические особенности роботожурналистики

1.6 Примеры алгоритмов автоматической генерации текстов

1.7 Восприятие аудиторией текстов, сгенерированных автоматически

1.7.1 Методология исследования Клерволла
Заказать написание новой работы



Дисциплины научных работ



Хотите, перезвоним вам?