Планирование диалога для речевого интерфейса системы управления интерактивной робототехнической системой - Статья

бесплатно 0
4.5 199
Механический и речевой интерфейс при взаимодействии человека и робота. Функциональная структурная схема речевого интерфейса в составе робототехнической системы. Анализ решения задачи управления диалогом. Прогнозирование последующих действий оператора.


Аннотация к работе
К таким случаям относится использование роботов при выполнении ответственных и сложных задач (спасательные операции, медицинское обслуживание и др.), а также использование роботов в повседневной деятельности человека (робот-официант, робот-компаньон и др.) В первом случае использование речевого интерфейса продиктовано необходимостью разнесения каналов передачи информации для человека-оператора, а во втором - необходимостью обеспечить максимальную естественность взаимодействия для человека. Это обстоятельство диктует необходимость наложения ограничений на речевое взаимодействие, и привидению его к форме управляемого диалога между человеком и модулем речевого взаимодействия робота. Ниже рассмотрен ряд вопросов, связанный с задачами понимания естественно-языковой (ЕЯ) команды и управления диалогом. Модуль понимания речи представляет команду в виде фрейма, структура которого основана на вербоцентрическом подходе и более подробно также описана в нашей предыдущей работе. В зависимости от результатов заполнения слотов фрейма-команды, она может быть передана из речевого интерфейса в модуль планирования операций, или - в случае возникновения проблем - использована для формирования уточняющего запроса к оператору.Наличие описанных выше моделей диалога повышает эффективность речевого интерфейса, так как дает возможность прогнозирования последующих действий оператора в рамках речевого взаимодействия.

Введение
При взаимодействии человека и робота основными видами интерфейса являются механический и речевой. При всей простоте первого, существует рад приложений, когда речевое взаимодействие является более предпочтительным. К таким случаям относится использование роботов при выполнении ответственных и сложных задач (спасательные операции, медицинское обслуживание и др.), а также использование роботов в повседневной деятельности человека (робот-официант, робот-компаньон и др.) В первом случае использование речевого интерфейса продиктовано необходимостью разнесения каналов передачи информации для человека-оператора, а во втором - необходимостью обеспечить максимальную естественность взаимодействия для человека. В последнем случае такая естественность делает задачу создания речевого интерфейса чрезмерно сложной, изза высокой вариативности реализаций речевой деятельности человека. Под вариативностью здесь понимается языковой процесс, отражающий способность говорящего человека к экспрессии, к свободе выражения своих мыслей и чувств в звучащей речи. Это обстоятельство диктует необходимость наложения ограничений на речевое взаимодействие, и привидению его к форме управляемого диалога между человеком и модулем речевого взаимодействия робота. Такие ограничения относятся как способу реализации единиц диалога, так и к определению конкретной предметной области, для которой создается сам робот, и которой - следовательно - ограничивается лексическое наполнение языка.

В результате, формируется близкий в естественному проблемно-ориентированный язык. Используя этот язык, человек-оператор формулирует команды управления на верхнем уровне. Задача планирования действий из элементарных операций возлагается уже на робота, а точнее - робототехническую систему. На нее же возлагается и задача управления диалогом, что позволяется называть ее интерактивной робототехнической системой (ИРТС). Ниже рассмотрен ряд вопросов, связанный с задачами понимания естественно-языковой (ЕЯ) команды и управления диалогом.

2. Структура речевого интерфейса

Функциональная структурная схема речевого интерфейса в составе ИРТС представлена на рисунке 1.

Рис. 1. Функциональная схема речевого интерфейса.

На вход системы поступает речевая команда на проблемно-ориентированном языке. Подробное описание структуры и принципа формирования команд можно найти в [1]. После обработки в модуле распознавания речи данные передаются в модуль понимания речи в виде последовательности отдельных слов. Модуль понимания речи представляет команду в виде фрейма, структура которого основана на вербоцентрическом подходе и более подробно также описана в нашей предыдущей работе. В зависимости от результатов заполнения слотов фрейма-команды, она может быть передана из речевого интерфейса в модуль планирования операций, или - в случае возникновения проблем - использована для формирования уточняющего запроса к оператору. В модуль формирования ответа передается фрейм-запрос, на основе которого строится ЕЯ-запрос оператору. Этот запрос воспроизводится модулем реализации ответа.

3. Задача управления диалогом

Как уже отмечалось выше, определенной предметной области функционирования робота соответствует ограниченная модель мира. Наличие у робота определенных функций в рамках такой модели обуславливает конечное число целей коммуникации человек-ИРТС. Требования к структуре командного языка управления в совокупности с вышеуказанными факторами сводят возможное многообразие реализаций диалога к нескольким сценариям. Под сценарием диалога здесь понимается совокупность состояний диалога от начального до конечного (целевого) и переходов между ними. В основе исходного состояния диалога лежит первая команда человека-оператора как инициирующее действие для начала фактической работы ИРТС. Целевым состоянием диалога, в данном случае, является обретение информации, необходимой ИРТС для выполнения действий в соответствии с коммуникативным замыслом оператора.

В зависимости от полноты и корректности данных, предоставляемых оператором в виде команды, необходимость в ведении диалога может и не возникать. В этом случае ИРТС получает достаточно данных для немедленного планирования и выполнения операции. С точки зрения построения диалога, такая ситуация является вырожденной. То же самое относится и к командам безусловного выполнения (например, "стоп"). Еще один вид операций, характерный для ИРТС, работающей в недоопределенной среде, это гностические операции. Он также может сопровождаться выдачей речевых команд, но диалогичность в данном случае отсутствует, поскольку основным источником внешней информации является сенсорная система робота. Команды оператора - даже в речевой форме - являются принципиально схожими с другими способами задания действий, включая механические, и не представляет интереса в данном контексте. Таким образом, диалогу в данной задаче отводится роль корректирующего средства. В этом случае возможно развитие диалога по одному из следующих сценариев: (1) уточнение состава команды, (2) уточнение операции. Данные сценарии возникают в случае некорректности задания команды на лингвистическом и ситуативном уровне, соответственно. Тогда в первом случае речь идет ситуации, когда полученная команда является "узнаваемой" для модуля понимания речи на синтаксическом уровне, но предоставленных в составе команды данных не достаточно для перехода на семантический уровень с последующим планированием операции. В этом случае соответствующая информация передается в модуль управления диалогом (см. рисунок 1). В модуле управления диалогом в зависимости от конкретного сценария формируется набор данных, необходимых для формулировки запроса к человеку-оператору для непосредственного указания на недостающую информацию.

В случае некорректности на ситуативном уровне, команда является абсолютно достаточной с точки зрения синтаксиса и семантики, однако существуют ситуативные противоречия при планировании соответствующей операции (например, объект перемещения недоступен для манипулятора).

Для формализации двух указанных сценариев в данной работе использована фреймовая модель, как позволяющая полное описание типовой ситуации при некотором ограничении неопределенности естественно-языкового диалога. В этом случае сам сценарий описывается прото-фреймом, а конкретная реализация диалога фиксируется в виде фрейма-экземпляра. Так, для сценария "уточнение состава команды" прото-фрейм имеет следующий вид: ", , , , , ". Возможность включения в структуру фрейма процедурной информации позволяет - в случае неудовлетворительного уточнения оператора - организовать цикл по заполнению содержимого слотов 1-4 фрейма-сценария. интерактивная оператор робот речевой интерфейс

Для сценария "уточнение операции" прото-фрейм выглядит следующим образом: ", , , , , ". Здесь понятие конфликт обозначает противоречие между реальной ситуацией, в рамках которой задана команда, и ситуацией, необходимой для выполнения команды, как это понимается, например, в [2]. Со стороны оператора в этом случае могут последовать два действия: подтверждение команды на выполнение или задание новой команды. В первом случае оператор уверен в корректности задания. Во втором случае новая команда будет направлена на выполнение действий по разрешению противоречия.

Применительно к задаче управления диалогом с учетом планирования операций следует оговориться о необходимости введения двух представлений команды: внешнем (вводится оператором) и внутреннем. Последнее используется непосредственно при планировании операции и помимо данным, указанных оператором в виде команды, содержит информацию об условиях выполнимости операции, заложенных на этапе создания системы. Эти данные не зависят от конкретной реализации ЕЯ-команды и относятся к "родовым" свойствам каждой операции. Например, для команды переместить необходимо, чтобы объект перемещения не содержал других предметов на верхней грани.

В подобных задачах недостатком аппарата фреймов, как отмечается, например, в [3], является отсутствие хронологической информации и невозможность учета истории диалога. В этом случае возникает необходимость введения внешнего менеджера диалога, задачей которого является выход из тупиковых веток диалога, если оператор, например, не способен предоставить необходимую уточняющую информацию. В этом случае, по инициативе системы, могут быть предложены возможные готовые варианты ответа, задание другой команды или переход в режим гностических операций. В общем случае можно сказать, что задачей менеджера диалога является ведение фрейма-сценария на основе содержащейся в последнем процедурной информации.

Вывод
Наличие описанных выше моделей диалога повышает эффективность речевого интерфейса, так как дает возможность прогнозирования последующих действий оператора в рамках речевого взаимодействия. В самом простом случае прогнозирование может быть основано на данных, удовлетворяющих уточняющему запросу системы, имеющихся в самой системе, но не указанных оператором при инициации диалога. Перечень наиболее вероятных ответов можно использовать, например, в качестве "опорной" информации на этапе распознавания речевого сигнала.

Список литературы
1. Морозов Д.Н. Фреймовое представление естественно-языковых запросов в задачах управления мобильным манипуляционным роботом // Труды IV Международной научно-практической конференции "Интегрированные модели и мягкие вычисления в искусственном интеллекте" - М.: Физматлит, 2007. - С.333-339.

2. Ющенко А.С. Интеллектуальное планирование в деятельности роботов. - Мехатроника, 2005. - №3. - С.5-18.

3. Ли И.В. Локальный и глобальный уровни управления диалогом // Труды международной конференции "Диалог 2007", С.382-387.

Размещено на .ru
Заказать написание новой работы



Дисциплины научных работ



Хотите, перезвоним вам?