Состояние проблемы автоматического распознавания речи. Технические средства формирования аудиоданных. Распознавание и синтез речи компьютером. Поиск ключевых слов. Характеристика программного продукта. Расчет времени на программирование программы.
Аннотация к работе
Распознавание речи человека является одной из сложных научно-технических задач. В настоящее время пользователями вычислительных машин и средств, оснащенных вычислительными машинами, становятся люди, не являющиеся специалистами в области программирования. Проблема речевого управления возникла, кроме того, в связи с тем, что в некоторых областях применения речь стала единственно возможным средством общения с техникой (в условиях перегрузок, темноты или резкого изменения освещенности, при занятости рук, чрезвычайной сосредоточенности внимания на объекте, который не позволяет отвлечься ни на секунду, и т.д.). Проблема реализации речевого диалога человека и технических средств - актуальная задача современной кибернетики. Задача машинного распознавания речи привлекает внимание специалистов уже очень давно. Затем определяется, какое слово, какому сочетанию фонем соответствует, и строится соответствующий словарь. По мере развития компьютерных систем становится все более очевидным, что использование этих систем намного расширится, если станет возможным использование человеческой речи при работе непосредственно с компьютером, и в частности станет возможным управление машиной обычным голосом в реальном времени, а также ввод и вывод информации в виде обычной человеческой речи. В настоящее время всё более актуальным становится управление роботом при помощи голосовых команд. Однако создание программного обеспечения для голосового управления промышленным роботом предусматривает проведение экспериментов во время разработки программы на всех этапах разработки. Для уменьшения затрат на создание программного обеспечения целесообразно разработать программу, которая обеспечит трёхмерное моделирование голосового управления промышленным роботом, что приводит к необходимости проведения экспериментов в условиях производства лишь на последнем этапе разработки программного обеспечения. ГЛАВА 1 ТЕОРЕТИЧЕСКАЯ ЧАСТЬ Темой данного проекта является голосовое управление осветительными приборами с помощью микроконтроллера ArduinoUno. Его задачами является анализ методов цифровой обработки звуковых сигналов, анализ систем распознавания речи, разработка программного обеспечения для распознавания команд управления микроконтроллером ArduinoUno, анализ возможностей доработки данного проекта. Существует два существенно различающихся режима работы: с настройкой на голос определенного диктора и без такой настройки. Схема процесса ввода звука (Рисунок 1). распознавание речь компьютер аудиоданный Рисунок 1 - Схема ввода речевых сообщений в ЭВМ Звуковой сигнал формируется и передается в пространстве в виде звуковых волн. Как следует из этой характеристики, усредненная спектральная плотность мощности имеет максимум в диапазоне 250-500Гц и затухает со скоростью, равной 8-10дБ на октаву (при удвоении частоты). Технологии шумоочистки речевых сигналов классифицируются по типу искажения: 1) BABBLENOISE - технология подавления шума толпы 2) MUSICNOISE - технология подавления шума музыки 3) NONSTATIONARYNOISE - технология подавления нестационарных шумов 4) PULSENOISE - технология подавления импульсных шумов 5) TONALNOISE - технология подавления тональные помех 6) WIDEBANDNOISE - технология подавления широкополосных шумов 7) GSMHINDRANCE - технология подавления наводки мобильных телефонов 8) CLIPPING - клиппированиесигнала 9) REVERBERATION&NOISE - реверберация Выбор аgпаратных средств/ В качестве центрального контроллера был выбран Arduino, так как это недорогой микропроцессор с открытой архитектурой, способный считывать входные данные в виде напряжения на своих аналоговых контактах.