Математические методы описания речевых сигналов (корреляционные и спектральные характеристики, функция распределения, пик-фактор) - Курсовая работа

бесплатно 0
4.5 242
Обоснование подходов к разработке математических моделей речевых сигналов. Детерминированный подход к построению математической модели (сигнала, содержащего вокализованные участки речи), основанной на теории модуляции. Коэффициенты разработанной модели.

Скачать работу Скачать уникальную работу

Чтобы скачать работу, Вы должны пройти проверку:


Аннотация к работе
В настоящее время аутентификация личности по голосу широко применяется в системах контроля доступа к информационным или материальным ресурсам на основе биометрических параметров. Системы аутентификации личности по голосу обладают рядом преимуществ относительно других биометрических систем, основными из которых являются сравнительно небольшая стоимость и относительная простота практической реализации. Точность идентификации (установление) и верификации (подтверждение) личности по голосу в существенной мере определяется адекватностью математической модели, описывающей речевой сигнал. Увеличение точности в рамках существующих методов описания речевых сигналов, если и возможно, то приводит, как правило, к значительному увеличению количества параметров модели, что влечет за собой увеличение систематической ошибки и времени обработки поступивших данных, а также снижение значимости таких параметров для характеристики индивидуальных особенностей голоса человека. Обоснованию подходов к разработке математических моделей речевых сигналов посвящено сравнительно немного научных публикаций.При идентификации (установлении) личности человека необходимо выбрать из имеющейся базы данных эталонов тот эталон, на который заявитель максимально похож, при этом нужно принять решение: заявитель наиболее похож на конкретную персону (чей эталон находится в базе данных) или заявитель не соответствует ни одной из персон (имеющихся в базе данных). В последнее время все более часто находят применение биометрические системы аутентификации (верификации и идентификации) личности [1], принцип работы которых основывается на анализе различных персональных физиологических характеристик людей, таких как форма и размеры руки, отпечаток пальца, голос, параметры зрачка и сетчатки глаза, форма и размеры лица и т. д. Много было сделано, но, пожалуй, и на сегодняшний день можно считать, что вопрос далеко не закрыт, хотя именно в последнее время были достигнуты значительные успехи: уже многие годы голосовые команды являются одной из возможных опций программного обеспечения персональных компьютеров, появление функций распознавания речи уже обычное дело в ряде текстовых процессоров, системы распознавания речи работают там, где требуется оказание справочных услуг и в системах безопасности. Методы цифровой обработки сигналов обычно осуществляют преобразование, очистку и трансформацию звукового сигнала в цифровой формат данных и другие представления, которые могут непосредственно обрабатываться системой распознавания речи. Кроме того, системы распознавания и синтеза речи затрагивают вопросы лингвистики, в которой заложены фундаментальные концепции и принципы распознавания речи и понимания языка.Рассчитаем коэффициенты предложенной математической модели (3) речевого сигнала. Длительность импульса (время произнесения парольной фразы) была задана = 0,3 с, при данном интервале дискретизации речевой сигнал имеет N = 1800 отсчетов. Для определения коэффициентов модели (3) в качестве степени несоответствия модели и оригинала была принята ошибка модели между коэффициентами корреляции [безразмерная величина] центрированного речевого сигнала и значениями нормированной автокорреляционной функции [безразмерная величина] математической модели (3): где Для модели (3) речевого сигнала получим для 0??: - Оценка частоты основного тона f0 определяется как значение аргумента, при котором наблюдается наименьшее значение невязки в диапазоне частот здесь тестовая невязка (ошибка): где - коэффициент корреляции тестовой математической модели речевого сигнала, применяемый для оценки частоты основного тона, упрощенный вид которого: С использованием данной оригинальной методики становится возможным без применения сложных алгоритмов вычисления получить высокоточную оценку частоты основного тона речевого сигнала (содержащего вокализованные участки речи).Требованиям к математическим моделям речевых сигналов с точки зрения обеспечения высокой надежности систем аутентификации по голосу: высокой точности, минимальному количеству относительно просто рассчитываемых существенных параметров, в наибольшей мере удовлетворяют модели, основанные на физических принципах акустической теории речеобразования и описывающие вокализованные сегменты речи.

План
Содержание

Введение

Глава 1. Современные подходы к математическим методам описания речевых сигналов

Глава 2. Экспериментальная часть

Заключение

Список литературы

Введение
В настоящее время аутентификация личности по голосу широко применяется в системах контроля доступа к информационным или материальным ресурсам на основе биометрических параметров. Системы аутентификации личности по голосу обладают рядом преимуществ относительно других биометрических систем, основными из которых являются сравнительно небольшая стоимость и относительная простота практической реализации.

Развитие систем аутентификации личности по голосу лимитируется уровнем их надежности. Точность идентификации (установление) и верификации (подтверждение) личности по голосу в существенной мере определяется адекватностью математической модели, описывающей речевой сигнал. Увеличение точности в рамках существующих методов описания речевых сигналов, если и возможно, то приводит, как правило, к значительному увеличению количества параметров модели, что влечет за собой увеличение систематической ошибки и времени обработки поступивших данных, а также снижение значимости таких параметров для характеристики индивидуальных особенностей голоса человека. Высокий уровень ошибок систем аутентификации по голосу обуславливается также трансформацией голоса, вследствие болезней, особых эмоциональных состояний, возрастных изменений и т. д.

Обоснованию подходов к разработке математических моделей речевых сигналов посвящено сравнительно немного научных публикаций. Это объясняется, прежде всего, сложной полиинформативной и полимодуляционной структурой речевого сигнала, а также большим количеством информации, используемой при анализе и синтезе математических моделей речевых сигналов. Однако, сегодня прогресс микроэлектроники наряду с применением цифровых технологий преобразования речевых сигналов дает возможность оперировать большими объемами информации, обрабатывая ее с приемлемой скоростью. При этом зачастую цифровые речевые технологии опережают речевую науку.

Наибольшую точность описания имеют математические модели, соответствующие физике процессов, поэтому при разработке математической модели речевого сигнала необходима ее адекватность акустической теории речеобразования. Таким образом, повышение надежности проектируемых систем аутентификации возможно за счет разработки и использования новых методов построения адекватных математических моделей речевых сигналов.

Объект работы - речевые сигналы.

Предмет работы - математические методы описания речевых сигналов.

Цель работы - исследование математических методов описания речевых сигналов. Цель работы определяет задачи исследования: рассмотреть современные подходы к математическим методам описания речевых сигналов;

провести эксперимент.

Работа состоит из введения, 2 глав, заключения и списка литературы.

Вывод
Требованиям к математическим моделям речевых сигналов с точки зрения обеспечения высокой надежности систем аутентификации по голосу: высокой точности, минимальному количеству относительно просто рассчитываемых существенных параметров, в наибольшей мере удовлетворяют модели, основанные на физических принципах акустической теории речеобразования и описывающие вокализованные сегменты речи.

Математическая модель речевого сигнала позволяет компактно описать вокализованные сегменты речи, учитывая временную вариацию спектра речевого сигнала соответствующей модуляцией амплитуд и частот модели. Существенными параметрами математической модели речевого сигнала, характеризующими уникальность голоса, являются усредненная частота основного тона и амплитуды несущих гармоник.

Характеристикой речевого сигнала для расчета существенных параметров его детерминированной математической модели служит автокорреляционная функция, а для стохастической модели - функция корреляции, число значимых отсчетов которых следует выбирать исходя из уровня ослабления автокорреляционной функции относительно ее наибольшего значения и из условия захождения функции корреляции в доверительные границы нулевых значений, полученных по методу Бартлетта.

Список литературы
1. Сорокин В. Н. Фундаментальные исследования речи и прикладные задачи речевых технологий // Речевые технологии. 2008. № 1. С. 18-48.

2. Назаров М. В., Прохоров Ю. Н. Методы цифровой обработки и передачи речевых сигналов. М.: Радио и связь, 1985. - 176 с.

3. Сорокин В. Н. Синтез речи. М.: Связь, 1992. - 392 с.

4. Ролдугин С. В. Голубинский А. Н., Вольская Т. А. Модели речевых сигналов для идентификации личности по голосу // Радиотехника. 2002. № 11. С. 79-81.

5. Stylianou Y. Apply the harmonic plus noise model in concatenative speech synthesis // IEEE Trans. on Speech and Audio Process. 2001. Vol. 9. № 1. Р. 21-29.

6. Zavarehei E., Vaseghi S., Yan Q. Noisy speech enhancement using harmonic-noise model and codebook-based post-processing // IEEE Trans. on Speech and Audio Process. 2007. Vol. 15. № 4. Р. 1194-1203.

7. Рассказова С. И., Власов А. И. Метод формантного анализа на основе вейвлет-преобразования в системах распознавания речи // IX Научно-техническая конференция «Наукоемкие технологии и интеллектуальные системы»: Сборник трудов. Москва: МГТУ им. Н. Э. Баумана, 2007. С. 38-43.

8. Якушев Д. И., Скляров О. П. Моделирование гласных звуков // Акустический журнал. 2003. Т. 49. № 4. С. 567-569.

9. Голубинский А. Н. Методика расчета параметров модели речевого сигнала в виде импульса АМ-колебания с несколькими несущими частотами, для случая модуляции суммой гармоник // Системы управления и информационные технологии. 2008. № 4.1. С. 156-161.

10. Аграновский А. В., Леднов Д. А., Репалов С. А. Метод текстонезависимой идентификации диктора на основе индивидуальности произношения гласных звуков // Акустика и прикладная лингвистика: Ежегодник РАО. 2002. Вып. 3. С. 103-115.

11. Патент РФ № 2230375: МПК G 10 L 15/00, G 10 L 17/00. Метод распознавания диктора и устройство для его осуществления / П. В. Лабутин, А. Н. Раев, С. Л. Коваль - № 2002123509/09; заявл. 03.09.02; опубл. 10.06.04.

12. Чистович Л. А., Венцов А. В., Грамстрем М. П. и др. Физиология речи. Восприятие речи человеком. М.: Наука, 1976. - 388 с.

Размещено на

Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность
своей работы


Новые загруженные работы

Дисциплины научных работ





Хотите, перезвоним вам?