Створення економічного алгоритму блокової калманівської фільтрації мовного сигналу неперетинними блоками довільної довжини. Розробка завадостійкого ітераційного підходу до оцінювання авторегресивних параметрів мови, заснованого на векторному квантуванні.
Аннотация к работе
Автореферат дисертації на здобуття наукового ступеня кандидата фізико-математичних наук РОЗРОБКА АДАПТИВНИХ МЕТОДІВ КОРЕКЦІЇ МОВНИХ СИГНАЛІВ НА ОСНОВІ АВТОРЕГРЕСИВНОЇ МОДЕЛІ ГОЛОСОВОГО ТРАКТУНауковий керівник: Калюжний Олександр Якович, доктор фізико-математичних наук, державне науково-виробниче підприємство "Дельта", заступник директора з наукової роботи. Офіційні опоненти: Вовк Ігор Володимирович, доктор фізико-математичних наук, професор, Інститут гідромеханіки НАН України, провідний науковий співробітник; Захист відбудеться "20" травня 2004 р. о 14 годині на засіданні спеціалізованої вченої ради Д 26.196.01 в Інституті гідромеханіки НАН України за адресою: 03057, м. З дисертацією можна ознайомитись у бібліотеці Інституту гідромеханіки НАН України за адресою: 03057, м.Успішний розвиток даних технологій став можливим завдяки впровадженню зручної у практичній реалізації авторегресивної (АР) моделі утворення мови, що враховує фізичні механізми генерування мовних сигналів. Таким чином, розробка нових, більш ефективних методів відновлення мовного сигналу є актуальним науково-технічним завданням, що має важливе прикладне значення. Метою роботи є розробка нових, більш ефективних методів корекції мовного сигналу, що враховують моделі його генерації і узгоджуються з принципами побудови сучасних систем цифрової обробки мови. Розроблено алгоритм блокової калманівської фільтрації мовних сигналів, що забезпечує: обробку даних неперетинними блоками довільної довжини; врахування властивості квазістаціонарності мови; зниження похибки фільтрації у порівнянні з традиційним підходом до калманівської фільтрації мовних сигналів; зниження кількості обчислень у порівнянні з традиційним фільтром Калмана (ФК); узгодженість з розробленою процедурою оцінювання АР параметрів мови та архітектурою сучасних обчислювальних засобів. Запропоновано ефективний алгоритм обчислення лінійних спектральних частот (ЛСЧ) мовних сигналів, заснований на розробленому в роботі методі повного чисельного розвязання трансцендентних рівнянь.У Вступі розкривається сутність і стан науково-технічної проблеми, показана її значимість для підвищення ефективності систем обробки мовних сигналів, а також дана загальна характеристика роботи. У першому розділі "Огляд робіт, присвячених системам цифрової корекції мовних сигналів" показана актуальність задачі корекції спотворених мовних сигналів і подано огляд існуючих методів розвязання цієї проблеми. Відповідно до даної моделі, мовний сигнал утворюється в результаті проходження збуджувального процесу через авторегресивний (полюсний) фільтр , робота якого описується у різницевій формі: , (1) де - АР коефіцієнти, що визначають форму голосового тракту; Запропонований блоковий ФК був перевірений експериментально стосовно задачі очищення мовних сигналів від шуму, записаного усередині салону автомобіля при різних відношеннях сигнал/шум (ВСШ). Показано, що розроблений алгоритм забезпечує економію обчислювальних витрат від 2.4 до 6 разів (при різних характерних порядках мовного сигналу та шуму) у порівнянні з традиційним ФК і від 5.5 до 11.1 разів у порівнянні з двонаправленим ФК, що використовує майбутні спостереження.