Анализ критериев качества IP-телефонии путём аналитического обзора параметров сети. Показатели качества; оценка качества восстановления речи IP-телефонии; сопоставление оценки в системах с пакетной коммуникацией. Принципы расчёта надёжности IP-сети.
Некоммерческое акционерное общество «АЛМАТИНСКИЙ УНИВЕРСИТЕТ ЭНЕРГЕТИКИ И СВЯЗИ» Кафедра «Телекоммуникационных систем»______________________ Специальность «Радиотехники, электроники и телекоммуникации»__________________________________________ Допущен к защите МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ пояснительная записка Тема «Оценка параметров качества IP - телефонии»_____ ______________________________________________________ ______________________________________________________ ______________________________________________________Тема диссертации «Оценка параметров качества IP - телефонии»____________ ____________________________________________________________________ утверждена Ученым советом университета №___от «___»__________________ Срок сдачи законченной диссертации «___»______________________________ Цель исследования состоит в оценке критериев качества IP-телефонии путем_ аналитического обзора параметров сети__________________________________ ____________________________________________________________________ ____________________________________________________________________ Оценка параметров качества в IP телефонии __ 3.Аналитическое оценка качества восстановления речи в IP-телефонии _3.1 Расчет надежности IP - сети Перечень графического материала (с точным указанием обязательных чертежей)__Рисунок 1.1-Показатели, влияющие на качество IP-телефонии Рисунок 2.4 - Сравнительные характеристики значений джиттера для разных топологий Рисунок 3.1 - зависимость отношения сигнал/шум от относительного значения шага квантованияКроме того, ни R, ни даже базовый коэффициент Ro (который в той же рекомендации ITU-T G.107 в начале определяется как отношение сигнал/шум по мощности в децибелах) не выражаются в децибелах, как и ряд остальных (поправочных) коэффициентов в определении рейтинга R Е-модели. Отсюда очевидно следует, что R представляет результирующее отношение сигнал/шум по мощности и его значения должны соответствовать значениям результирующего отношение сигнал/шум по критерию ОСШ. Когда отбраковывается один пакет длительностью 1пак или последовательность из \ пакетов длительностью \ Іпак, образуются перерывы в речевом сообщении, подлежащем реконструкции на приемной стороне. Таким образом аналитическое оценивание качества восстановления речи при ІР-телефонии (при учете влияния отбраковки речевых пакетов) состоит в определении распределения Р$) и определения отношения сигнал/шум по формуле (3.22) с использованием формулы (3.18) при значениях 1пак<5 мс и формулы (3.21) при стандартных размерах речевого пакета. Этот коэффициент учитывает снижение отношения сигнал/шум, вносимое низкоскоростными кодеками, а также за счет потерь пакетов[9]: le, eff ?le??95?le?? P ? Bpl, (3.23)1) В результате аналитического оценивания качества восстановления речи в IP-телефонии по критериям MOS и Е-модели установлено, что E-модель использует весьма грубую аппроксимацию зависимости отношения сигнал/шум от вероятности потери пакета. 3)В результате сопоставления оценок качества IP-телефонии методами аналитического моделирования по критериям MOS и E-модели и по критериям отношения сигнал/ шум и разборчивости установлено, что для высокоскоростных кодеков использование критериев MOS и Е-модели приводит к завышению практически в три раза оценки допустимого значения вероятности потери пакета. В оценках MOS границу между удовлетворительным и хорошим качеством представляет 3,5 балла (соответствующее значению R = 68 рейтинга Е-модели) При этом использование Е-модели приводит к реализации условия этой границы (Rj = 69) при значении вероятности потери пакета 0,1 (по критерию ОСШ получаем в этом случае категорию «удовлетворительное» на границе с «неудовлетворительным»). Вероятность безотказной работы P(t) - это вероятность того, что в заданном интервале времени (0, t) в системе или элементе не произойдет отказ. Число работоспособных в течение времени (0,t) элементов определяется из соотношения: N(t) ? N(0)?n(0,t), (3.35) где n(0,t) - число отказавших за время (0,t) элементов.
Введение
Неудовлетворительное качество каналов связи и загрузки в сети приводит к частым потерям речевых пакетов, что, как следствие, вызывает ухудшение качества слышимости, а иногда и полную невозможность звукового общения.
Все равно на на втором конце возможно возникновение недлительных задержек в речи изза потери речевых пакетов в IP-сетях изза невозможности передачи. Развитие новых телекоммуникационных технологий и, в частности, IP-телефонии, связано с пакетной передачей речевых данных. Изменение речевых данных, созданное потерей речевых пакетов, зависит от типа кодеков, применяемых в шлюзах IP - телефонии. От потери пакетов качество связи в большей степени зависит при использовании сжатых кодеков по сравнению с несжатыми кодеками. В IP - телефонии отличного качества разрешенный уровень потери речевых пакетов может варьироваться 1-3%, причем меньшее значение относится к сжатым кодекам. Для сравнения качества оценки передаваемой речевых пакетов разработаны различные методы.
Одним из этих способов является MOS (Mean Opinion Score), описывающий усредненный показатель качества и представлении в рекомендациях ITU-T Р.800 и Р.830 [8].
Аналогичным trialбом оценки является использование единиц рейтинга R (Quality Rating) по сто балльной системе. Международным союзом электросвязи была предложена R- фактор, описанная в рекомендации ITU-T G.107 [9], для расчета рейтинга R. Между MOS и R существует зависимость, представленная в [9].
Стандартным способом является, использующий критерий отношения сигнал/шум (ОСШ) на выходе воспроизводящего устройства и разборчивости.
Существуют разногласия, относительно как расчета показателя R в рекомендациях ITU-T, так и по отношению существенной несогласованности оценок качества пакетной передачи речи, предоставляемых критериями MOS и R - фактором и критериями ОСШ и разборчивости.
Цель работы состоит в оценке критериев качества IP-телефонии путем аналитического обзора параметров сети. Для достижения данной цели в работе необходимо сделать следующее: - информационный обзор критериев оценивания качества речи; - сделать экспериментальные исследования путем рассмотрения параметров качества, влияющих на качества IP - телефонии;
- дать аналитическую оценку качества восстановления речи IP - телефонии;
- сопоставить оценки качества ІР-телефонии в системах с пакетной коммутацией;
- рассчитать параметры качества при оценке восстановления речи в в ІР- телефонии;
- сделать расчет надежности IP - сети.
1 Информационный обзор критериев оценивания качества речи и их приложений
1.1 Аналитический обзор показателей качества IP-телефонии
Обычные телефонные сети генерируют электрические сигналы с гарантированной полосой пропускания, достаточной для передачи сигналов голосового спектра. При фиксированной пропускной способности передаваемого сигнала цена единицы времени связи зависит от удаленности и расположения точек вызова и места ответа.
Сети с коммутацией пакетов не обеспечивают гарантированной пропускной способности, так как не обеспечивают гарантированного пути между точками связи.
Для приложений, где роли не играет порядок и интервал прихода пакетов, например, e-mail, время задержек между отдельными пакетами не имеет решающего значения. IP- телефония является одной из областей передачи данных, где важна рост передачи сигнала, которая обеспечивается современными способами кодирования и передачи информации, а также увеличением пропускной способности линков, что приводит к возможности достойной конкуренции IP-телефонии с традиционными телефонными сетями.
Компонентами качества IP-телефонии являются: - качество речи, включающий;
- диалог - возможность юзера устанавливать связь и беседовать с другим юзером в реальном времени и дуплексном режиме;
- разборчивость - тональность и чистота речи; - эхо - слышимость собственной речи;
- уровень - громкость речи.
Качество сигнализации, объясняющее: - соединение вызова - скорость установления соединения и успешного доступа времени;
- завершение вызова - скорость разъединения и время отбоя;
- DTMF - пределение и фиксирование сигналов мультичастотного набора номера. Явления, которые влияют на качество IP-телефонии, могут быть разделены на два типа: - показатели качества IP-сети;
- максимальная пропускная способность - максимальное количество избыточных и полезных данных, которая она передает;
- пауза - интервал времени, требуемый для передачи пакета через сеть; джиттер - задержка между последовательными пакетами;
- потеря пакета - пакеты или данные, потерянные при передаче через сеть. Показатели качества шлюза: - требуемая полоса пропускания - различные дешифраторам требуются различные полосы пропускания. К примеру, вокодер G.723 требует полосы 16,3 кбит/с для каждого речевого канала;
- задержка - время, необходимое цифровому сигнальному процессору DSP или другим устройствам обработки для кодирования и декодирования речевого сигнала;
- буфер джиттера - сохранение пакетов данных до тех пор, пока все пакеты не будут получены и можно будет передать в требуемой последовательности для минимизации джиттера;
- потеря пакетов - потеря пакетов при сжатии или передаче в эхо оборудовании IP- телефонии;
- подавление эхо - механизм для подавления эхо, возникающего при передаче по сети; управление уровнем - возможность регулировать громкость речи.
Рисунок 1.1- Показатели, влияющие на качество IP-телефонии
1.1.1 Параметры сети влияющие на показатели качества IP-телефонии
Задержка. Задержка создает неудобство при ведении беседы, приводит к прерыванию разговоров и появлению эхо. Эхо возникает в случае, когда отраженный речевой сигнал вместе с сигналом от удаленного конца возвращается опять в ухо говорящего. При этом эхо становится трудной проблемой, когда задержка в петле передачи больше, чем 50 мс. Так как эхо является проблемой качества, системы с пакетной коммутацией речи должны иметь возможность управлять эхо и использовать эффективные способы эхо подавления.
Перекрытие разговоров затруднение диалога становятся серьезным вопросом качества, когда задержка в одном направлении передачи превышает 250 мс. Можно выделить следующие источники задержки при пакетной передачи речи из конца в конец.
Задержка накопления: эта задержка обусловлена необходимостью сбора кадра речевых отсчетов, выполняемая в речевом кодере. Величина задержки определяется категорией речевого кодера и изменяется от небольших величин (0,125 мкс) до нескольких миллисекунд. Например, стандартные речевые кодеры имеют следующие длительности кадров: - G.729 CS-ACELP (8 кбит/с) - 10 мс;
Задержка обработки: процесс кодирования и сбора закодированных отсчетов в пакеты для передачи через пакетную сеть создает определенные задержки. Задержка кодирования или обработки обуславливается от времени работы процессора и используемого категорией алгоритма обработки. Для уменьшения загрузки пакетной сети обычно несколько кадров речевого кодера объединяются в один пакет. Например, три кадра кодовых слов G.729, соответствующих 30 мс речи, могут быть объединены для уменьшения размера одного пакета.
Сетевая задержка: задержка обусловлена протоколами и физической средой, используемыми для передачи речевых данных, а также буферами, используемыми для удаления джиттера пакетов на приемной стороне. Сетевая задержка зависит от емкости сети и процессов передачи пакетов в сети.
Рисунок 1.2 - Общие задержки в сети IP-телефонии
Время задержки при передаче речевого сигнала можно отнести к одному из трех уровней: - начальный уровень до 200 мс - отличное качество речи. Для сравнения, в телефонной сети общего пользования допустимы задержки до 150-200 мс;
- второй уровень до 400 мс - хорошим качество речи. Но если сравнивать с качеством связи по сетям СТОП, то разница будет видна. Если задержки постоянно удерживается на верхней границе 2-го уровня (на 400 мс), то не рекомендуется использовать эту связь для деловых переговоров;
- третий уровень до 700 мс - приемлемое качество связи для ведения неделовых переговоров. Такое качество связи возможно также при передаче пакетов по спутниковой связи.
Качество IP-телефонии попадает под 2-3 уровни, причем невозможно конкретно сказать, что тот или иной провайдер IP-телефонии работает по второму уровню, так как задержки в сети Интернет меняются. Более точно можно сказать о провайдерах IP- телефонии, работающих по выделенным каналам. Они попадают под 1-2 уровни. Также необходимо учитывать задержки при кодировании или декодировании голосового сигнала. Средние суммарные задержки при использовании IP-телефонии обычно находятся в пределах 150-250 мс.
В сети Интернет задержки пакетов в целом зависят от времени. Кривая этой зависимости имеет большой динамический диапазон и скорость изменения. Заметные изменения времени распространения могут произойти на протяжении одного непродолжительного сеанса связи, а колебания времени передачи могут быть в диапазоне от десятков до сотен миллисекунд и даже превышать секунду.
Важно отметить тот факт, что задержки в сетях с коммутацией пакетов влияют не только на качество передачи речевого трафика в реальном времени. Не менее важно и то, что данные задержки в определенных случаях могут нарушить правильный ритм функционирования телефонной сигнализации в цифровых трактах Т1/Е1 на стыке голосовых шлюзов с оборудованием коммутируемых телефонных сетей.
Причиной этого можно назвать тот факт, что набор рекомендаций H.323 в момент своего появления в 1997 г. был ориентирован на мультимедийные приложения, осуществляющие аудио и видеоконференцсвязь через сети IP. Данное решение позволяло значительно снизить стоимость таких систем по сравнению с их аналогами, работающими в сетях традиционной телефонии с коммутацией каналов. В процессе выделения IP-телефонии в самостоятельное направление и развития ее до услуги операторского уровня возникла необходимость соединения IP-шлюзов с телефонными станциями СТОП по цифровым трактам E1/T1. При этом, шлюзы осуществляют взаимодействие с цифровыми АТС, используя стандартные механизмы телефонной сигнализации Q.931, интерпретированные через команды H.225 и передающиеся в IP-сети с использованием протокола TCP. Согласно рекомендации Q.931, при установлении телефонного соединения значения временных задержек между фазами выполнения команд сигнализации строго регламентированы. Однако, при интерпретации в IP-шлюзах команд телефонной сигнализации Q.931 стеком H.225/ТСР, задержки, возникшие на пути прохождения сигнала, увеличивают заданные временные интервалы между командами Q.931, и в большинстве случаев нарушают целостность работы данного протокола. Хотя версия 2 набора рекомендаций H.323 в фазе 2 предусматривает процедуру H.323v2 Fast Connect, ускоряющую обработку команд Q.931 стеком H.225/ТСР, задержки IP-канала, особенно характерные для инфраструктуры Интернет, могут заведомо превышать все допустимые значения временных интервалов протокола Q.931. Данное обстоятельство можно расценивать как еще один аргумент в пользу использования выделенных каналов при построении сетей IP-телефонии.
Джиттер. Когда речь или данные разбиваются на пакеты для передачи через IP-сеть, пакеты часто прибывают в пункт назначения в различное время и в разной последовательности. Это создает разброс времени доставки пакетов (джиттер). Джиттер приводит к специфическим нарушениям передачи речи, слышимым как трески и щелчки. Различают три формы джиттера: - джиттер, зависимый от данных (Data Dependent Jitter - DDJ) происходит в случае ограниченной полосы пропускания или при нарушениях в сетевых компонентах;
- искажение рабочего цикла (Duty Cycle Distortion - DCD) обусловлено задержкой распространения между передачей снизу вверх и сверху вниз;
- случайный джиттер (Random Jitter - RJ) - является результатом теплового шума.
На рисунке 1.3 приведены гистограммы джиггера пакетов в локальной сети и в сети Интернет с различными скоростями работы, показывающие эмпирические распределения вероятностей задержек. На оси абсцисс отложена относительная задержка, характеризующая реальное положение пакета в последовательности на временной оси по отношению к идеальному в предположении, что первый пакет пришел без задержки.
Величины возникающих задержек и их вероятности важны для организации процедуры обработки и выбора параметров обработки. Понятно, что временная структура речевого пакетного потока меняется. Возникает необходимость организации буфера для превращения пакетной речи, отягощенной нестационарными задержками в канале, возможными перестановками пакетов, в непрерывный естественный речевой сигнал реального времени. Параметры буфера определяются компромиссом между величиной запаздывания телефонного сигнала в режиме полнодуплексной связи и показателем потерянных пакетов. Потеря пакетов является другим серьезным негативным явлением в IP- телефонии.
Потеря пакетов. Потерянные пакеты в IP-телефонии нарушают речь и создают искажения тембра. В существующих IP-сетях все голосовые кадры обрабатываются как данные. При пиковых нагрузках и перегрузках голосовые кадры будут отбрасываться, как и кадры данных. Однако кадры данных не связаны со временем и отброшенные пакеты могут быть успешно переданы путем повторения. Потеря голосовых пакетов, в свою очередь, не может быть восполнена таким способом и в результате произойдет неполная передача информации. Предполагается, что потеря до 5% пакетов незаметна, а свыше 10-15% - недопустима. Причем данные величины существенно зависят от алгоритмов компрессии/декомпрессии.
На рисунке 1.3 представлены гистограммы потерь пакетов. По оси абсцисс отложено число подряд потерянных пакетов. Анализ гистограммы показывает, что наиболее вероятны потери одного, двух и трех пакетов. Потери больших пачек пакетов редки.
Рисунок 1.3 - Зависимость количества потерянных пакетов от частоты событий
Существенно, что потеря большой группы пакетов приводит к необратимым локальным искажениям речи, тогда как потери одного, двух, трех пакетов можно пытаться компенсировать.
Интуитивно ясно, что с повышением трафика возрастают задержки и потери в телефонном канале. В условиях ограниченных пропускных способностей это проявляется не только при интегральном увеличении загрузки каналов, например, в часы наибольшей нагрузки, но и при увеличении потока локального источника информации.
Взаимосвязь методов обеспечения качества IP-телефонии, показателей качества сети и качества вызова представлена на рисунке 1.4.
Процесс обработки речи в IP-телефонии.
Для обеспечения качественной передачи речевых сигналов в IP-телефонии необходима их следующая обработка.
1) Удаление всех нежелательных составляющих из входного аудиосигнала. После оцифровки речи необходимо удалить эхо из динамика в микрофон, комнатное эхо и непрерывный фоновый шум (например, шум от вентиляторов), а также отфильтровать шумы переменного тока на низких частотах звукового спектра.
Рисунок 1.4 - Блок-схема обеспечения качества IP-телефонии
Эффективное эхо подавление и уменьшение шумов абсолютно необходимо в любой конфигурации с «открытым микрофоном» и с громкоговорителем на базе персонального компьютера (ПК) для СТОП и IP-телефонии. Эти функции все в большей мере реализуются аудио компонентами ПК, так что сама система IP-телефонии может их и не иметь. Шлюзам IP-телефонии требуется выполнять меньший объем предварительной обработки, нежели конечным решениям, потому что УАТС и телефонная сеть обеспечивают фильтрацию и уменьшение шумов.
2) Устранение пауз в речи; распознавание остаточного фонового шума (внешних шумов) и кодирование для восстановление на дальнем конце; то же самое для опознаваемых сигналов. Паузы лучше всего полностью подавлять на ближнем конце. Для сохранения окружающих звуков необходимо смоделировать фоновые шумы, чтобы система на дальнем конце могла восстановить их для слушателя. Сигналы многочастотного набора номера DTMF и другие сигналы можно заменить на короткие коды для восстановления на дальней стороне (или для непосредственной обработки). Вероятные проблемы: изза того, что функция подавления пауз активизируется, когда громкость речи становится ниже определенного порога, некоторые системы обрезают начала и концы слов (в периоды нарастания и снижения уровня речи).
3) Сжатие голосовых данных. Сжать оцифрованный голос можно разными способами. В идеале решения, используемые для IP-телефонии, должны быть достаточно быстрыми для выполнения на недорогих цифровых сигнальных процессорах DSP, сохранять качество речи и давать на выходе небольшие массивы данных.
4) «Нарезание» сжатых голосовых данных на короткие сегменты равной длины, их нумерация по порядку, добавление заголовков пакетов и передача. Хотя стек протоколов TCP/IP поддерживает пакеты переменной длины, их использование затрудняет достижение устойчивой и предсказуемой межсетевой маршрутизации в голосовых приложениях. Маршрутизаторы быстро обрабатывают небольшие пакеты и рассматривают обычно все передаваемые по одному и тому же IP-адресу пакеты одного размера одинаковым образом. В результате пакеты проходят по одному маршруту, поэтому их не надо переупорядочивать.
5) Прием и переупорядочивание пакетов в адаптивном «буфере ресинхронизации» для обеспечения интеллектуальной обработки потерь или задержек пакетов. Главной целью здесь является преодоление влияния переменной задержки между пакетами. Решение этой проблемы состоит в буферизации достаточного числа поступающих пакетов (при отложенном их воспроизведении) с тем, чтобы воспроизведение было непрерывным, даже если время между поступлением пакетов сильно разнится. Лучшие продукты для IP- телефонии моделируют производительность сети и регулируют размер буфера ресинхронизации соответствующим образом - уменьшая его (сокращая задержку перед воспроизведением), когда сеть ведет себя предсказуемым образом, и увеличивая в противоположной ситуации.
1.2 Способы кодирования речевой информации
Одним из важных факторов эффективного использования пропускной способности IP-канала, является выбор оптимального алгоритма кодирования/декодирования речевой информации - кодека.
Все существующие сегодня типы речевых кодеков по принципу действия можно разделить на три группы: - кодеки с импульсно - кодовой модуляцией (ИКМ) и адаптивной дифференциальной импульсно - кодовой модуляцией (АДИКМ), появившиеся в конце 50-х годов и использующиеся сегодня в системах традиционной телефонии. В большинстве случаев, представляют собой сочетание АЦП/ЦАП.
- кодеки с вокодерным преобразованием речевого сигнала возникли в системах мобильной связи для снижения требований к пропускной способности радиотракта. Эта группа кодеков использует гармонический синтез сигнала на основании информации о его вокальных составляющих - фонемах. В большинстве случаев, такие кодеки реализованы как аналоговые устройства.
- гибридные кодеки сочетают в себе технологию дешифраторного преобразования/синтеза речи, но оперируют уже с цифровым сигналом посредством специализированных DSP. Кодеки этого типа содержат в себе ИКМ или АДИКМ кодек и реализованный цифровым способом вокодер.
В голосовых шлюзах IP-телефонии понятие кодека подразумевает не только алгоритмы кодирования/декодирования, но и их аппаратную реализацию. Большинство кодеков, используемых в IP-телефонии, описаны рекомендациями семейства «G» стандарта H.323 (см. рисунок 1.5).
Рисунок 1.5 - Стандарты для кодирования речевых сигналов
Все способы кодирования, основанные на определенных предположениях о типе сигнала, не подходят при передаче сигнала с крутыми скачками амплитуды. Именно данный вид имеет сигнал, генерируемый модемами или факсимильными аппаратами, из за этого аппаратура, поддерживающая компрессию, должна автоматически распознавать сигналы факс-аппаратов и модемов и обрабатывать их по другому, чем голосовой трафик. Многие способы кодирования берут свое начало от метода кодирования с линейным предсказанием LPC (Linear Predicative Coding).
В качестве входного сигнала в LPC используется последовательность цифровых значений амплитуды, но алгоритм кодирования применяется не к отдельным цифровым значениям, а к определенным их блокам. Для каждого такого блока значений вычисляются его характерные параметры: частота, амплитуда и т. д. Именно эти значения и передаются по сети. При таком подходе к кодированию речи, во-первых, возрастают требования к вычислительным мощностям специализированных процессоров, используемых для обработки сигнала, а во-вторых, увеличивается задержка при передаче, поскольку кодирование применяется не к отдельным значениям, а к некоторому их набору, который перед началом преобразования следует накопить в определенном буфере.
Важно, что задержка в передаче речи связана не только с необходимостью обработки цифрового сигнала (эту задержку можно уменьшать, увеличивая мощность процессора), но и непосредственно с характером способа сжатия. Способ кодирования с линейным предсказанием LPC позволяет достигать очень больших степеней сжатия, которым соответствует полоса пропускания 2,4 или 4,8 кбит/с, однако качество звука здесь сильно искажается. Из за этого в коммерческих приложениях он не применяется, а применяется в основном для ведения служебных бесед.
Более сложные способы сжатия речи основаны на применении LPC в сочетании с элементами кодирования формы сигнала. В этих алгоритмах используется кодирование с обратной связью, когда при передаче сигнала осуществляется оптимизация кода. Закодировав сигнал, процессор пытается восстановить его форму и сличает результат с исходным сигналом, после чего начинает колебать параметры кодировки, добиваясь наилучшего совпадения. Достигнув такого совпадения, оборудование передает полученный код по линиям связи; на втором конце происходит восстановление звукового сигнала. Понятно, что для использования такого способа требуются еще более серьезные вычислительные мощности.
Одной из самых распространенных разновидностей описанного способа кодирования является метод LD - CELP (Low-Delay Code-Excited Linear Prediction). Он позволяет достичь удовлетворительного качества воспроизведения при пропускной способности 16 кбит/с. Алгоритм применяется к последовательности цифр, получаемых в результате аналого- цифрового преобразования голосового сигнала с 16-разрядным разрешением. Пять последовательных цифровых значений кодируются одним 10-битовым блоком - это и дает те самые 16 кбит/с.
Для использования этого метода требуются большие вычислительные мощности; в частности, в марте 1995 г. ITU принял новый стандарт - G.723, который предполагается использовать при сжатии речи для организации видеоконференций по телефонным сетям. Этот стандарт представляет собой часть более общего стандарта Н.324, описывающего подход к организации таких видеоконференций.
Цель - организация видеоконференций с использованием обычных модемов. Основой G.723 является способ сжатия речи MP-MLQ (Multipulse Maximum Likelihood Quantization). Он позволяет добиться весьма существенного сжатия речи при сохранении достаточно высокого качества звучания. В основе метода лежит описанная выше процедура оптимизации; с помощью различных усовершенствований можно сжимать речь до уровня 4,8; 6,4; 7,2 и 8,0 кбит/с. Структура алгоритма позволяет на основе программного обеспечения изменять степень сжатия голоса в ходе передачи. Вносимая кодированием задержка не превышает 20 мс. Повышая эффективность применения полосы пропускания, механизмы сжатия речи в то же время могут привести к ухудшению ее качества и увеличению задержек.
Далее рассмотрены некоторые основные кодеки, испtrialемые в шлюзах IP- телефонии операторского уровня.
Кодек без сжатия. Рекомендация G.711, утвержденная МККТТ в 1984 г., описывает кодек, использующий ИКМ преобразование аналогового сигнала с точностью 8 бит, тактовой частотой 8 КГЦ и простейшей компрессией амплитуды сигнала. Скорость потока данных на выходе преобразователя составляет 64 кбит/с (8 битх8 КГЦ). Для снижения шума квантования и улучшения преобразования сигналов с небольшой амплитудой при кодировании используется нелинейное квантование по уровню (рисунок 1.8) согласно специальному псевдологарифмическому закону: А-закон для европейской системы ИКМ- 30/32 или закон для североамериканской системы ИКМ-24.
Кодек G.711 широко распространен в системах традиционной телефонии с коммутацией каналов. Несмотря на то, что рекомендация G.711 в стандарте H.323 является основной и первичной, в шлюзах IP-телефонии данный кодек применяется редко изза высоких требований к полосе пропускания и задержкам в канале передачи (все-таки 64 кбит/с это много). Использование G.711 в системах IP-телефонии обосновано лишь в тех случаях, когда требуется обеспечить максимальное качество кодирования речевой информации при небольшом числе одновременных разговоров. Одним из примеров применения кодека G.711 могут послужить IP-телефоны компании Cisco.
Кодеки с сжатием. Один из старейших алгоритмов сжатия речи ADPCM - адаптивная дифференциальная ИКМ (стандарт G.726 был принят в 1984 г.). Этот алгоритм дает практически такое же качество воспроизведения речи, как и ИКМ, однако для передачи информации при его использовании требуется полоса всего в 16-32 кбит/с. Способ основан на том, что в аналоговом сигнале, передающем речь, невозможны резкие скачки интенсивности.
Поэтому, если кодировать не саму амплитуду сигнала, а ее изменение по сравнению с предыдущим значением, то можно обойтись меньшим числом разрядов. В ADPCM изменение уровня сигнала кодируется четырехразрядным числом, при этом частота измерения амплитуды сигнала сохраняется неизменной. Процесс преобразования не вносит существенной задержки и требует от DSP 5,5-6,4 MIPS (Million Instructions Per Second). Кодек может применяться совместно с кодеком G.711 для снижения скорости кодирования последнего. Кодек предназначен для использования в системах видеоконференций.
Кодек G.723.1.Рекомендация G.723.1 описывает гибридные кодеки, использующие технологию кодирования речевой информации, сокращенно называемую - MP-MLQ (Multy- Pulse - Multy Level Quantization - множественная импульсная, многоуровневая квантизация), данные кодеки можно охарактеризовать, как комбинацию АЦП/ЦАП и вокодера. Своим появлением гибридные кодеки обязаны системам мобильной связи. Применение вокодера позволяет уменьшить скорость передачи данных в канале, что принципиально важно для эффективного использования радиотракта и IP-линка.
Основной принцип работы вокодера - синтез исходного речевого сигнала посредством адаптивной замены его гармонических составляющих соответствующим набором частотных фонем и согласованными шумовыми коэффициентами. Кодек G.723 осуществляет преобразование аналогового сигнала в поток данных со скоростью 64 кбит/с (ИКМ), а затем при помощи многополосного цифрового фильтра/вокодера выделяет частотные фонемы, анализирует их и передает по IP-каналу информацию только о текущем состоянии фонем в речевом сигнале.
Данный алгоритм преобразования позволяет снизить скорость кодированной информации до 5,3-6,3 кбит/с без видимого ухудшения качества речи. Кодек имеет две скорости и два варианта кодирования: 6,3 кбит/с с алгоритмом MP-MLQ и 5,3 кбит/с с алгоритмом CELP. Первый вариант предназначен для сетей с пакетной передачей голоса и обеспечивает лучшее качество кодирования по сравнению с вариантом CELP, но менее адаптирован к применению в сетях со смешанным типом трафика (голос/данные).
Процесс преобразования требует от DSP 16,4-16,7 MIPS и вносит задержку 37 мс. Кодек G.723.1 широко применяется в голосовых шлюзах и прочих устройствах IP- телефонии. Кодек уступает по качеству кодирования речи кодеку G.729a, но менее требователен к ресурсам процессора и пропускной способности канала.
Кодеки G.729. Семейство включает кодеки G.729, G.729 Annex A, G.729 Annex В (содержит VAD и генератор комфортного шума). Кодеки G.729 сокращенно называют CS- ACELP Conjugate Structure - Algebraic Code Excited Linear Prediction - сопряженная структура с управляемым алгебраическим кодом линейным предсказанием. Процесс преобразования использует DSP 21,5 MIPS и вносит задержку 15 мс. Скорость кодированного речевого сигнала составляет 8 кбит/с. В устройствах VOIP данный кодек занимает лидирующее положение, обеспечивая наилучшее качество кодирования речевой информации при достаточно высокой компрессии.
Кодек G.728. Гибридный кодек, описанный в рекомендации G.728 в 1992 г. относится к категории LD-CELP - Low Delay - Code Excited Linear Prediction - кодек с управляемым кодом линейным предсказанием и малой задержкой. Кодек обеспечивает скорость преобразования 16 кбит/с, вносит задержку при кодировании от 3 до 5 мс и для реализации необходим процессор с быстродействием более 40 MIPS. Кодек предназначен для использования, в основном, в системах видеоконференций. В устройствах IP-телефонии данный кодек применяется достаточно редко.
Количественными характеристиками ухудшения качества речи являются единицы QDU (Quantization Distortion Units): 1 QDU соответствует ухудшению качества при оцифровке с использованием стандартной процедуры ИКМ; значения QDU для основных методов компрессии приведены в таблице 1.1.
Т а б л и ц а 1.1 - Значения единиц ухудшения качества речи QDU для различных методов компрессии
Дополнительная обработка речи всегда ведет к дальtrialй потере качества. Согласно рекомендациям МСЭ-Т, для национtrialх вызовов величина QDU не должна превышать 14, причем передача разговора по международным магистральным каналам ухудшает качество речи, как правило, на 4 QDU. Следоватеtrial при передаче разговора по международным сетям должно теряться не более 5 QDU. Поэтому для качественной передачи речи процедуру компрессии/декомпрессии желательно применять в сети только один раз. В некоторых странах это является оtrialельным критерием регулирующих органов по отношению к корпоtrialным сетям, подключенным к сетям общего пользования.
Устранение пауз (silence suppression) - важная функция ATM-свитчов. Суть технологии подавления пауз заключается в определении различия между моментами активной речи и молчания во время соединения. В результате использования этой технологии генерация ячеек происходит только в моменты активного разговора. Поскольку в процессе типичного разговора по телефону молчание составляет до 60% времени, происходит двукратная оптимизация по количеству данных, которые должны быть переданы по линии. Объединение технологии сжатия речи и подавления пауз речи в свитчах приводит к уменьшению потока данных в канале до восьми раз.
1.3 Общая оценка качества IP-телефонии
От компрессии/декомпрессии искажения оценивают путем опроса разных групп людей по пятибалльной шкале единицами субъективной оценки MOS (Mean Opinion Score). Оценки 3,5 баллов и выше соответствуют стандартному и высокому телефонному качеству, 3,0...3,5 - допустимому, 2,5…3,0 - синтезированному звуку. Для передачи речи с хорошим качеством целесообразно ориентироваться на MOS не ниже 3,5 баллов. Значения MOS для различных стандартов кодеров приведены в таблице 1.2.
Т а б л и ц а 1.2 - Средние субъективные оценки качества различных способов кодирования
Кодек Скорость передачи, кбит/с MOS Размер кадра, мс
G.711 РСМ 64 4,3 Продолжение таблицы 1.3
Кодек Скорость передачи, кбит/с MOS
0,125
Размер кадра, мс
G.726 Multi-rate 16-40 2-4, 0,125 ADPCM
G.723 MP-MLQ ACELP
G.728 TRIALL
G.729 CS-ACELP
G.729a CS-ACELP
GSM RPE-LPC
5,3; 6,3
16
8
8
13
3,7; 3,8 30
4,1 0,625
4,0 10
3,4 10
3,9 30
Несмотря на большое разнообразие, характеризуемое пропускными способностями, числом маршрутизаторов, характеристиками физических линий и прочими характеристиками, реально действующие каналы Интернет характеризуются следующими параметрами: - действительной пропускной способностью, определяемой наиболее «узким местом» в виртуальном канале в данный момент времени;
- трафиком, также являющимся функцией времени;
- задержкой пакетов, что определяется трафиком, числом маршрутизаторов, задержками на обработку сигналов, возникающими в речевых кодеках и других устройствах шлюзов; все это также обеспечивает зависимость задержки от времени;
В рамках проекта TIPHON определены четыре класса обслуживания (см. таблицу 1.3), каждый из которых гарантирует определенное качество при установлении вызова и во время самого сеанса связи.
Качество обслуживания при установлении вызова характеризуется прежде всего временем его установления, т.е. временем между набором абонентом последней цифры номера (или, например, команды ввода при наборе адреса на компьютере) и получением им ответного тонального сигнала. Качество обслуживания во время сеанса связи определяется многими факторами, два основных - это сквозная временная задержка и качество сквозной передачи речи (оценивается параметрами субъективной оценки MOS).
Т а б л и ц а 1.3 - Характеристики классов обслуживания TIPHON Классы обслуживания
Характеристика Наилучший Высокий Средний Низкий (4) (3) (2) (1)
Продолжение таблицы 3.3 Характеристика
Качество передачи речи
Наилучший Высокий (4) (3)
Классы обслуживания Лучше, чем Не хуже, чем G.711 G.726 (32 кбит/с)
Средний (2)
Не хуже, чем GSM- FR
Низкий (1)
Не определено
Сквозная задержка, <150 мс при прямой IP- <1,5 адресации при трансляции <2 номера Е.164 в IP-адрес2 при трансляции <3 номера Е.164 в IP-адрес
<250 <350 <450
<4 <7 <7
<5 <10 <10
<8 <15 <15
через клиринговый центр или роуминг2 при трансляции <4 номера Е.164 в IP-адрес3 при трансляции <6 номера Е.164 в IP- адрес через клиринговый центр или роуминг3 при трансляции <4 адреса электронной почты в
IP-адрес
<10 <20 <20
<15 <30 <30
<13 <25 <25
1.3.1 Протокол RSVP - обеспечение качества IP-телефонии
Использование протокола резервирования ресурсов (Resource Reservation Protocol, RSVP), является одним из средств обеспечения качества IP -телефонии и особенно Интернет-телефонии рекомендованного комитетом IETF. С помощью RSVP мультимедиа- программы могут потребовать специального качества обслуживания (specific quality of service, QOS) путем любого из существующих сетевых протоколов - главным образом IP, хотя возможно использовать и UDP - чтобы обеспечить качественную передачу видео и аудиосигналов.
Протокол RSVP предусматривает гарантированное QOS благодаря тому, что через каждый компьютер, или узел, который связывает между собой участников телефонного разговора, может передаваться определенное количество данных.
Протокол RSVP предназначен только для резервирования части пропускной способности. Используя RSVP, отправитель периодически информирует получателя о свободном количестве ресурсов сообщением RSVP Path (см. рисунок 1.6). Транзитные маршрутизаторы по мере прохождения этого сообщения также анализируют имеющееся у них количество свободных ресурсов и подтверждают его соответствующим сообщением RSVP Resv, передаваемым в обратном направлении.
Если ресурсов достаточно, то отправитель начинает передачу. Если ресурсов не достаточно, получатель должен снизить требования или прекратить передачу информации.
Ptrialk 1.6 - RSVP- применение протокола
Одна из основных особенностей RSVP заключается в том, что запросы на резервирование ресурсов направляются только от получателей данных отправителям, а не наоборот. Такой подход обусловлен тем, что лишь устройство-получатель знает, с какой скоростью оно должно получать данные, чтобы надежно декодировать аудио - или видеосигналы. Другая уникальная особенность RSVP состоит в том, что резервирование производится лишь для одного направления. Кроме того, RSVP не допускает смешения аудио и видеосигналов на зарезервированном канале.
Когда RSVP - программы закончат сеанс связи, они должны вызвать функцию отмены, предусмотренную этим протоколом. Отмена удаляет все запросы на ресурсы, сделанные программой, и позволяет другим прикладным программам использовать коммуникационные возможности Internet. Если программе не удается выполнить отмену, тогда предусмотренные протоколом средства по истечении некоторого промежутка времени обнаружат это и автоматически отменят запрос на ресурсы.
Недостатком протокола RSVP является то, что полоса пропускания, выделяемая источнику информации, при снижении активности источника не может быть использована для передачи другой информации. Поскольку для реализации QOS протокол RSVP требует резервирования ресурсов или
Вывод
1) Проведено сравнение методов оценивания качества передаваемой речи: - метод MOS (Mean Opinion Score) - усредненный показатель мнений о качестве, представленный в Рекомендациях ITU-T Р.800 и Р.830;
- E-модель (рекомендация ITU-T G.107) использующая рейтинг R (Quality Rating) в единицах по сто балльной шкале;
- метод, использующий критерии отношения сигнал/шум (ОСШ) на выходе воспроизводящего устройства и разборчивости.
2) По своей сути обобщенный показатель R является отношением сигнал/шум по мощности, однако в Рекомендациях ITU-T G.107, G.108 это обстоятельство не фиксируется. Кроме того, ни R, ни даже базовый коэффициент Ro (который в той же рекомендации ITU-T G.107 в начале определяется как отношение сигнал/шум по мощности в децибелах) не выражаются в децибелах, как и ряд остальных (поправочных) коэффициентов в определении рейтинга R Е-модели.
3) Показатель R учитывает все шумы, связанные с пакетной передачей речи, шумы в помещении на передающей и приемной сторонах и т.п.. Отсюда очевидно следует, что R представляет результирующее отношение сигнал/шум по мощности и его значения должны соответствовать значениям результирующего отношение сигнал/шум по критерию ОСШ. Однако для нормальных акустических условий величина Ro принимается равной Ro=95 ДБ, в то время как граница между хорошим и отличным качеством по критерию ОСШ составляет 20 ДБ (иллюстрировано в главе многочисленными примерами приложений).
3.1.6 Оценка качества ІР-телефонии по критерию отношения сигнал/ шум в системах с пакетной коммутацией
Большое влияние на качество восстановления речи в системах с пакетной коммутацией оказывают потери речевых пакетов в процессе их передачи.
Когда отбраковывается один пакет длительностью 1пак или последовательность из \ пакетов длительностью \ Іпак, образуются перерывы в речевом сообщении, подлежащем реконструкции на приемной стороне. В процессе депакетизации и реконструкции они возмещаются различными способами: - заменой потерянного фрагмента речи белым шумом той же мощности, что исходное речевое сообщение;
- соединение начала фрагмента речи, следующего за отбракованным фрагментом, с окончанием фрагмента, предшествующему периоду отбраковки (за счет сокращения длительности активного состояния в реконструированной речи, предусматривающего увеличение длительности пауз). При этом, по сути дела отбракованный фрагмент длительностью кпак, заменяется следующим фрагментом исходного речевого сообщения той же длительностью;
- заменой потерянного фрагмента речи предыдущим той же длительности.
При отбраковке последовательности i=1,2,3,..., N пакетов мощность шума восстановления по последнему способу: ?2 ? 2?2?pi i?1?RA itmax ? , (3.17)
? ?
? ?
? где ?А - дисперсия (мощность) центрированного речевого сообщения; rя (.) - его нормированная корреляционная функция;
2
Рі(i) - распределение вероятностей отбраковки подряд i речевых пакетов.
PI(I)=PNYI(I), I =1,2,3…, N, (3.17") где Yi(i) - условное распределение вероятностей отбраковки подряд i речевых пакетов при условии, что происходит отбраковка;
Рп - вероятность отбраковки; Очевидно, что 1? pn ?? pi ?i??1, (3.17"") i?1
N
?Y ?i??1 , (3.17""") i?1
N i
Нормированная погрешность определяется по формуле [19]: ?2 ? 2?Pi?i?1?RA?itmax ??, (3.18) i?1
N
?
Следует отметить, что вероятность рп отбраковки речевого пакета [19]: I ? ?P?i . (3.19) i?1
P
N
? i
Очевидно, что при необходимости аппроксимации pi(i) наиболее целесообразно геометрическое распределение, основанное на схеме испытаний Бернулли (в терминах нашей задачи - на независимости испытаний, состоящих в определении не отбраковки нового пакета) и определяющее вероятность не отбраковки пакета в первый раз после точно i испытаний (или иначе отбраковке подряд i пакетов)
Pi(i)=(1-РП) РПІ, i=0,1,2…;0 ?РП?1, (3.20а) которому сооветствует условное распределение вероятностей отбраковки подряд \ речевых пакетов при условии, что происходит отбраковка;
Yi(i)=[(1- РП)/ РП] РПІ, i=1,2,…;0 ?РП?1, (3.20б)
В работе [19] сделан вывод о том, что нормированная корреляционная функция речевого сообщения (при различных аппроксимациях экспериментальной корреляционной функции) практически равна нулю при значениях аргумента, равных наиболее часто используемым длительностям пакета ІР-телефонии (тпак=10 и 20 мс). Так например при тпак=20 мс r ? 2.06?10?9 ?5.10?10?3 для различных аппроксимаций [19].
?
Это позволяет упростить формулу (3.18) [19]: ?2 ? 2?P?i?1? r ?itmax ??? 2P (3.21) i?1
N
?
?
I i
При учете лишь шумов, вызванных отбраковкой, отношение сигнал/шум реконструкции (в децибелах) определяется по формуле [4,19]: ОСШ ?10lg?? 2 ? (3.22)
? ?
? ?
1
Таким образом аналитическое оценивание качества восстановления речи при ІР- телефонии (при учете влияния отбраковки речевых пакетов) состоит в определении распределения Р$) и определения отношения сигнал/шум по формуле (3.22) с использованием формулы (3.18) при значениях 1пак<5 мс и формулы (3.21) при стандартных размерах речевого пакета.
Переход к оценке качества по показателю слоговой разборчивости осуществляется с использованием формулы (3.17).
3.1.7 Оценка качества IP-телефонии по критериям MOS и Е-модели в системах с пакетной коммутацией
В методике оценивания качества речи, использующей Е-модель ITU-T при определении коэффициента R (3.2), шумы, связанные с отбраковкой пакетов учитывает коэффициент Ie,eff «действительного ухудшения за счет оборудования». Этот коэффициент учитывает снижение отношения сигнал/шум, вносимое низкоскоростными кодеками, а также за счет потерь пакетов[9]: le, eff ?le??95?le?? P ? Bpl, (3.23)
P n n где le - коэффициент ухудшения за счет оборудования при отсутствии потерь пакетов;
Рп - вероятность потерь пакетов, %; Bpl - показатель устойчивости к потере пакетов. (см. таблицу 3.5) [12].
Т а б л и ц а 3.5 - показатель устойчивости к потере пакетов
Кодек Размер пакета, мс 1е Bpl
G.723.1 VAD
G.729A VAD GSM-EFR G.711
G.711
30 15 16,1
20 (2 кадра) 11 19,0 20 5 10,0 10 0 4,3
10 0 25,1
Показатель R учитывает все шумы, связанные с пакетной передачей речи, шумы в помещении на передающей и приемной сторонах, Ds И Dr- факторы и т.п. Таким образом, по сути дела он представляет результирующее отношение сигнал/шум по мощности.
Если из всех шумов, вызванных пакетной передачей речи, учитывать лишь шумы, создаваемые потерей пакетов (то есть пренебрегать задержкой пакетов и джиттером задержки), то формула (3.2) с учетом (3.23) и при Ro=95 ДБ может быть переписана в виде:
R ? R0 1? Pn? Bpl?, (3.24)
? ?
?
? ?
Pn
Таким образом, ухудшение, вносимое в отношение сигнал/шум потерей пакетов определяется коэффициентом ?= Рп/(Рп Bpl). Вызывает недоумение возможность использования такой грубой аппроксимации зависимости отношения сигнал/шум от вероятности Рп. Кроме того, мощность шумов, вызванных потерей пакетов, оказывается зависящей от мощности сигнала.
На рисунке 3.5 представлены графики зависимости коэффициента действительного ухудшения за счет оборудования от коэффициента потерь пакетов для некоторых типов кодеков [12]. Кодек G.711, с включенной функцией маскирования потерянных кадров (PLC), наиболее устойчив к потере пакетов по сравнению с тем же кодеком без функции маскирования.
Рисунок 3.5 - зависимости коэффициента действительного ухудшения за счет оборудования от коэффициента потерь пакетов
Нужно обратить внимание, что форма представления коэффициента Ie,eff в рекомендациях ITU-T G.108, G.113 [11,12]. Ни Ie,eff, ни его составляющая 1е в случае представления конкретных их значений таблицами и графиками не выражаются в децибелах. А сами эти значения, представляемые графиками (с одной стороны) и таблицами, расчетными формулами (с другой стороны) не совпадают.
Для рассматриваемого кодека G.711 с PLC значения Ie,eff, полученные по графику рисунка 3.5 (Ie, eff]) и рассчитанные (при 1е=0 и значении Вр1=25,1 из таблицы 3.1) по формуле: Ie,eff= Ie,eff2= 95Рп/( Рп 25,1), (3.5) представлены в tatrial 3.6.
Т а б л и ц а 3.6 - значения Ie,eff, полученные по графику рисунка 3.5 Значение коэффициента Ie,eff, ДБ при значениях вероятности рп
0,001 0,01 0,02 0,03 0,05 0,09
Ie,eff, 0,5 3 6 9 14 24
Ie,eff2 0,4 3,7 7 10 16 25
3.2 Сопоставление оценок качества ІР-телефонии в системах с пакетной коммутацией
Нами был использован разборчивости в зависимости от адекватные отношения аппарат аналитического оценивания сигнал/шум и аппарат аналитического оценивания (по критерию отношения сигнал/шум) степени влияния на качество воспроизведения речи такого важного фактора, как потери речевых пакетов.
Поэтому представляется целесообразным более точный учет влияния этого фактора в спектре существующих методов оценки качества пакетной передачи речи при сохранении в них подходов к оценке влияния двух других основных факторов: задержки и джиттера задержки речевых пакетов.
Выполним сопоставление оценок качества реконструкции речевого сообщения при его пакетной передаче, предоставляемых двумя группами критериев: - критерии отношения сигнал/шум (ОСШ) и разборчивости; - критерии MOS и рейтинга R (Е-модель).
Сопоставление оценок будем производить на примере пакетной передачи речи в ІР- телефонии.
Для определения в первом приближении степени адекватности получаемых оценок будем использовать известные резулtrial.
Результат №1: В работе [7] утверждается, что приближенно можно считать, что при IP-телефонии хорошего качества допустимый уровень потерь пакетов должен составлять Рп=1-3% (нижний предел относится к низкоскоростным кодекам, верхний - к высокоскоростным).
Результат № 2: В работе [20] по результатам физического эксперимента и субъективной оценки качества восстановления речи приведена зависимость MOS от вероятности Рп (см. таблицу 3.7). Категории качества речи приведены в таблице 3.3 на основании таблицы.3.3 и рисунка 3.4.
Т а б л и ц а 3.7 - зависимость MOS от вероятности Рп
Значения MOS и категории качества речи в зависимости от вероятности потери пакетов Рп
0 0,0006
4,05 4,01
0,0185 0,0379
3,33 2,67
0,0679 0,1025 0,23
2,33 2 1,33
Высокая Средняя Низкая Плохая -
Отметим, что данные работ [7] и [20] хорошо корреспондируются друг с другом. Хорошее качество обеспечивается при значениях Рп~0,03.
Используя методику оценки качества реконструкции речи, приведенную в параграфе 2.2, определяем зависимость отношения ОСШП мощности сигнала к мощности шума отбраковки от вероятности рп потери (отбраковки) речевого пакета длительностью Т>5 мс (см. таблицу 3.8).
Т а б л и ц а 3.8 - Значение отношения сигнал/шум ОСШП
Значение отношения сигнал/шум ОСШП, ДБ при значениях вероятности рп
0,001 0,01 0,02 0,03
26,99 16,99 13,98 12,22
0,04 0,05 0,06
10,97 10,0 9,2
0,07 0,08 0,09 0,1
8,5 7,9 7,4 6,8
Следует еще раз подчеркнуть, что эта зависимость справедлива для определенного набора процедур экстраполяции потерянного фрагмента речи. К ним относятся замена предыдущим фрагментом, соединение окончания фрагмента, предшествующего периоду отбраковки, с началом фрагмента, следующего за периодом отбраковки и т.п. Другими словами, это касается процедур с «маскированием» потерянных фрагментов речи, например для кодека G.711, с включенной функцией маскирования потерянных кадров (PLC).
Данные таблицы 3.8 абсолютно точно сопоставляется с приведенными выше «Результатом № 1» и «Результатом № 2», поскольку при Рп=0,03 из таблицы 3.11 следует ОСШП= 12,22 ДБ, а значение ОСШ =12ДБ согласно таблице 3.10 соответствует границе между категориями качества «хорошая» и «удовлетворительная».
Оценки качества восстановления речи с использованием Е-модели не дают такой степени соответствия.
Сопоставим для кодека G.711(c PLC) результаты нашей оценки (по критерию ОСШ) с результатами методики, использующей Е-модель, которые при пренебрежении всеми поправочными коэффициентами кроме Ie,eff определяем согласно (3.3) по формуле
R = Ro - Ie,eff= 95 - Ie,eff. (3.26)
Т а б л и ц а 3.9 - Результаты сопоставления
Значение отношения сигнал/шум, ДБ при значениях вероятности рп
0,001 0,01 0,02 0,03 0,05 0,09
ОСШ 26,99 16,99 13,98 12,22 10,0 7,4
R 94,5 92 89 86 81 71
Естественно, что и здесь сохраняется различие в значениях отношения сигнал/шум по критериям ОСШ и R.
В оценках MOS хорошее качество определяется 4-мя баллами, удовлетворительное - 3-мя. Границе 3,5 балла между ними соответствует значение R=68 ДБ. Таким образом, из данных таблицы 3.9 следует, что при Ri=71 ДБ, то есть при вероятности потери пакетов 9%, обеспечивается хорошее качество воспроизведения речи, тогда как по данным «Результата № 2» категория качества ниже категории «плохое».
Определим мощность шума, создаваемого отбраковкой речевых пакетов.
При использовании Е-модели мощность Рш шума, вызванного отбраковкой пакетов, в соответствии с (3.22) определяется по формуле (Рс - мощность сигнала)
Рш=Рс(10-(9,5-le,eff/10)-10-9.5) (3.28) и при вероятности потери пакетов 9% имеем Ie,eff = 24 и Рш = 7,9x10 Рс. При использовании же критерия ОСШ при вероятности потери пакетов 9% ИМЕЕМРШ 0,18Рс.
=
Используя, Е-модель, определим отношение мощности сигнала к мощности шумов, создаваемых потерей пакетов, при использовании аппроксимации (3.7).
Обозначим через Рс - мощность сигнала, Рш - мощность шума, учитываемого базовым отношением сигнал/шум Ro (стандартные условия организации канала), Ршп - мощность шума, вызванного отбраковкой пакетов. Эту мощность определяем по формуле: Ршп =Рс(10-R0[l-Рп/( Рп Bpl)]/10-10-R0/10) (3.29)
Тогда отношение ОСШП,ДБ мощности сигнала к мощности шумов, создаваемых потерей пакетов, может быть записано в виде
Результаты расчета ОСШП по формуле (3.12)представлены в табл.3.6 для условий кодека 0.711 при Bpl = 25,1 (см. табл.4) и Яо=95 ДБ. Для сравнения в табл.3.8 приведены и значения R, рассчитанные по формуле (3.26).
Т а б л и ц а 3.10 - Значение отношения сигнал/шум, ДБ и R Значение отношения сигнал/шум, ДБ и R, ДБ при значениях вероятности рп
0,001 0,01 0,02 0,03 0,05 0,09
ОСШП 105,42 93.82 88,95 85,29 79.33 69,94
R 94,62 91,36 87,98 84,86 79,22 69,93
Сопоставление данных таблиц 3.8 и 3.10 свидетельствует о том, что использование грубой аппроксимации Рп/(Рп Вр1) зависимости отношения сигнал/шум от вероятности Рп не позволяет получить приемлемые для практики результаты. В частности при вероятности потерь 9% R~70 и значение MOS=3,6, что соответствует хорошему качеству.
Можно предложить уточнение с использованием формулы (3.4) показателя R для процедур с «маскированием» потерянных фрагментов речи при потерях речевых пакетов длительностью более 5 мс: R0
R ?10lg 1010 E 0 ?10lg 10?R0/10 ?2PIO ??1 , (3.31) 1?2PIO ?10 10
?
I
I
Значения R, рассчитанные по формуле (3.31), при Ro=95 представлены в табл.3.10.
Т а б л и ц а 3.10 - Значение коэффициента R
Значение коэффициента R, ДБ при значениях вероятности рп
0,001 0,01 0,02 0,03 0,05 0,09
R 6,98 16,98 13,98 12,22 10 7,44
Данные табл.3.10 не дают возможности адекватного использования зависимости показателя MOS от показателя R при оценке качества.
Если предположить, что базовое значение Ro=95, измеряется в «разах», а не в децибелах, то появляется возможность согласования критерия ОСШЭКВ с критерием R. Покажем алгоритм его реализации.
Значение ОСШФОН, приведенные к графикам рис.3.1 и рис.3.2, определяем по формуле: ОСШФОН=10LGRO. (3.32)
В предположении наличия корреляции между шумами, вызванными отбраковкой пакетов, и речевым сообщением по формулам (3.21) и (3.22) определим: ОСШКОРР=10lg[(2РП)-1]. (3.33)
Задаваясь значением Ro=95, (ОСШФОН=19,77 ДБ) и используя графики рис.3.1, 3.2 получаем значения ОСШЭКВ , представленные в табл.3.11.
Т а б л и ц а 3.11 - Значения ОСШКОРР, ОСШЭКВ и показателя R
Значения ОСШКОРР, ОСШЭКВ и показателя R при значениях вероятности потерь Рп
0.001 0,01 0.02 0,03 0,04 0,05 0,09 0,1
ОСШКОРР
ОСШЭКВ
R
26,99 16,99
19,57 16,56
90,56 45,33
13,98 12,22 10,97 10,0 7,4 6,8
14,00 12,05 10,51 9,24 5,77 4,99
25,12 16,05 11,24 8,40 3,78 3,15
Рассчитаем коэффициент Ie, eff для низкоскоростного кодека 0.729.1. Значения коэффициент ухудшения за счет оборудования при отсутствии потере пакетов (1е = 15) [12] и показателя устойчивости к потере пакетов Bpl = 16,1 (см. табл.3.1). Значения коэффициента Ie,eff для различных значений вероятности потерь представлены в таблице 3.12, рейтинга R - в таблице 3.13.
Т а б л и ц а вероятности потерь
Рп 0,001
3.12 - Значения коэффициента
0,01 0,02 0,03
Ie,eff для различных значений
0,05 0,09
Ie,eff 15,49 19,67 23,84 27,56 33,95 43,68
Т а б л и ц а 3.13 - Значения R для различных значений вероятности потерь Рп 0,001 0,01 0,02 0,03 0,05 0,09
R 77,85 73,67 69,5 65,78 59,39 49,66
В табл. 3.14 приведены значения оценок R качества речи и категорий качества (см. таблицу. 3.3) при различных значениях вероятности потерь.
Т а б л и ц а 3.14 - Значения оценок R качества речи и категорий качества
Рп
R
Категория качества
0,001
77,85
Средняя
0,01 0,02 0,03
73,67 69,5 65,78
Средняя Низкая Низкая
0,05 0,09
59,39 49,66
Плохая Плохая
Данные таблицы 3.14 свидетельствуют о не соответствии оценок качества речи с «Результатом №1» (для низкоскоростных кодеков). Расхождение теперь наблюдается в плане занижения оценки качества.1) В результате аналитического оценивания качества восстановления речи в IP- телефонии по критериям MOS и Е-модели установлено, что E-модель использует весьма грубую аппроксимацию зависимости отношения сигнал/шум от вероятности потери пакета.
2) Кроме того, мощность шумов, вызванных потерей пакетов, предполагается зависящей от мощности сигнала. Используемые в E-модели значения коэффициента действительного ухудшения за счет оборудования (зависящие от вероятности потери пакета), представленные графиками и таблицами, расчетными формулами рекомендаций ITU-T G.108, G.113 не совпадают друг с другом.
3)В результате сопоставления оценок качества IP-телефонии методами аналитического моделирования по критериям MOS и E-модели и по критериям отношения сигнал/ шум и разборчивости установлено, что для высокоскоростных кодеков использование критериев MOS и Е-модели приводит к завышению практически в три раза оценки допустимого значения вероятности потери пакета. Для низкоскоростных кодеков использование критериев MOS и Е-модели приводит к занижению оценки допустимого значения вероятности потери пакета.
При известном положении, что хорошее качество IP-телефонии при использовании высокоскоростных кодеков обеспечивается при значениях вероятности потери пакета не более 0,03 применение критерия ОСШ для этого значения вероятности предоставляет точную оценку ОСШ = 12,22 ДБ (при значении ОСШ = 12ДБ соответствующем границе между категориями качества «хорошая» и «удовлетворительная»).
В оценках MOS границу между удовлетворительным и хорошим качеством представляет 3,5 балла (соответствующее значению R = 68 рейтинга Е-модели) При этом использование Е-модели приводит к реализации условия этой границы (Rj = 69) при значении вероятности потери пакета 0,1 (по критерию ОСШ получаем в этом случае категорию «удовлетворительное» на границе с «неудовлетворительным»).
3.4 Расчет надежности IP-сети
Рассматриваемые показатели применяются для оценки надежности как невосстанавливаемых, так и подлежащих ремонту, т.е. восстанавливаемых объектов до появления первого отказа.
Вероятность безотказной работы P(t) - это вероятность того, что в заданном интервале времени (0, t) в системе или элементе не произойдет отказ.
Статистически P(t) определяется по формуле: P(0) ? N(t) N(0), (3.34) где N(t) - число элементов, безотказно проработавших до момента t; N(0)- первоначальное число наблюдаемых элементов.
Число работоспособных в течение времени (0,t) элементов определяется из соотношения: N(t) ? N(0)?n(0,t), (3.35) где n(0,t) - число отказавших за время (0,t) элементов.
Вероятность появления отказа Q(t) - это вероятность того, что в заданном интервале времени (0,t) произойдет отказ. Статистическая оценка Q(t) производится по формуле: Q(t) ? n(0,t) N(0). (3.36)
.
Таким образом, всегда имеет место соотношение: P(t)?Q(t) ?1. (3.37)
Частота отказов a(t) - это производная от вероятности появления отказа, означающая вероятность того, что отказ элемента произойдет за единицу времени (t,t ? ?t). Она определяется по формуле: a(t) ? DQ(t) ? DP(t) . (3.38) dt dt
Для упрощенного определения величины a(t) используем статистическую оценку: a(t) ? N(0)??t , (3.39) n(t,?t) где n(t,?t) - число элементов, отказавших в интервале времени от t до t ??t.
Точность статистической оценки (3.40) возрастает с увеличением первоначального числа наблюдаемых элементов и уменьшением временного интервала ?t [5].
Частота отказов, вероятность безотказной работы и вероятность появления отказа связаны следующими зависимостями:
P(t) ? ?a(x)dx, (3.40) t
?
Q(t) ? ? a(x)dx. (3.41) 0 t
Интенсивность отказов ?(t) - это условная вероятность отказа после момента t за единицу времени ?t при условии, что до момента t отказа элемента не было.
Интенсивность отказов связана с частотой отказов и вероятностью безотказной работы соотношением: ?(t) ? a(t) P(t). (3.41)
Так как P(t) ?1, то всегда выполняется соотношение ?(t) ? a(t). Статистически интенсивность отказов определяется по формуле:
n(t,?t)
N(t)??t a(t) ?
(3.42)
Различие между частотой и интенсивностью отказов в том, что первый показатель характеризует вероятность отказа за интервал (t ?t ??t) элемента, взятого из группы элементов произвольным образом, причем неизвестно, в каком состоянии (работоспособном или неработоспособном) находится выбранный элемент. Второй показатель характеризует вероятность отказа за тот же интервал времени элемента, взятого из группы оставшихся работоспособными к моменту t элементов.
Интегрируя выражение (3.40), получаем формулу для определения вероятности безотказной работы в зависимости от интенсивности отказов и времени: P(t) ? exp??0?(x)dx?. (3.43)
? ?
? ?
?
1
?
?
Рассмотренные показатели надежности связаны между собой соотношениями, приведенными в сводной таблице 3.15.
Т а б л и ц а 3.15 - Соотношения показателей надежности
Известный Формулы для определения неизвестных показателей показатель P(t) Q(t) a(t) ?(t)
P(t) - 1?P(t)
Q(t) 1?Q(t) -
DP(t) 1 DP(t) dt P(t) dt
DQ(t) 1 DQ(t)
? dt 1?Q(t) dt
Продолжение таблицы 3.15
Известный показатель
Формулы для определения неизвестных показателей
P(t) Q(t) a(t) ?(t)
a(t) ? a(x)dx t
?
?(t) exp??0 ?(x)dx?
? ?
? ?
?
1
? a(x)dx 0 t
1?exp??0 ?(x)dx?
? ?
? ?
?
1
-
?(t)exp??0 ?(x)dx?
? ?
? ?
?
1 a(t)
? a(x)dx t
?
-
Приведенные в таблице 3.15 соотношения между основными показателями надежности можно представить в более простой и наглядной форме с учетом того, что интенсивность отказов в период нормальной эксплуатации практически, неизменна: P(t) ? exp(??t), (3.44)
Q(t) ?1?exp(??t), (3.45) a(t) ??exp(??t). (3.46)
Формулы (2.13)-(2.15) характеризуют экспоненциальный закон надежности, т.е. экспоненциальное распределение времени безотказной работы при отказах с постоянной интенсивностью.
Подставив числовые данные в формулы (3.40)-(3.46), рассчитаем вероятности безотказной работы, появления отказа и частоту отказов для момента времени t =6 месяцев, интенсивность отказов ? =35?10?3 1/год.
Расчеты произведем с использованием программного комплекса MATHCAD 2001 Professional. На рисунке 3.6 представлено окна программного комплекса.
Рисунок 3.6 - Окно программного комплекса MATHCAD с расчетом надежности Численные показатели надежности равны: P(0,5) ? exp(?0,035?0,5) ? 0,811
На рисунке 3.7 представлены в графической форме зависимости показателей надежности от времени при экспоненциальном законе. заштрихованной области численно характеризует среднюю наработку на отказ. основных Площадь
Рисунок 3.7 - Графики зависимости основных показателей надежности от времени работы оборудования
Таким образом, вероятность того, что в течение шести месяцев системе не произойдет отказ равна 0,8 и следовательно IP-сеть обладает достаточной степенью надежности.
Список литературы
1.Сахаров, А.В. Проблема качественной передачи речи в IP-телефонии // Прогрессивные технологии в машиностроении и приборостроении. Тезисы докладов Всероссийской научно-технической конференции, - Н. Новгород-Арзамас, 2004. - С. 513- 516.
2. Вегешна Шринивас Качество обслуживания в сетях IP/ Ш.Вегешна. - М.: Вильямс, 2003. - 368 с.
3. Горелов Г.В., Казанский H.A., Лукова О.Н.Оценка качества различных методов восстановления речи в цифровых сетях с коммутацией пакетов речи и данных. Автоматика и вычислительная техника. 1993. N4 с.11-14
4. Росляков А.В., Самсонов М,Ю. Модели и методы оценки качества услуг ІР-телефонии. Электросвязь, № 1. 2002, с.31-33.
5. Вемян Г.В. Передача речи по сетям электросвязи. - М.: Радио и связь, 1985.
6. Карпов А. В. и др. Актуальные вопросы исследования телекоммуникационных систем и сетей.//Advances in Electrical and Electronic Engineering. Словакия - Жилина.-2006.-№3
7. How Delay and Packet Loss Impact Voice Quality in VOIP. Choon Shim, Liehue Xie, Bryan Zhang, C.J. Sloane. http://www.qovia.com. 2003
8. Беллами Д.К. Цифровая телефония, М. Эко-трендз, 2004
9. Берлин А.Н. Устройства, системы и сети коммутации. — СПБ.: Петеркон,2003.
10. Галичский К, Компьютерные системы в телефонии. Серия «Мастер систем». -СПБ.: ВПУ-Санкт-Петербург, 2002.
11. Горелов Г.В., Лукова О.Н. Влияние алгоритмов поиска на качество передачи речи по сети с коммутацией пакетов. Обработка сигналов в системах двусторонней телефонной связи. М.- Пушкино.1994 с.136-138.