В Закладки

Главная
Официальная
Новости
Курсовые работы
Дипломные проекты
Лекции и конспекты
Рефераты
Софт
Ссылки
Справочник Студента
Гостевая

Почта


Поиск по сайту:

          


















Дипломная работа по радиомеханике. Статистическое уплотнение первичной цифровой системы передачи.

Дипломная работа по радиомеханике. Статистическое уплотнение первичной цифровой системы передачи.

СОДЕРЖАНИЕ

ОСНОВНЫЕ СОКРАЩЕНИЯ И ОБОЗНАЧЕНИЯ

ВВЕДЕНИЕ

1. СТАТИСТИЧЕСКОЕ УПЛОТНЕНИЕ ПЕРВИЧНОЙ ЦИФРОВОЙ СИСТЕМЫ ПЕРЕДАЧИ

1.1. Постановка задачи

1.2.

2. СТАТИСТИЧЕСКИЕ СВОЙСТВА ПОТОКА ОТСЧЕТОВ НА ВХОДЕ ИНТЕРПОЛИРУЮЩЕГО ФИЛЬТРА

2.1. Постановка задачи

2.2. Аппроксимации вероятностных характеристики потока отсчетов

2.3. Выводы

3. СТАТИСТИЧЕСКИЕ СВОЙСТВА ОТСЧЕТА НА ВХОДЕ ИНТЕРПОЛИРУЮЩЕГО ФИЛЬТРА

3.1. Постановка задачи

3.2. Аналитическое описание плотности ра¬спределения вероятностей мгновенного значения речевого сигнала

3.3. Экспериментальная плотность ра¬спределения вероятностей мгновенного значения речевого сигнала

3.4. Выводы

4. КАЧЕСТВО ВОСПРОИЗВЕДЕНИЯ РЕЧИ ПРИ СТАТИСТИЧЕСКОМ УПЛОТНЕНИИ

4.1. Постановка задачи

4.2. Определение отношения сигнал/шум дискретизации и восстановления.

4.3. Определение отношения сигнал/шум квантования в стандартной первичной ЦСП с использованием аппроксимаций ра¬спределения вероятностей мгновенного значения речевого сигнала

4.4. Определение отношения сигнал/шум квантования в ЦСП со статистическим уплотнением с использованием аппроксимаций ра¬спределения вероятностей мгновенного значения речевого сигнала

4.5. Определение отношения сигнал/шум квантования в стандартной первичной ЦСП и ЦСП со статистическим уплотнением при использовании непосредственно экспериментального ра¬спределения вероятностей мгновенного значения речевого сигнала

4.6. Определение отношения сигнал/шум квантования в стандартной первичной ЦСП и ЦСП со статистическим уплотнением при имитационном моделировании процесса квантования

4.7. Определение по критерию слоговой разборчивости качества восстановления речевого сообщения в ЦСП со статистическим уплотнением

4.8. Выводы

5. ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

ВВЕДЕНИЕ

Актуальность темы. В настоящее время развитие различных информационных структур, интегрированных телекоммуникационных сетей, в которых сочетаются различные виды трафика и различные методы доступа, сопровождается рас¬ширением применения цифровых систем сбора, передачи и обра¬ботки информации [55,56,57,59,61,63,73,74].

Особый интерес представляет совершенство¬вание цифровых систем передачи (ЦСП) речи, поскольку одной из важнейших задач является ускорение телефонизации страны при повышении скорости и качества передаваемой информа¬ции.

В основе ЦСП лежит дискретизация речевого сигнала по времени с последующим его восстановлением на приемной стороне. Наиболее просто на практике реализуется периодическая (регулярная) дискретизация. Однако, процесс дискретизации может стать нерегулярным в процессе функцио¬нирования системы, из-за сбоев в ее работе, из-за зашумления каналов, искажения и запаздывания дискретных отсчетов (а при пакетной передаче - пакетов) [48]. Кроме того, разработаны и ши¬роко используются ЦСП с преднамеренным введением" стохастичности в процесс дискретизации для увеличения эффектив¬ности процесса передачи.

Под стохастическими ЦСП (СЦСП) вслед за автором [48] понимаем ЦСП, на вход восстанавливающих устройств которых, поступает стохастичес¬кий поток отсчетов дискретизированной речи [30,33,40,46].

Для анализа СЦСП преимущественно используются субъективные методы оценивания качества восстановления речи. Разработана и достаточно стро¬гая методика аналитической оценки качества передачи по кри¬терию разборчивости [1,8,26-29,31,32,34-39,41,46,47,49,50].

В данной диссертационной работе рассматриваются вопросы применения методов имитационного моделирования при определении качества стохастической цифровой передачи речевой информации.

Цель работы состоит в совершенствовании методики аналитической оценки качества передачи путем отказа от применения ряда используемых аппроксимаций и применения в ней непосредственно экспериментальных распределений вероятностей, а также методов имитационного моделирования процессов в основных элементах СЦСП.

Реализуется следующая последовательность решения задач диссертационной работы:

1. Обзор примеров реализации и схемотехники статистического уплотнения первичной цифровой системы передачи.

2. Определение статистических свойств потока отсчетов на входе интерполирующего фильтра СЦСП. Получение методами имитационного моделирования распределений вероятностей занятости канального интервала и вероятностей отбраковки числа подряд отбракованных отсчетов (статистики коллизий, «столкновения отсчетов» основного и дополнительного комплекта СЦСП).

3. Определение качества воспроизведения речи в СЦСП по критерям отношения сигнал/шум и слоговой разборчивости с использованием имитационного моделирования процессов в основных элементах СЦСП.

Исходная основа диссертации. Диссертация основывается на результатах:

- фундаментальных работ теории информации В.А.Котельникова, Н. Винера, К. Шеннона и др.

- теоретических и прикладных исследований по цифровой

обработке и передаче непрерывных, в том числе речевых, со¬

общений Дж.Беллами, Л.А.Баранова А.И.Величкина, М.Д.Венедиктова, Г.В.Вемяна, В.Н.Гордиенко, Г.В.Горелова, А.Г.Зюко, Г.В. Кузнецова, М.В. Назарова, И.А.Лозового, А.П.Мановцева, Н.И.Пилипчук, Л.Рабинера, О.Н.Ромашковой (Луковой), А.Ф. Фомина и др.

- теоретических и прикладных исследований цифровых средств и систем передачи информации, В.П.Яковлева и др.

Методы исследования. В работе использованы методы теории вероятностей, математического анализа, теории массового обслуживания.

Научная новизна. Степень научной новизны диссертации определяется тем, что она развивает теорию восстановления речевых сообщений в направлении совершенствования с использованием аппарата имитационного моделирования методики и математического аппарата аналитической оценки качества передачи и восстановления ре¬чи в СЦСП.

Практическая ценность разработанных в диссертации математического аппарата и методов имитационного моделирования заключена в предоставленной воз¬можности получения объективных результатов оценки качества речи по критерию разборчивости, использованных при анализе и проектировании конкретных стохастических цифровых систем передачи.

1. СТАТИСТИЧЕСКОЕ УПЛОТНЕНИЕ ПЕРВИЧНОЙ ЦИФРОВОЙ СИСТЕМЫ ПЕРЕДАЧИ

1.1.Постановка задачи

Многие методы статистического сжатия информации, содержащейся в речевом сообщении (сигнале) основаны на использовании пауз в двусторонних телефонных разговорах, составляющих по разным оценкам от 60 до 70 процентов[52,54,61,64,67].

Рассмотрим состояние вопроса, основываясь на материалах работы [1].

В [1-6] предложены устройства статистического уплотнения, позволяющие объединять цифровые потоки двух комплектов аналого-цифрового оборудования первичной ЦСП.

Известны несколько вариантов работы устройств уплотнения, в частности, с фиксированным и чередующимся приоритетами [2-4, 7].

При реализации фиксированного приоритета основной комплект первичной ЦСП работает в штатном режиме, то есть поток отсчетов его основных цифровых каналов остаются неизменными. Дополнительный комплект передает свои отсчеты при незанятости канальных интервалов информацией основного комплекта и теряет их в противном случае.

При реализации чередующегося приоритета наступление каждого очередного цикла работы ЦСП сопровождается сменой приоритета – основной комплект приобретает свойства дополнительного и наоборот.

Таким образом, основной и дополнительный комплекты находятся в неравноценном положении [7,8]. Если речевой сигнал в основном комплекте подвергается периодической дискретизации, то речевой сигнал дополнительного комплекта приобретает характеристики стохастически дискретизированного сигнала с уменьшенной интенсивностью потока отсчетов.

В работе [8] с использованием изложенной выше методики и аппарата оценивания качества восстановления речи было произведено сопоставление качества передачи основного и дополнительного комплектов.

Использовались модели (2.22),(2.18) из работы [1]. Для стандартной ЦСП при ОСШкв=39 дБ ОСШэкв составило 76 дБ и значение слоговой разборчивости 93%.

При реализации фиксированного приоритета при ОСШкв=33 дБ (уменьшение ОСШкв связано с использованием одного бита кодового слова для передачи синдрома комплекта) в работе [1] для дополнительного комплекта ОСШдискр=25 дБ, ОСШэкв=24 дБ, S=82%.

Таким образом, разборчивость речи в дополнительном комплекте уменьшается на 11% по сравнению со штатной ситуацией, но качество при этом остается отличным (согласно градациям, приведенным на рис.2.3 из [1]), что подтверждает целесообразность применения устройств (систем СЦСП) статистического уплотнения каналов ЦСП, позволяющих практически в два раза увеличить пропускную способность тракта передачи.

В работе [10] без ссылки на первоисточники (среди которых три авторских свидетельства [2-4]) описываются устройства статистического уплотнения. При этом даже не изменена терминология, введенная в этих авторских свидетельствах (‘‘фиксированный и чередующийся приоритеты’’, ‘‘основной и дополнительный комплекты’’ и т.п.). Без ссылки на первоисточники излагаются проблема оценивания качества рассмотренных методов статистического уплотнения и подходы к ее решению.

Все эти заимствования без ссылок на первоисточники составляют едва ли не основное содержание главы 12 работы [10], где приводятся таким же образом формулы 12.5, 12.8, 12.9, 12.10 и др.

Поставим своей целью уточнение результатов [1,8,9].

1.2. Реализации статистического уплотнения, используемое оборудование

На мировом рынке телекоммуникационных систем со статистическим уплотнением наряду с общепризнанными гигантами индустрии высоких технологий Европы и Америки все сильнее заявляет о себе израильская компания ЕСI Telecom Ltd., которая активно работает и на российском рынке.

Первым запущенным в серийное производство стало оборудование уплотнения спутниковых каналов связи DCME (Digital Circuit Multiplication Equipment). При его разработке были использованы собственные ноу-хау, благодаря которым в течение последнего десятка лет конкурирующим компаниям не удается предложить операторам продукцию, сравнимую по техническим параметрам.

Большое развитие получили два направления - оборудование SDH и оборудование DCME, в частности, семейство хТХ: DTX-600/60 для сетей TDM и АТХ-600 для сетей АТМ.

Оборудование компании, поставляемое на российский рынок, имеет возможность модульного развития, обеспечивая защиту произведенных инвестиций, интегрируется с оборудованием предыдущего поколения. Не существует примеров, когда оборудование, введенное в эксплуатацию несколько лет назад, не было бы совместимо с более новыми образцами.

Кроме того, для планирования транспортных сетей используется программный продукт собственной разработки, который позволяет оператору учитывать не только технические, но и экономические параметры и получать оптимальное решение с учетом темпов развития сети, предоставления новых услуг и т. д. [1].

При передаче междугородного и международного трафика телефонии операторы всегда стараются сократить свои операционные расходы, связанные с использованием сетевых ресурсов (арендуемых линий связи, спутниковых трактов) или оптимизировать передачу трафика телефонии по существующим сетям (для увеличения пропускной способности без изменения или реконструкции существующей инфраструктуры) [53,58,62,65,66,71].

Для решения таких задач широко применяются системы статистического мультиплексирования (DCME), позволяющие передавать в одном потоке Е1 (или его части) несколько потоков Е1 с трафиком телефонии. Кроме того, они обеспечивают передачу трафика данных, что повышает эффективность использования выделенного ресурса полосы пропускания. Начиная с 1992 г. компания Veraz Networks Ltd. разрабатывает, производит и продает системы статистического уплотнения по всему миру. Высокое качество оборудования основывается на богатом опыте компании Veraz Networks Ltd. и подтверждается такими операторами, как BT, AT&T, Concert, MCI, Deutsche Telecom, Ростелеком, Совинтел, "Телепорт-ТП", "Комстар", "Комбеллга", "Коминком", ЗАО МТТ, Equant ("Глобал Один") и многими другими. Оборудование DCME установлено более чем в 140 странах мира на международных и местных сетях. В настоящее время компания предлагает оборудование DTX-600 - интегрированную многофункциональную систему цифрового уплотнения DCME, которая обеспечивает наиболее эффективные решения в области оптимизации телекоммуникационных сетей для операторов международной и междугородной связи. Система DTX-600 предназначена для обеспечения сквозного уплотнения для приложений, требующих высочайшего уровня концентрации каналов и услуг. Ее использование гарантирует высокое качество обработки речи и услуг (QoS) для трафика данных, эффективную передачу факсимильных сообщений, данных в речевом диапазоне и сигнализации.

Предлагаемое оборудование обладает высокой масштабируемостью, что делает возможным трансформацию конфигурации сети по мере изменения потребностей рынка (добавление новых функций, изменение скорости передачи данных, увеличение объемов передаваемого трафика городских телефонных сетей и т. д.) [2].

DTX-600 - это высокоэффективная мультисервисная система уплотнения речи и данных, используемая в качестве платформы для оптимизации сети во множестве сетевых приложений и сред конечных пользователей, пример использования которой представлен на рис.1 [72]

Рис.1

Характеристики системы цифрового уплотнения DTX-60:

- коэффициент уплотнения до 20:1;

- поддержка всех существующих и будущих алгоритмов уплотнения;

- динамическое назначение уплотненного канала;

- сквозное уплотнение.

Оборудование системы выпускается в двух вариантах: настольный и стоечный вариант. Может устанавливаться на центральных станциях, удаленных точках связи и в помещениях заказчика. Обеспечивается обработка протоколов сигнализации (по выбору) и поддерживаются протоколы HDLC, PPP, FR и IP (по выбору).

Таким образом системаDTX-60 представляет собой многофункциональную, интегрированную систему уплотнения речевых сообщений и данных. Она образует базовую платформу систем цифрового уплотнения для различных пользовательских сред и сетевых приложений.

Сиcтема DTX-60 может применяться в телефонных сетях общего пользования (PSTN) и в наложенных сетях. Она может обрабатывать трафики речевых и факсимильных сообщений, данных (например, V.24, V.11, V.35, V.36) и VBD (Voice Band Data – Данные речевого диапазона) и осуществлять передачу с помощью протоколов HDLC, PPP, FR и IP, что приводит к повышению эффективности использования среды передачи и дает возможность достигать максимального использования полосы пропускания речи данных.

Компактность конструкции оборудования системы DTX-60 позволяет производить его установку как в помещениях заказчика, так и в главных офисах, а так же позволяет обеспечивать гибкий сервис для поставщика сетевых услуг. Благодаря применению самой передовой технологии и таких алгоритмов, как CS-ACELP на 8 Кбит/с, наряду с такими механизмами сохранения высочайшего качества речи как сквозное уплотнение (End-to-End Compression) и “Spring” модель динамического уплотнения несущего канала, система DTX-60 может осуществлять уплотнение речевого трафика в соотношении 20:1. Пропускная способность выходного уплотненного потока (несущий канал) может достигать от Nх64 кбит/с до полного Е1.

Уникальность системы DTX-60 в том, что в ней можно использовать любой режим уплотнения, соответствующий топологии сети, который выбирается в соответствии с нагрузкой или по тем или иным условиям эксплуатации.

Компания ECI Telecom Ltd. является также лидером в области методов распознавания и классификации сигналов, которые в значительной степени способствуют интеграции системы в среду заказчика и обеспечивают широкий спектр услуг и совместимость с любым протоколом сигнализации.

В отличие от DTX-60 производительность системы DTX-600 в 3-4 раза выше.

Характеристики системы цифрового уплотнения DTX-600:

- коэффициент уплотнения до 20:1;

- поддержка всех существующих и будущих алгоритмов уплотнения;

- высококачественная обработка речевого трафика, факсимильных

- сообщений, данных речевого диапазона и данных;

- динамическое назначение уплотненного канала;

- сквозное уплотнение;

- возможность установки на центральных станциях, удаленных точках связи и в помещениях заказчика;

- обеспечение обработки протоколов сигнализации (по выбору) ;

- поддержка протоколов HDLC, PPP, FR и IP (по выбору).

DTX-600 представляет собой многофункциональную, интегрированную систему уплотнения речевых сообщений и данных. Данная система основана на универсальной платформе разработанной ECI Telecom. Благодаря применению самой передовой технологии и таких алгоритмов, как CS-ACELP на 8 Кбит/с сквозное уплотнение (End-to-End Compression) и “Spring” модель динамического уплотнения несущего канала, система DTX-600 служит мощной платформой сетевого уплотнения для использования в различных средах и сетях или концентратором совместно с системами DTX-60.

Система DTX-600 предназначена для установки в центральной станции (СЕ) или удаленной точке (РОР), а так же в узлах или помещениях заказчика (СР) в больших офисах. Система может одновременно обрабатывать до 24 входных цифровых потоков и обеспечивать крупные группы заказчиков большинством доступных на сегодняшний день решений и услуг.

Семейство оборудования DTX-60/600 включает в себя DTX-60 и DTX-600. Обе системы могут эксплуатироваться как по отдельности, так и вместе, дополняя и улучшая совокупность рабочих характеристик. Оборудование DTX-60/600 может так же использоваться в сочетании с оборудованием NCX производства ECI или другими конечными коммутаторами АТМ, что обеспечивает экономичное решение для концентрации узкополосных и широкополосных услуг небольшим группам заказчиков [3].

Конкуренцию системе DTX-600 составляет шлюз-концентратор речи RAD Vmux-2100, который использует мощные алгоритмы сжатия речи, позволяющие сократить расходы на выделенные линии и повысить эффективность использования IP-сети. Vmux-2100 сжимает до 16 полных каналов Е1/T1 (496/384 телефонных соединения) в один канал Е1/Т1, последовательное или IP-подключение, что позволяет корпоративным пользователям, операторам мобильной связи и поставщикам услуг экономить средства за счет аренды меньшего числа выделенных линий для передачи своего речевого трафика.

Характеристики системы цифрового уплотнения Vmux-2100:

- компрессия до 16 полных каналов Е1/Т1 (496/384 телефонных соединения) в один канал Е1, последовательное или IP-подключение;

- голос высокого качества;

- уменьшение потребности в пропускной способности и стоимости аренды выделенных линий;

- более эффективное использование пропускной способности по сравнению с VoIP;

- конвергенция услуг передачи голоса, факсов и данных, снижающая расходы на сетевую инфраструктуру;

- прозрачная передача сигнализации и трафика ЛВС;

- компактные размеры.

Типовые приложения Vmux-2100 включают передачу голоса по спутниковым каналам, соединение базовых станций сотовых сетей, международный транспорт трафика голоса, местный радиодоступ и организацию телефонной связи в сельских районах. Устройства Vmux могут быть использованы, в частности, в узкополосных приложениях - везде, где существуют ограничения пропускной способности канала для голосового трафика, при передаче по любой транспортной среде (например, спутниковому каналу TDM или IP). В устройстве Vmux-2100 применяются алгоритмы сжатия голоса С.723.1, G.729A и С.711, обладающие оптимальным соотношением цена/эффективность. Vmux-2100 обеспечивает выское качество передачи голоса при рекордно высокой степени сжатия при передаче по каналам TDM или сетям IP. Определение голосовой активности и подавление пауз позволяют Vmux-2100 динамически распределять пропускную способность для телефонных разговоров и передачи факсов, что дает эффективное использование пропускной способности при меньшем числе линий связи. Сигнализация при этом передается отдельно. Поддержка технологии TDMolP позволяет оптимизировать пропускную способность и предлагает реалистичную стратегию миграции к решениям на основе IP. Наличие отдельных портов TDM и Ethernet для соединения с магистральной сетью позволяет использовать для передачи одновременно сети TDM и IP. Благодаря меньшему количеству служебной информации в потоке по сравнению с системами на основе VoIP устройство Vmux увеличивает на 60% пропускную способность канала для дополнительной передачи голоса или данных, что чрезвычайно важно при работе по дорогостоящим или низкоскоростным каналам. Сетевая интеграция является ключевым моментом для достижения максимальной экономии в глобальных сетях. Vmux-2100 позволяет одновременно передавать голос, факсы и трафик Ethernet по одному соединению с магистралью. Объединение услуг передачи голоса и факсов с передачей данных на основе единой транспортной инфраструктуры позволяет операторам связи значительно снизить расходы на эксплуатацию своих сетей. Vmux представляет собой компактное модульное устройство высотой 1U, которое может быть установлено в стандартную стойку 19". Оно имеет наименьшие размеры среди всех устройств сжатия голоса для сетей TDM или шлюзов VoIP аналогичной емкости. На одном шасси могут быть установлены до четырех модулей сжатия голоса, до четырех каналообразующих модулей TDM и до двух блоков питания. Все модули являются съемными для замены в рабочей обстановке; при этом модули сжатия голоса и блоки питания допускают горячую замену [4]. На современном телекоммуникационном рынке большую актуальность получили системы уплотнения речевых каналов с различными реализациями статистического уплотнения. Применение таких систем в реальных сетях связи дает значительный экономический эффект, но существенно по мнению специалистов и пользователей снижает качество передачи речи [5,6,7,70,68,69]. В связи с этим встает вопрос об определении качества стохастической цифровой передачи речевой информации.

Вопросам аналитического моделирования в определении качества передачи речевой информации в системах со статистическим уплотнением посвящены работы [1-6,51], в которых используются различные модели речевого сообщения и потоков его отсчетов в различных вариантах систем.

Актуальность задачи определения качества в системах со статистическим уплотнением требует уточнения результатов этих работ с использованием методов имитационного моделирования.

1.3. Выводы

На основании вышеизложенного можно сделать следующие выводы:

1. В практике современных телекоммуникационных систем все большее применение находят системы уплотнения речевых каналов с различными реализациями статистического уплотнения.

2. По мнению специалистов и пользователей качество передачи речевой информации в системах со статистическим уплотнением уступает качеству в традиционных системах, что определяет актуальность определения качества методами аналитического и имитационного моделирований.

2. СТАТИСТИЧЕСКИЕ СВОЙСТВА ПОТОКА ОТСЧЕТОВ НА ВХОДЕ ИНТЕРПОЛИРУЮЩЕГО ФИЛЬТРА

2.1.Постановка задачи

Для того чтобы анализировать качество передачи при различных реализациях статистического уплотнения с использованием различных модификаций алгоритмов фиксированного и чередующегося приоритетов, необходимы распределения вероятностей занятости канального интервала, распределения вероятностей отбраковки (потери) отсчетов.

Задача построения модели потока отсчетов речевого сигнала на входе интерполирующего фильтра, состоит в отыскании распределения вероятностей р(Х) появления серий отбракованных подряд X отсчетов. Ее решение во многом определяется спецификой построения конкретной СЦСП.

При отбраковке подряд Х=1,2,… отсчетов речи в потоке на входе интерполирующего фильтра возникают пробелы продолжительностью (X+1)/fд

(fд - частота дискретизации).

Таким образом, может быть использована модель рекуррентного потока отсчетов на входе интерполирующего фильтра с плотностью распределения вероятностей интервала Т между соседними отсчетами

X=0, 1, 2… , (2.1)

где (.) - дельта-функция.

Для экспериментального определения p(X) в среде Delphi разработана программа PCM.pas моделирования СЦСП. В качестве входных данных используем два файла типа «RAW», каждый из которых получен путем конвертирования реальной аудиозаписи телефонного разговора двух пар абонентов. Файл типа RAW представляет собой побайтный поток отсчетов ИКМ. Файлы имеют параметры, соответствующие рекомендации G.711 ITU-T.

Для определения статистики коллизий, «столкновения отсчетов» основного и дополнительного комплекта каждый отсчет основного комплекта преобразуем к виду «активный/пассивный» с шумовым порогом значения отсчета в пределах 123-133 (значение отсчета в 128 считается нулевым). [51] Результатом моделирования является оценка распределения вероятностей p(X). Блок схема программы и её текст представлены в Приложении 1.

Рассмотрим примеры моделирования.

Два комплекта. Фиксированный приоритет.

Для определения достаточной при моделировании продолжительности реализации речевого сообщения (будем измерять ее величинами L в отсчетах и t в минутах) используем развитие оценки вероятности ? отбраковки отсчета дополнительного комплекта и относительной погрешности ??,% ее определения в зависимости от продолжительности реализаций (табл. 2.1 и рис. 2.1).

Таблица 2.1

Оценка вероятности ? при продолжительности реализаций речевых сообщений основного и дополнительного комплектов L, отсчет и t, мин

L 240000 480000 960000 1440000 2400000 3360000 4800000 7200000 9600000 12568000

t 0,5 1 2 3 5 7 10 15 20 26,18

? 0,274 0,316 0,294 0,279 0,270 0,276 0,295 0,292 0,301 0,297

??, % 7,74 6,39 -1,01 -6,06 -9,09 -7,07 -0,68 -1,68 1,35 0

Рис. 2.1

Как следует из рис. 2.1, значение оценки ? практически стабилизируется (при выполнении условия ???? <2%) при t ? 10 мин. С запасом выбираем продолжительности L=12568000 отсчетов (26,18 мин) для реализаций речевых сообщений основного и дополнительного комплектов.

На рис. 2.2 и в табл. 2.2 представлен результат моделирования - распределение вероятностей р(Х) случайной величины X количества подряд отбракованных отсчетов речевого сообщения дополнительного комплекта.

Рис. 2.2.

Таблица 2.2

Распределение вероятностей p(X) при значениях случайной величины Х, отсчет

Х 0 1 2 3 4 5 6 7 8

Р(Х) 0,702808 0,102373 0,057316 0,036408 0,025119 0,018593 0,014199 0,010940 0,008455

Х 9 10 11 12 13 14 15 16 17

Р(Х) 0,006542 0,005135 0,003750 0,002706 0,001977 0,001397 0,001001 0,000735 0,000547

Два комплекта. Чередующийся приоритет.

На рис. 2.3 и в табл. 2.3 представлен результат моделирования - распределение вероятностей P1(Х) (основного комплекта) и P2(X) (дополнительного комплекта) случайной величины X количества подряд отбракованных отсчетов речевого сообщения основного и дополнительного комплекта. Названия «основной» и «дополнительный» применяем условно, поскольку оба комплекта находятся в равноценных условиях.

Рис. 2.3.

Количество подряд отбракованных отсчетов ограничено шестнадцатью, т.к. приоритет чередуется через цикл Е1 в 4096 бита. Соответственно на каждый канал ОЦК приходится по 16 байт. Т.к. существует ненулевая вероятность превышения шестнадцати подряд отбракованных отсчетов, то на рис. 2.3 наблюдается локальный максимум в значении Х=16.

Таблица 2.3

Распределение вероятностей p(X) при значениях случайной величины Х, отсчет

Х 0 1 2 3 4 5 6 7 8

Р1(Х) 0,33437 0,04064 0,02716 0,01918 0,01463 0,01170 0,00944 0,00767 0,00634

Х 9 10 11 12 13 14 15 16

Р1(Х) 0,00537 0,00444 0,00359 0,00306 0,00260 0,00214 0,00181 0,00655

Х 0 1 2 3 4 5 6 7 8

Р2(Х) 0,33412 0,04075 0,02736 0,01904 0,01462 0,01160 0,00945 0,00767 0,00631

Х 9 10 11 12 13 14 15 16

Р2(Х) 0,00533 0,00448 0,00370 0,00309 0,00251 0,00212 0,00180 0,00667

Сравнивая значения, приведенные в табл. 2.2 и 2.3, можно получить подтверждение очевидному преимуществу алгоритма с чередующимся приоритетом (вероятность отбраковки отсчета при использовании этого алгоритма равна 0,334, а при фиксированном приоритете её значение составляет 0,702).

2.2. Аппроксимации вероятностных характеристики потока отсчетов

Можно при описании экспериментальных распределений вероятностей р(Х) случайной величины X количества подряд отбракованных отсчетов речевого сообщения дополнительного комплекта использовать аппроксимирующие непрерывные функции (экспоненциальную, гиперэкспоненциальную, аппроксимацию полиномами и пр.) Однако целесообразно не прибегать к аппроксимациям, используя в расчетных формулах оценивания качества восстановления речевого сообщения непосредственно экспериментальные распределения вероятностей. Иллюстрируем погрешности, вносимые аппроксимациями.

В работе [9] при предположении испытаний по схеме Бернулли

(независимости испытаний, состоящих в определении ненулевого отсчета речевого сообщения основного комплекта) предложено геометрическое распределение вероятностей неотбраковки отсчета речевого сообщения дополнительного комплекта в первый раз после точно X испытаний (через ? обозначена вероятность неотбраковки отсчета дополнительного комплекта).

; X=0,1,2,..; 0???1. (2.2)

Очевидно, что

?=1- ?. (2.3)

Подставляя полученные по результатам моделирования значения ?=0,29719247 в (2.3) и (2.3) в (2.2) получаем значения аппроксимации (2.2) распределения p(X), представленное в табл. 2.4 .

Таблица 2.4

Распределение вероятностей p(X) при значениях случайной величины Х, отсчет

Х 0 1 2 3 4 5 6 7 8

Р(Х) 0,702808 0,208869 0,062074 0,018448 0,005483 0,001629 0,000484 0,000144 0,000042

Х 9 10 11 12 13 14 15 16 17

Р(Х) 0,000013 0,000004 0,000001 0,0000003 0,0000001 0,00000003 0,00000001 0 0

Сравнивая результаты табл. 2.2, 2.4 можно отметить существенное их расхождение в значениях p(X) за исключением естественного совпадения значений p(0) =1 – ?.

Два комплекта. Чередующийся приоритет.

По аналогии с системой с фиксированным приоритетом аппроксимируем распределение вероятностей P(X) для чередующегося приоритета, результаты которой представлены в табл. 2.5.

Таблица 2.5

Распределение вероятностей p(X) при значениях случайной величины Х, отсчет

Х 0 1 2 3 4 5 6 7 8

Р1(Х) 0,33437 0,22257 0,14815 0,09861 0,06564 0,04369 0,02908 0,01936 0,01289

Х 9 10 11 12 13 14 15 16

Р1(Х) 0,00858 0,00571 0,00380 0,00253 0,00168 0,00112 0,00075 0,00050

Х 0 1 2 3 4 5 6 7 8

Р2(Х) 0,33412 0,22248 0,14815 0,09865 0,06569 0,04374 0,02913 0,01939 0,01291

Х 9 10 11 12 13 14 15 16

Р2(Х) 0,00860 0,00573 0,00381 0,00254 0,00169 0,00113 0,00075 0,00050

Сравнивая результаты табл. 2.3, 2.5 можно отметить существенное их расхождение в значениях p(X) за исключением естественного совпадения значений p(0) =1 – ?. Анализ значений распределений вероятностей СЦСП с фиксированным и чередующимся приоритетами позволяет сделать предварительный вывод об обеспечении лучшего качества передачи СЦСП с чередующимся приоритетом по сравнению с дополнительным комплектом СЦСП с фиксированным приоритетом и худшего качества по сравнению с основным комплектом.

2.3. Выводы

1. Для обеспечения анализа качества передачи речевого сообщения в различных модификациях ЦСП со статистическим уплотнением (с различными алгоритмами фиксированного и чередующегося приоритетов) получены распределения вероятностей занятости канального интервала и распределения вероятностей появления серий отбракованных подряд отсчетов.

2.Определена продолжительность реализации речевого сообщения, достаточная для экспериментального определения статистики коллизий, «столкновения отсчетов» основного и дополнительного комплекта СЦСП (определения оценки распределения вероятностей числа подряд отбракованных отсчетов).

Значение оценки вероятности отбраковки отсчета стабилизируется при t ? 10 мин.

3. Определена оценка распределения вероятностей числа подряд отбракованных отсчетов речевого сообщения дополнительного комплекта.

4. Определено, что геометрическое распределение, традиционно используемое для аппроксимации экспериментального распределения вероятностей числа подряд отбракованных отсчетов, не обеспечивает приемлемую точность аппроксимации.

5. Получено подтверждение очевидному преимуществу алгоритма с чередующимся приоритетом (вероятность отбраковки отсчета при использовании этого алгоритма равна 0,334, а при фиксированном приоритете её значение составляет 0,702).

6. При аналитическом определении качества восстановления речевого сообщения в СЦСП целесообразно не прибегать к аппроксимациям, используя в расчетных формулах непосредственно экспериментальное распределение вероятностей числа подряд отбракованных отсчетов.

3. СТАТИСТИЧЕСКИЕ СВОЙСТВА ОТСЧЕТА НА ВХОДЕ ИНТЕРПОЛИРУЮЩЕГО ФИЛЬТРА

3.1. Постановка задачи

Для того чтобы анализировать качество передачи при различных реализациях статистического уплотнения с использованием различных модификаций алгоритмов фиксированного и чередующегося приоритетов, необходимы распределения вероятностей отсчета речевого сигнала на входе интерполирующего фильтра.

Все методы статистического уплотнения первичной цифровой системы передачи, реализуемые объе¬динением групповых сигналов от двух стандартных комплектов аналого-цифрового оборудования, объединяет необходимость передачи в кодовой группе (слове) признака (синдрома) комплекта [6,8,9]. Введение син¬дрома приводит к изменениям в структуре кодового слова (к нарушению условий, определяемых Рекомендацией G.711 ITU-T (МККТТ).

При необходимости введения синдрома комплекта целесообразно использовать для этой цели последний разряд кодово¬го слова. Если с него полностью снимаются функции определе¬ния величины отсчета сигнала, то средняя величина шага квантования уменьшается со значения ?=1/128 до значения ?=1/64 (при использовании А- и ?- характеристик компрессии) и качество квантования речевого сигнала естественно ухудшается [6,8,9].

Анализ степени ухудшения качества квантования предполагает исследование усредненной по времени плотности ра¬спределения вероятностей мгновенного значения речевого сигнала, с целью получения усредненной по времени плотности ра¬спределения вероятностей отсчета речевого сигнала на входе интерполирующего фильтра.

3.2. Аналитическое описание плотности ра¬спределения вероятностей мгновенного значения речевого сигнала

При оценке качества передачи речевого сигнала в пер¬вичной цифровой системе передачи широко используются раз¬личные аппроксимации усредненной по времени плотности ра¬спределения вероятностей мгновенного значения речевого сигнала. Известны модели Величкина, Давенпорта, Ричардса других исследователей [43].

Для аппроксимации одномерной плотности распределения вероятностей в работах [8,13] предложена достаточно хорошо зарекомендовавшая себя при анализе русскоязычных речевых сообщений плотность гиперэкспоненциального распределения

(3.1)

где R, ?, ? -коэффициенты.

В работах [8,13] с учетом условия нормировки

(3.2)

и выражения для дисперсии ?2х речевого сигнала

. (3.3)

выражение (3.1) преобразовано к виду

, (3.4)

где среднее квадратическое отклонение

(3.5)

Коэффициенты ? и ? связаны с дисперсиями согласных и гласных. При условии, что мощность гласных звуков русской речи в среднем в 200 раз превышает мощность согласных [11] (?2/?2=200), в работах [8,13] получена еще одна форма записи плотности (3.1)

(3.6)

где К - нормировочный коэффициент; (для русскоязычного речевого сообщения К=0,64);

С использованием (3.2), (3.3) и ?2/?2=200 предложим еще одну форму записи (3.1), совпадающую с (3.6) по значениям коэффициентов. Для коэффициентов в (3.1) получаем значения

R =0,6383422/?х; ? =19,331728/?х ; ?=1,3669596/?х. (3.7)

Значения аппроксимации WА1(х) (3.1), (3.7) представлены в табл. 3.1.

Таблица 3.1

Значения произведения ?хW(х) при значениях случайной величины

х/?х

х/ ?х 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8

?хWА1(х) 1,277 0,649 0,499 0,425 0,370 0,322 0,281 0,245 0,214

х/ ?х 0,9 1,0 1,5 2,0 2,5 3,0 3,5 4,0 5,0

?хWА1(х) 0,186 0,163 0,082 0,041469 0,021 0,011 0,0053 0,0027 0,0007

В работе [8] были проведены экспериментальные исследования с целью проверки применимости гиперэкспоненциальной модели распределения вероятностей речевого сигнала.

Непрерывный речевой сигнал преобразовывался в цифровую форму 10-разрядным АЦП К572ПВ1. Частота дискре¬тизации составляла 16 кГц. Спектр речевого сигнала предва¬рительно ограничивался фильтром нижних частот с частотой среза 3.7 кГц. Было иллю¬стрировано соответствие разработанной в [1,8,13] гиперэкспоненциальной модели плотности распределения вероятностей результатам эк¬сперимента.

Уточним параметры модели (3.1) на основании более представительного экспериментального исследования плотности ра-спределения вероятностей мгновенного значения речевого сигнала.

3.3. Экспериментальная плотность ра¬спределения вероятностей мгновенного значения речевого сигнала

Рассмотрим примеры экспериментального определения WЭ(х) плотности ра¬спределения вероятностей мгновенного значения речевого сигнала. Используем гораздо более точное цифровое представление непрерывного речевого сигнала по сравнению с цифровым представлением, реализуемым (согласно рекомендации G.711 ITU-T) в объекте диссертационного исследования – первичной ЦСП. Значение частоты дискретизации в эксперименте составляет 44100 Гц (в рекомендации G.711 – 8000 Гц). Используем равномерное квантование на 216 = 65536 уровней (в рекомендации G.711 – неравномерное 28 = 256 уровней). Определялись вероятности значений отсчетов, попадающих в пределы от - 32768 до +32768. Использовался язык программирования Perl, в качестве входных данных - файл типа «RAW» («аудио книга»). Блок-схема и тест программы представлены в приложении 2.

С целью определения достаточной (для экспериментального определения плотности) продолжительности реализации речевого сообщения (которую будем измерять величинами L, отсчет и t, мин.) используем развитие оценок математического ожидания mх и среднего квадратического отклонения ?х, а также относительных погрешностей ?mх, ??х,% их определения, от продолжительности реализаций (табл. 3.2 и рис. 3. 1 а и б соответственно).

Таблица 3.2

Оценки математического ожидания mх и среднего квадратического отклонения ?х, относительные погрешности ?mх, ??х,% при продолжительности реализаций речевого сигнала L,отсчет и t, мин

L 441000 1323000 2646000 5292000 13230000 26460000 52920000 79380000 119070000 158760000

t 0,167 0,5 1 2 5 10 20 30 45 60

mх 0,026925 0,067622 0,074837 0,084552 0,045316 0,042567 0,040942 0,039719 0,039506 0,039578

?х 1552,07 1920,67 2045,38 1938,12 1960,76 1900,02 1822,18 1787,51 1754,37 1762,65

?mх -31,97 70,86 89,09 113,63 14,50 7,55 3,45 0,36 -0,18 0

??х -11,95 8,96 16,04 9,95 11,24 7,79 3,38 1,41 -0,47 0

a)

б)

Рис. 3.1

Как следует из табл. 3.2 и рис.3.1, значение оценок ?х и mх практически стабилизируется (при выполнении условия ???? <1,5%) при t ? 30 мин. С запасом выбираем значение продолжительности t = 60 мин (L= 158760000 отсчетов) реализации речевого сигнала (mх =0,039578; ?х = 1762,65).

В табл. 3.3 и на рис.3.2 представлен результат моделирования - плотность WЭ1(х) распределения вероятностей случайной величины х мгновенного значения речевого сигнала. Площадь плотности WЭ1(х) в диапазоне ± 3?х составляет 0,9763.

Таблица 3.3

Значения произведения ?хWЭ1(х) при значениях случайной величины х/?х,

х/?х -10 -7,5 -5 -4,5 -4,0 -3,5 -3,0

?хWЭ1(х) 0 0,000011 0,00078 0,00115 0,00239 0,00550 0,01095

х/?х -2,5 -2,0 -1,5 -1,0 -0,9 -0,8 -0,7

?хWЭ1(х) 0,02211 0,03777 0,06477 0,11518 0,12532 0,14290 0,16219

х/?х -0,6 -0,5 -0,4 -0,3 -0,2 -0,1 0

?хWЭ1(х) 0,18249 0,20931 0,23805 0,27922 0,33648 0,47281 179,83

х/?х 0,1 0,2 0,3 0,4 0,5 0,6 0,7

?хWЭ1(х) 0,44869 0,27854 0,20645 0,16843 0,14311 0,12404 0,11045

х/?х 0,8 0,9 1,0 1,5 2,0 2,5 3,0

?хWЭ1(х) 0,09810 0,08699 0,07815 0,05507 0,03880 0,02581 0,01688

х/?х 3,5 4,0 4,5 5 7,5 10

?хWЭ1(х) 0,00960 0,00570 0,00369 0,00199 0,00011 0,00001

Рис.3.2

Поскольку динамический диапазон речевого сигнала должен совпадать с диапазоном кодера и составлять 40 дБ по мощности согласно рекомендации G.712 ITU-T [24], постольку, используя диапазон значений случайной величины х мгновенного значения речевого сигнала -100<х<100, получаем плотность WЭ(х) для речевого сигнала, динамический диапазон которого совпадает с диапазоном кодера (табл. 3.4).

Подбор аппроксимации речевого сигнала.

Таблица 3.4

х/?х ?хWЭ(х) ?хWА1(х) ?хWА2(х) ?хWА3(х) ?хWА4(х)

-3,5 0 0,005 0,0000000000 0,014 0,005865

-3 0 0,011 0,0000000011 0,021 0,010522

-2,5 0,030 0,021 0,0000000432 0,037 0,018874

-2 0,036 0,041 0,0000016390 0,051 0,033859

-1,5 0,044 0,082 0,0000621847 0,080 0,060739

-1 0,064 0,163 0,0023592731 0,110 0,108958

-0,9 0,072 0,186 0,0048819930 0,116 0,122467

-0,8 0,082 0,214 0,0101022033 0,121 0,137651

-0,7 0,095 0,245 0,0209042722 0,125 0,154717

-0,6 0,108 0,281 0,0432567611 0,130 0,173899

-0,5 0,123 0,322 0,0895102861 0,134 0,195469

-0,4 0,175 0,370 0,1852217114 0,137 0,220641

-0,3 0,258 0,425 0,3832753067 0,161 0,278351

-0,2 0,376 0,499 0,7931033591 0,411 0,660331

-0,1 0,803 0,649 1,6412677300 1,352 2,027483

0 6,792 1,277 6,7920000000 2,137 3,179059

0,1 0,803 0,649 1,6412677300 1,352 2,027483

0,2 0,375 0,499 0,7931033591 0,411 0,660331

0,3 0,258 0,425 0,3832753067 0,161 0,278351

0,4 0,175 0,370 0,1852217114 0,137 0,220641

0,5 0,123 0,322 0,0895102861 0,134 0,195469

0,6 0,108 0,281 0,0432567611 0,130 0,173899

0,7 0,095 0,245 0,0209042722 0,125 0,154717

0,8 0,082 0,214 0,0101022033 0,121 0,137651

0,9 0,071 0,186 0,0048819930 0,116 0,122467

1 0,064 0,163 0,0023592731 0,110 0,108958

1,5 0,044 0,082 0,0000621847 0,080 0,060739

2 0,036 0,041 0,0000016390 0,051 0,033859

2,5 0,030 0,021 0,0000000432 0,037 0,018874

3 0,0009 0,011 0,0000000011 0,021 0,010522

3,5 0 0,005 0,0000000000 0,014 0,005865

Иллюстрируем погрешности, вносимые аппроксимациями,

Значения аппроксимации WА1(х) (y,1), (y,7) полученной в [8] на основании анализа менее представительной выборки (продолжительности реализации речевого сообщения, исчисляемой десятками секунд) представлены в табл.3.4.

Сравнивая значения WА1(х) и WЭ(х) можно отметить существенное их расхождение.

Отметим, что сравнение производится для нормированных плотностей, то есть при одинаковых значениях ?х, а, следовательно, и одинаковых значениях мощности речевого сообщения,

Можно уточнить параметры аппроксимации (3,1),

Приводя параметры аппроксимации к экспериментальным оценкам ?х=27,745 и WЭ(0)=2R=0,2448, а также используя условия (3,2) и ?2/?2=200, определяем аппроксимацию WА2(х) по формуле (3,1) со значениями коэффициентов

R =3,396/?х; ? =102,845/?х ; ? =7,272/?х, (3,8)

Значения аппроксимации WА2(х) (3,1), (3,8) представлены в табл, 3,4,

В табл, 3,4 для сравнения представлены и аппроксимации А,И,Величкина WА3(х) (формула (2,3) из работы [8]) и Давенпорта WА4(х) (формула (2,3) из работы [8] при ?х1 = 1,22 и ?х2 = 0,11),

На рис,3,3 представлены графики плотности WЭ(х) распределения вероятностей случайной величины х мгновенного значения речевого сигнала, полученной по результатам эксперимента, и ее аппроксимаций WА1(х) - WА4(х), Сравнивая графики рис, 3,3 можно отметить более адекватное описание экспериментальной плотности WЭ(х) аппроксимацией (3,1), (3,8) по сравнению с другими аппроксимациями, Однако точность описания экспериментальной плотности и при ее применении остается не достаточно высокой,

Как следует из изложенного можно при описании экспериментального распределения вероятностей WЭ(х) случайной величины мгновенного значения речевого сигнала аппроксимирующие непрерывные функции (3,1),(3,8), А,И, Величкина, Давенпорта, Ричардса, и пр, Однако целесообразно не прибегать к аппроксимациям, используя в расчетных формулах оценивания качества восстановления речевого сообщения непосредственно экспериментальное распределение вероятностей,

Рис. 3.3

3.4. Выводы

1.Определена достаточная для экспериментального определения оценки плотности распределения вероятностей случайной величины мгновенного значения речевого сообщения продолжительность его реализации. Значение оценок математического ожидания и дисперсии стабилизируются при t ? 30 мин.

2.Определена оценка плотности распределения вероятностей случайной величины мгновенного значения речевого сообщения при условии согласования его динамического диапазона с диапазоном кодера ЦСП.

3.Определено, что используемая для описания экспериментального распределения вероятностей гиперэкспоненциальная аппроксимация, превосходящая по точности аппроксимирующие функции Величкина, Давенпорта, Ричардса, не обеспечивает приемлемую точность аппроксимации.

4.При аналитическом определении качества восстановления речевого сообщения в ЦСП целесообразно не прибегать к аппроксимациям, используя в расчетных формулах непосредственно экспериментальное распределение вероятностей.

4. КАЧЕСТВО ВОСПРОИЗВЕДЕНИЯ РЕЧИ ПРИ

СТАТИСТИЧЕСКОМ УПЛОТНЕНИИ

4.1. Постановка задачи

В качестве критерия точности воспроизведения речевого сигнала будем использовать нормированный показатель погрешности - средний квадрат (усреднение по множеству реализаций) ошибки, шума воспроизведения (текущей разности между исходным и восстановленным речевым сообщением), усредненный по времени и приведенный к дисперсии сообщения [1,14]

, (4.1)

где - мощность шума,

- мощность сигнала.

Отношение мощности сигнала к мощности шумов [1,14]

ОСШ=10lg , дБ. (4.2)

Различная природа стационарных, статистически не связанных с речевым сообщением шумов и шумов, коррелированных с ним, определяет различную степень их влияния на субъективную оценку качества передачи речи. Коррелированные с речевым сообщением шумы оказывают существенно меньшее отрицательное воздействие на качество. Это не позволяет непосредственно суммировать мощность стационарных шумов аналоговых каналов с мощностью коррелированных с сообщением шумов в смешанном аналого-цифровом канале [15,16].

Шумы квантования по уровню (отношение сигнал/шум – ОСШК) относятся к шумам, коррелированным с речевым сообщением, а шумы дискретизации и восстановления (отношение сигнал/шум – ОСШД) речевого сообщением по его отсчетам – не коррелированным [9].

Через ОСШэкв обозначают эквивалентное отношение мощности сигнала к мощности стационарного шума в незанятом канале. Эквивалентность понимается как соответствие абонентских оценок влияния обеих категорий шума.

Зависимость ОСШэкв от отношения ОСШкорр мощности сигнала к мощности шума, коррелированного с речевым сообщением, без учета добавочного стационарного шума незанятого канала (фонового шума) экспериментально определена в [16], где предлагаются две ее аппроксимации

, (4.3.)

предложенная компанией AT&T и

, (4.4)

предложенная почтовым ведомством Великобритании.

В этих экспериментах принималось, что фоновый шум имеет уровень в диапазоне 41-61 дБ, а уровень речевого сигнала занимает диапазон 67-91 дБ.

В формулах все отношения мощности сигнала к мощности шума выражены в дБ.

В рекомендациях [16], представлена зависимость ОСШэкв от отношения ОСШкорр при учете фонового шума. При обозначении ОСШфон отношения мощности сигнала к мощности добавочного стационарного шума, в работе[9] предложена аппроксимация этой зависимости

. (4.5)

Пороговое значение при фиксированном значении определяем по формуле [9]

. (4.6)

При при заданном следует использовать формулу (4.5) для определения . При для этой цели следует воспользоваться формулами (4.3) или (4.4) [9].

Одним из главных критериев точности воспроизведения речевого сигнала является разборчивость.

Мерой разборчивости является процент правильно принятых по испытываемому тракту элементов речи (звуки, слоги, слова, фразы) от общего числа передаваемых элементов.

Разборчивость телефонного тракта можно определить экспериментально или рассчитать.

Чаще всего определяют слоговую разборчивость, т.е. разборчивость звукосочетаний, не имеющих смыслового значения. Слоги составляют по определенным правилам и передают в виде таблиц по 100 слогов в каждой. Для получения достаточно достоверных результатов необходимо передать по испытываемому тракту не менее 2000 слогов при участии специально подготовленных операторов. Процент правильно принятых слогов называется коэффициентом слоговой разборчивости S и служит критерием качества телефонной передачи. Качество испытываемого тракта считают удовлетворительным при слоговой разборчивости S = 40 - 55 %, хорошим - при S= 55 - 80 % и отличным - при S > 80 %. Между разборчивостью слогов и других элементов речи существует определенная зависимость: зная слоговую разборчивость, можно определить разборчивость звуков D, слов W и фраз I (рис.2.3) [15].

На основании экспериментальных данных работы [15] в работе[12] получена зависимость слоговой разборчивости от эквивалентного отношения сигнал/шум [12 рис.2.4].

Можно пересчитать результирующее отношение сигнал/шум в слоговую разборчивость для случая русскоязычного речевого сообщения по формуле [9]

, (4.7)

а в случае, например, сообщения на вьетнамском языке - по формуле [17,18]

S = 23 + 81[1 - exp (- 0,05 ОСШэкв)]. (4.8)

4.2. Определение отношения сигнал/шум дискретизации и восстановления.

На основании полученных в главе 2 экспериментальных распределений вероятностей р(Х) случайной величины X количества подряд отбракованных отсчетов сообщения устной речи произведем оценку качества его восстановления, используя методику [1,8].

Отношение мощности сигнала к мощности шумов, вызванных процессами восстановления (ОСШД) [1,8] имеет вид:

(4.9)

,

где ; ; ; ;

- частота среза идеального ФНЧ, используемого при восстановлении;

- частота среза идеального ФНЧ, используемого при предварительном ограничении спектра;

; ;

Q = ‹(х+1)( + )/ ›;

‹ › - операция округления до большего целого значения.

В формуле (4.9) использована аппроксимация [12] нормированной в области положительных частот усредненной спектральной плотности мощности речи

,

где =1000 Гц;

=400 Гц;

;

?0=2?f0;

Fн, Fв – нижняя и верхняя частоты спектральной плотности мощности.

В работе [1] показана высокая степень соответствия этой аппроксимации аппроксимации спектральной плотности мощности речи

,

предложенной в [1, 41] на основании рекомендаций Р.51 ITU-T [42].

Фиксированный приоритет.

Для исходных данных =1800Гц, = =3400 Гц, g=2,5, =8000Гц [1,8] при использовании распределения р(Х), представленного в табл.2.2 получаем по формуле (4.9) оценку ОСШД=26,2 дБ. А при использовании распределения p(X), представленного в табл.2.4 – ОСШД=32,1 дБ.

Таким образом, при известной оценке вероятности ? потери пакета использование геометрического (2.4) распределения приводит к завышенной оценке качества восстановления речевого сообщения дополнительного комплекта.

Чередующийся приоритет.

В случае использования алгоритма с чередующимся приоритетом с использованием данных табл. 2.3. получено значение ОСШД=27, 02 дБ.

Получено подтверждение преимуществу алгоритма с чередующимся приоритетом (ОСШД при использовании этого алгоритма равно 27,02, а при фиксированном приоритете его значение составляет 26,2 дБ). Т.о. преимущество составляет менее одного децибела, хотя вероятность отбраковки отсчета при чередующемся приоритете практически в два раза меньше.

4.3. Определение отношения сигнал/шум квантования в стандартной первичной ЦСП с использованием аппроксимаций ра¬спределения вероятностей мгновенного значения речевого сигнала

Цифровая передача сообщения устной речи предусматривает необходимость не только дискретизации первичного речевого сигнала (аналога сообщения устной речи) по времени, но и квантования по амплитуде с тем, чтобы отсчеты сигнала можно было затем представить двоичными кодовыми словами.

Известно [19], что если на вход квантователя с N раз¬решенными уровнями и шагом квантования ? поступает сигнал, находящийся в пределах разрешенной области от – N+?/2 до +N- ?/2, то осуществляется обычное квантование, которое ха¬рактеризуется некоторой величиной шумов квантования (при равномерном квантовании мощность шумов квантования состав¬ляет ?2/12 ) .

Если сигнал на входе выходит за пределы этой области, сигнал на выходе будет иметь максимальный разрешенный уро¬вень +N-A/2. Этот случай соответствует работе в точке рез¬кой перегрузки и называется режимом ограничения. Мощность шумов из-за ограничения как значение среднеквадратичной ошибки между выходным и входным сигналами в области, где входной сигнал х превышает максимальные уровни квантования N- ?/2, может быть определена [19]

(4.10)

где W(X) - плотность распределения мгновенных значений входного сигнала.

В большинстве практических задач уровень перегрузки принимается равным +3дБмО.

Мощность шумов ограничения оценена в [8] при использовании плотности ра¬спределения вероятностей мгновенного значения речевого сигнала (3.6)

(4.11)

Заметим, что шумы квантования и ограничения не возни¬кают одновременно (так как соответствуют различным отсчетам сигнала, которые для стандартной ЦСП слабо коррелированы между собой). Таким образом, общая мощность шумов, возника¬ющих в процессе квантования, определяется суммой мощностей этих со¬ставляющих.

Использование равномерного (линейного) квантования для передачи телефонных сигналов не является оптимальным по следующим причинам:

- распределение амплитуд телефонного сигнала не яв¬ляется равномерным: малые амплитуды сигнала более вероятны,

чем большие. В этом случае можно ожидать увеличения отношения сигнал - шум квантования, если ошибку квантования сде¬лать меньшей для более вероятных амплитуд;

- телефонные каналы имеют весьма широкий динамический

диапазон (порядка 40 дБ), в пределах которого должно

обеспечиваться примерно постоянное отношение сигнал - шум

квантования. При использовании равномерного квантования

указанное отношение для слабых сигналов будет практически

на 40 дБ хуже, чем для сильных.

В реальных ЦСП используется не¬равномерное квантование, осуществляемое пу¬тем использования компрессирования динамического диапазона сигнала перед равномерным квантованием и последующего его экспандирования после декодирования. Для оптимизации характеристики ком¬прессии с точки зрения обеспечения постоянства отношения сигнал - шум квантования необходимо, чтобы искажения были пропорциональны амплитуде сигнала для любого уровня. Для выполнения этого условия используется логарифми¬ческий закон компрессирования. На практике (согласно рекомендации G.711 ITU-T) используются модификации логарифмической функции: А- и ?-характеристики компрессии [20-22]:

(4.12)

(4.13)

Мощность шумов квантования определяется в виде [19]:

(4.14)

При неравномерном логарифмическом квантовании шаг квантования, как следует из (4.14)), обратно пропорциона¬лен крутизне у'(х) закона компандирования.

Из [21] известно, что средняя мощность шумов кванто¬вания может быть выражена следующим образом

(4.15)

Для А-характеристики компрессии имеем выражение для производной [8]

, (4.16)

а для случая использования ?-характеристики компрессии [25]

(4.17)

Для случая использования А-характеристики компрессии [8]

(4.18)

Используя гиперэкспоненциальную одномерную плотность распределения вероятностей речевого сигнала (3.1), можно получить выражения отношения ОСШК мощности сигнала к мощ¬ности шумов квантования для А-характеристики компрессии [8]

, (4.19)

для ?-характеристики компрессии [25]

. (4.20)

В табл. 4.1 представлены зависимости ОСШК от мощности сигнала р для А- и ?-характеристик компрессии при использовании аппроксимаций WА1(х) (3.1), (3.7) и WА2(х) (3.1), (3.8) плотности ра¬спределения вероятностей мгновенного значения речевого сигнала (за значение р=0 дБ приня¬та мощность сигнала, при которой совпадают его динамический диапазон с диапазоном кодера

Таблица 4.1

Значения ОСШК, дБ при значениях р, дБ

0 -10 -20 -30 -40 -50 -60

ОСШК при А=87,6 использовании WА1(х) 53,55 45,54 42,90 24,40 4,40 -15,59 -35,59

ОСШК при А=87,6 использовании WА2(х) 53,72 43,36 41,76 24,40 4,40 -15,59 -35,59

ОСШК при ?=100 использовании WА1(х) 69,20 61,01 49,20 32,42 12,92 -7,02 -27,02

ОСШК при ?=100 использовании WА2(х) 67,61 59,89 48,53 32,27 12,90 -7,02 -27,02

ОСШК при ?=255 использовании WА1(х) 73,25 65,22 54,52 39,77 20,93 1,06 -18,91

ОСШК при ?=255 использовании WА2(х) 71,66 64,06 53,63 39,46 20,89 1,06 -18,91

Графики зависимости ОСШК от мощности сигнала р пред¬ставлены на рис. 4.1 для стандартного значения ? = 1/128. Лома¬ной линией на рисунке приведена норма, рекомендованная ITU-T, для отношения сигнал-шум квантования (G-712).

Рис. 4.1

Использование характеристики компрессии с параметром ?=255 оказывается более выгодным по сравнению с А-характеристикой компрессии, так как обеспечивает более существен¬ное превышение нормы на отношение сигнал-шум [8].

Использование аппроксимации WА2(х) (3.1), (3.8), уточняющей описание формы плотности ра¬спределения вероятностей мгновенного значения речевого сигнала по сравнению с аппроксимацией WА1(х) (3.1), (3.7) (3.8), приводит к незначительному уменьшению ОСШК.

4.4. Определение отношения сигнал/шум квантования в ЦСП со статистическим уплотнением с использованием аппроксимаций ра-спределения вероятностей мгновенного значения речевого сигнала

Как было отмечено выше, все многообразие методов статистического уплотнения первичной цифровой системы передачи, заключающегося в формировании группового сигнала путем объединения сигналов от двух стандартных комплектов аналого-цифрового оборудования [4-6], объединяет необходимость передачи в кодовой группе (слове) признака (синдрома) комплекта. Введение син¬дрома приводит к изменениям в структуре кодового слова (нарушению Рекомендации G.711 ITU-T). Оценим влияние этих изменений на точность квантования по уровню в первичной цифровой системе передачи.

Для введения синдрома комплекта целесообразно использовать последний разряд кодово¬го слова. Если с него полностью снимаются функции определе¬ния величины отсчета сигнала, то средняя величина шага квантования уменьшается до значения ?=1/64.

В табл.4.2 для значения ? = 1/64 представлены зависимости ОСШК от мощности сигнала р для А- и ?-характеристик компрессии при использовании аппроксимаций WА1(х) (3.1), (3.7) и WА2(х) (3.1), (3.8) плотности распределения вероятностей мгновенного значения речевого сигнала (за значение р=0 дБ приня¬та мощность сигнала, при которой совпадают его динамический диапазон с диапазоном кодера.

Таблица 4.2

Значения ОСШК, дБ при значениях р, дБ

0 -10 -20 -30 -40 -50 -60

ОСШК при А=87,6 использовании WА1(х) 47,53 39,52 36,88 18,38 -1,61 -21,61 -41,61

ОСШК при А=87,6 использовании WА2(х) 47,70 37,34 35,74 18,38 -1,61 -21,61 -41,61

ОСШК при ?=100 использовании WА1(х) 63,18 54,99 43,18 26,39 6,89 -13,04 -33,04

ОСШК при ?=100 использовании WА2(х) 61,59 53,87 42,51 26,25 6,88 -13,04 -33,04

ОСШК при ?=255 использовании WА1(х) 67,23 59,20 48,50 33,75 14,91 -4,95 -24,93

ОСШК при ?=255 использовании WА2(х) 65,64 58,04 47,61 33,44 14,87 -4,95 -24,93

Графики зависимости ОСШК от мощности сигнала р пред¬ставлены на рис. 4.2 для значения ? = 1/64. Лома¬ной линией на рисунке приведена норма, рекомендованная ITU-T, для отношения сигнал-шум квантования (G-712).

Рис. 4.2

4.5. Определение отношения сигнал/шум квантования в стандартной первичной ЦСП и ЦСП со статистическим уплотнением при использовании непосредственно экспериментального ра¬спределения вероятностей мгновенного значения речевого сигнала

В одном из выводов главы 3 сказано, что при аналитическом определении качества восстановления речевого сообщения в ЦСП по критерию ОСШК целесообразно не прибегать к аппроксимациям, используя в расчетных формулах непосредственно экспериментальное распределение вероятностей величины мгновенного значения речевого сообщения.

Используем и этот подход. Применяя выражение (4.18) для А-характеристики компрессии и непосредственно экспериментальную плотность WЭ(х) распределения вероятностей величины мгновенного значения речевого сообщения, получаем выражение отношения сигнал/шум квантования

. (4.21)

В (4.21) используем плотность WЭ(х) речевого сигнала, у которого диапазон значений мгновенного значения (-100<х<100) совпадает с диапазоном кодера (см.табл. 3.4).

С использованием (4.21) получаем при р = 0дБ значения ОСШК=38,18 дБ для стандартной первичной ЦСП и ОСШК=32,13 дБ - для дополнительного комплекта в ЦСП со статистическим уплотнением и фиксированном приоритете, (или для основного и дополнительного комплекта в ЦСП со статистическим уплотнением и чередующемся приоритете). В случае когда значение мощности сигнала p=-30 дБ значения ОСШК составляют 16,42 дБ и 14,37 дБ соответственно.

Сравнивая полученные оценки ОСШК с данными табл. 4.1 и табл. 4.2 соответственно (для ОСШК при А=87,6 и использовании WА1(х) и WА2(х) при р = 0 дБ), делаем вывод о весьма существенном уточнении оценок. Применение аппроксимаций приводит к завышению оценки ОСШК на 15,3 и 15,4 дБ соответственно (при р=0). В случае когда значение мощности сигнала p=-30 дБ, завышение оценки составляет 8 и 4,04 дБ.

Отметим, что полученная оценка ОСШК=38,18 дБ для стандартной первичной ЦСП превышает значение ОСШК=33 дБ, регламентируемое (при р = 0 дБ) шаблоном Рекомендации G.711 ITU-T, а оценка ОСШК=32,13 дБ - для дополнительного комплекта в ЦСП со статистическим уплотнением и фиксированном приоритете (или для основного и дополнительного комплекта в ЦСП со статистическим уплотнением и чередующемся приоритете) практически совпадает с этим значением.

Последнее обстоятельство позволяет сделать вывод (с использованием критерия ОСШК) о реализуемости ЦСП со статистическим уплотнением.

4.6. Определение отношения сигнал/шум квантования в стандартной первичной ЦСП и ЦСП со статистическим уплотнением при имитационном моделировании процесса квантования

4.7. Определение по критерию слоговой разборчивости качества восстановления речевого сообщения в ЦСП со статистическим уплотнением

Выше показано, что уточнение оценок отношения сигнал/шум дискретизации и восстановления ОСШД и отношения сигнал/шум квантования ОСШК при непосредственном использовании экспериментального распределения вероятностей числа подряд отбракованных отсчетов и экспериментального распределения плотности ра¬спределения вероятностей мгновенного значения речевого сигнала приводит к весьма существенному занижению оценок качества восстановления по критерию ОСШ по сравнению с работам и [1,8], что ставит под сомнение возможность реализации ЦСП со статистическим уплотнением.

Определим качество восстановления по критерию слоговой разборчивости.

Рассматриваем ЦСП со статистическим уплотнением и фиксированным приоритетом.

В качестве исходных данных используем полученные при непосредственном использовании экспериментальных распределения вероятностей (в силу этого – наиболее достоверные) оценки ОСШД=26,2 дБ (см. параграф 4.2) и ОСШК=32,13 дБ (см.параграф 4.5) при согласовании диапазона речевого сигнала с диапазоном кодера.

По формуле (4.6) получаем ОСШКОРРПОР= ОСШКПОР=11,39 дБ.

Поскольку ОСШК=32,13дБ ? ОСШКПОР=11,39дБ, по формуле (4.5) определяем ОСШЭКВ=26,06 дБ.

По формуле (4.7) определяем значение слоговой разборчивости S=82,34%.

Известно (см., например, [1, рис.2.3]), что отличным признается качество воспроизведения речи при S?80%.

Таким образом, обеспечивается отличное (по критерию слоговой разборчивости) воспроизведение речи в дополнительном комплекте ЦСП со статистическим уплотнением и фиксированным приоритетом при согласовании диапазона речевого сигнала с диапазоном кодера.

4.8. Выводы

1. Определено отношение сигнал/шум дискретизации и восстановления для СЦСП со статистическим уплотнением и фиксированным приоритетом. При известной оценке вероятности потери пакета традиционное использование геометрического распределения в качестве аппроксимации экспериментального распределения вероятностей числа подряд отбракованных отсчетов приводит к завышенной оценке (32,1 дБ) качества восстановления речевого сообщения дополнительного комплекта по сравнению с реальной оценкой (26,2 дБ) при непосредственном использованием экспериментального распределения.

2.Определено отношение сигнал/шум квантования в стандартной первичной ЦСП и СЦСП со статистическим уплотнением для А- и ?-характеристик компрессии. Для всех комбинаций значений параметров А и ?, значений мощности речевого сигнала традиционное использование аппроксимаций (в частности гиперэкспоненциального распределения) экспериментального распределения плотности ра¬спределения вероятностей мгновенного значения речевого сигнала приводит к весьма существенному (и поэтому неприемлемому) завышению оценок качества восстановления (на 15 дБ по критерию ОСШК) по сравнению с реальными оценками при непосредственном использованием экспериментального распределения. По мере уменьшения мощности сигнала на входе квантователя это завышение становится менее значительным (при уменьшении мощности от 0 до –30 дБ значение завышения оценки ОСШК уменьшается с 15 до 4 - 8 дБ).

3. Получено подтверждение преимуществу алгоритма с чередующимся приоритетом (ОСШД при использовании этого алгоритма равно 27,02, а при фиксированном приоритете его значение составляет 26,2 дБ). Т.о. преимущество составляет менее одного децибела, хотя вероятность отбраковки отсчета при чередующемся приоритете практически в два раза меньше.

4. Показано, что обеспечивается отличное (по критерию слоговой разборчивости) воспроизведение речи в дополнительном комплекте ЦСП со статистическим уплотнением и фиксированным приоритетом при согласовании диапазона речевого сигнала с диапазоном кодера. Значение слоговой разборчивости составило S=82,34%.