Этапы передачи голоса по ip сети. В чем разница между VoIP и IP? VoIP: программные коммутаторы и протоколы

Как уже отмечалось, передача голоса по протоколу IP (voice over IP - VoIP) является решением скорее 3-го уровня OSI, а не 2-го уровня. Данная функция позволяет VoIP работать автономно в сетях Frame Relay и ATM. Но, что наиболее важно, VoIP работает в обычных локальных сетях, вплоть до настольных ПК. В этом смысле VoIP является скорее приложением, чем службой и это учитывалось в процессе эволюции протоколов VoIP.

Все протоколы VoIP делятся на две категории: централизованные и распределенные. Централизованные модели придерживаются архитектуры клиент/сервер, а распределенные основаны на взаимодействии узлов одноранговой сети. Все технологии VoIP используют обшую среду для передачи голоса в виде пакетов RTP по протоколу IP, а также поддерживают множество кодеков для сжатия данных. Разница заключается в способе передачи сигналов и месте обслуживания логики и режима вызова: в конечных точках или на центральном сервере. У обеих архитектур есть свои достоинства и недостатки. Распределенные модели хорошо масштабируются и являются более гибкими (надежными), так как у них отсутствует центральный узел, который может выйти из строя. И наоборот, централизованные модели управления вызовами отличаются более простым управлением и поддержкой традиционных дополнительных услуг (таких как конференции), но могут иметь ограничения по масштабируемости, определяемые мощностью центрального сервера. В настоящее время разрабатываются гибридные и межсетевые модели, где реализуются преимущества этих подходов.

Самая старая архитектура, Н.323, и самая новая - протокол инициирования сеанса (Session Initiation Protocol - SIP), принадлежат к распределенным схемам управления вызовами VoIP. К методам централизованного управления вызовами относится протокол управления шлюзами среды передачи (Media Gateway Control Protocol - MGCP) и фирменные протоколы, такие как Skinny Station Protocol, разработанный Cisco Systems. Краткое описание каждого из этих протоколов приводится ниже.

Технология голосовых кодеров/декодеров (кодеков) за последние несколько лет значительно продвинулась вперед благодаря достижениям в области архитектуры построения цифровых систем обработки сигналов (Digital Signal Processor - DSP), а также исследованиям в области распознавания человеческой речи. Новые кодеки не просто выполняют аналого-цифровое преобразование. В них применяются сложные прогнозирующие модели для анализа входного голосового сигнала и последующей передачи голоса с использованием минимальной полосы пропускания. В этом разделе будет приведено несколько примеров голосовых кодеков и используемой ими полосы пропускания. Во всех случаях речь передается RTP-пакетами по протоколу IP.

Простая импульсно-кодовая модуляция голоса (Pulse Code Modulated - PCM) описывается стандартом ITU-T G.711. Он допускает две основные разновидности РСМ со скоростью 64 Кбит/сек: по mu-закону и по А-закону. В обоих этих методах для достижения 12-13-битового линейного качества РСМ на 8 битах используется логарифмическое сжатие. Однако они отличаются менее значительными особенностями сжатия (mu-закон имеет небольшое преимущество при низкоуровневом соотношении "сигнал-шум"). Исторически сложилось так, что использование указанных методов соответствовало географическим границам: в Северной Америке используют модуляцию по mu-закону, а в Европе - по А-закону. Преобразование mu-закона сжатия в А-закон выполняет страна, использующая модуляцию по mu-закону. При поиске неисправностей в системах РСМ несовпадение видов модуляции приводит к неестественно звучащей, но, тем не менее, внятной речи.

Другим часто применяемым методом сжатия является адаптивная дифференциальная импульсно-кодовая модуляция (Adaptive Differential Pulse Code Modulation - ADPCM). Типичным случаем использования ADPCM является кодирование по стандарту ITU-T G.726 с использованием 4-битовых квантов, обеспечивающих скорость передачи 32 Кбит/сек. В отличие от РСМ, 4 бита кодируют не амплитуду речи, а только разницу в амплитуде и скорость изменения амплитуды, используя довольно примитивное линейное прогнозирование.

РСМ и ADPCM являются примерами кодеков по форме сигнала, в методах сжатия которых применяются избыточные характеристики формы сигнала. В новых способах сжатия, разработанных за последние 10-15 лет, используется, кроме того, знание исходных особенностей формирования речи. В таких методах применяются способы обработки сигналов, которые сжимают речь, посылая только упрощенную параметрическую информацию об исходной форме звукового сигнала и голосового тракта. Для передачи этой информации требуется меньшая полоса пропускания. Эти способы могут быть объединены в общую группу кодеков по источнику. В нее входят такие разновидности, как линейное прогнозируемое кодирование (Linear Predictive Coding - LPC), линейный прогноз, возбуждаемый кодовым словом (Code Excited Linear Prediction - CELP) и многоимпульсное многоуровневое квантование (Multipulse, Multilevel Quantization - MP-MLQ).

Перечисленные выше виды кодеков можно разделить на подкатегории. Например, к методам CELP можно отнести версию с малой задержкой, называемую LD-CELP (low delay CELP), а также более сложные методы моделирования голосового тракта с алгебраическими преобразованиями сопряженных структур. Такие кодеки обозначаются как CSA-CELP (conjugate structure algebraic CELP). Данный список можно продолжать до бесконечности, но сетевым разработчикам важно знать только области применения этих подходов в сетях и приложениях.

Сложные предсказывающие кодеки опираются на математическую модель человеческого голосового аппарата и вместо того, чтобы отправлять сжатую речь, посылают ее математическое представление, позволяющее получателю ее сгенерировать. Однако для отладки такого оборудования требуются серьезные исследования. Например, некоторые из первых кодеков хорошо воспроизводили голоса своих разработчиков и активно внедрялись - до тех пор, пока не обнаружилось, что они не очень хорошо воспроизводят женскую речь и азиатские диалекты. Тогда в конструкцию этих кодеков были внесены изменения с учетом более широкого диапазона типов человеческого голоса.

Союз ITU стандартизировал наиболее распространенные методы в телефонии кодирования и пакетирования речи, приняв приведенные ниже стандарты.

G.711. Кратко описанный ранее РСМ-метод голосового кодирования со скоростью передачи 64 Кбит/сек. Кодирование голоса по стандарту G.711 всегда обеспечивает правильный формат для передачи голоса в цифровом виде по открытой телефонной сети или через мини-АТС.

G.726. Метод кодирования ADPCM со скоростями передачи 40, 32, 24 и 16 Кбит/сек. Речь, кодированная методом ADPCM, также может передаваться между сетями с пакетной передачей речи, открытыми телефонными сетями и сетями на основе мини-АТС при условии, что последние поддерживают ADPCM.

G.729. Метод CELP-сжатия, позволяющий кодировать речь в потоки со скоростью передачи 8 Кбит/сек. Две разновидности этого стандарта (G.729 и G.729 Annex А) значительно различаются по сложности вычислений, но оба обеспечивают примерно такое же хорошее качество речи, как и метод ADPCM со скоростью 32 Кбит/сек.

G.723.1. Метод, который может быть использован для сжатия голоса и других аудиокомпонентов мультимедийных сообщений с очень низкой битовой скоростью передачи. Являясь частью общего семейства стандартов Н.324, этот кодер имеет две битовые скорости передачи: 5,3 и 6,3 Кбит/сек. Более высокая скорость основана на технологии MP-MLQ и обеспечивает более высокое качество; более низкая основана на методе CELP и обеспечивает хорошее качество, а также предоставляет системным разработчикам дополнительную гибкость.

Поскольку кодеки все больше полагаются на субъективно настраиваемые методики сжатия, стандартные объективные показатели качества, такие как суммарное искажение гармоник и отношение сигнал/шум, имеют меньшее отношение к качественным показателям кодека. Распространенным тестом для определения эффективности голосовых кодеков является средняя экспертная оценка (Mean Opinion Score - MOS). Из- за того, что качество голоса и звука обычно оценивается субъективно и зависит от слушателя, в этом методе важен широкий диапазон слушателей и образцов речи. Тесты MOS проводятся на группе слушателей, которые дают голосовым образцам оценки от 1 (плохо) до 5 (отлично). Затем оценки усредняются и получается средняя экспертная оценка. MOS-тестирование также применяется для сравнения качества работы одного и того же кодека в различных условиях, таких как уровни фоновых шумов, способы кодирования и декодирования и т.п. Впоследствии эти данные могут использоваться для сравнения с другими кодеками.

В табл. 19.1 приведены оценки по методу MOS для нескольких кодеков ITU-T, а также показана связь между несколькими низкоскоростными кодеками и стандартом РСМ.

1 Для Texas Instruments DSP 54х.

В этой таблице приведена информация, полезная для сравнения различных реализаций распространенных голосовых кодеков. Относительная полоса пропускания и сложность обработки, выраженная в миллионах операций в секунду (Millions of Instructions Per Second - MIPS) определяют области применения различных кодеков. В целом, высшая средняя экспертная оценка соответствует более сложным кодекам или большей полосе пропускания.

Литература:

Руководство по технологиям объединенных сетей, 4-е издание. : Пер. с англ. - М.: Издательский дом «Вильяме», 2005. - 1040 с.: ил. – Парал. тит. англ.


Добрый день, уважаемые хабражители. В данной статье я постараюсь рассмотреть основные принципы IP-телефонии, описать наиболее часто используемые протоколы, указать способы кодирования и декодирования голоса, разобрать некоторые характерные проблемы.

Под IP-телефонией подразумевается голосовая связь, которая осуществляется по сетям передачи данных, в частности по IP-сетям (IP - Internet Protocol). На сегодняшний день IP-телефония все больше вытесняет традиционные телефонные сети за счет легкости развертывания, низкой стоимости звонка, простоты конфигурирования, высокого качества связи и сравнительной безопасности соединения. В данном изложении будем придерживаться принципов эталонной модели OSI (Open Systems Interconnection basic reference model) и рассказывать о предмете “снизу-вверх”, начиная с физического и канального уровней и заканчивая уровнями данных.

"
Модель OSI и инкапсуляция данных

Принципы IP-телефонии

При осуществлении звонка голосовой сигнал преобразуется в сжатый пакет данных (подробнее этот процесс будет рассмотрен в главах “Импульсно кодовая модуляция” и “Кодеки”). Далее происходит пересылка данных пакетов поверх сетей с коммутацией пакетов, в частности, IP сетей. При достижении пакетами получателя, они декодируются в оригинальные голосовые сигналы. Эти процессы возможны благодаря большому количеству вспомогательных протоколов, часть из которых будет рассмотрена далее.

В данном контексте, протокол передачи данных - некий язык, позволяющий двум абонентам понять друг друга и обеспечить качественную пересылку данных между двумя пунктами.

Отличие от традиционной телефонии

В традиционной телефонии установка соединения происходит при помощи телефонной станции и преследует исключительно цель разговора. Здесь голосовые сигналы передаются по телефонным линиям, через выделенное подключение. В случае же IP-телефонии, сжатые пакеты данных поступают в глобальную или локальную сеть с определенным адресом и передаются на основе данного адреса. При этом используется уже IP-адресация, со всеми присущими ей особенностями (такими как маршрутизация).

При этом IP-телефония оказывается более дешевым решением как для оператора, так и для абонента. Происходит это благодаря тому, что:

  • Традиционные телефонные сети обладают избыточной производительностью, в то время, как IP-телефония использует технологию сжатия голосовых пакетов и позволяет полностью использовать емкость телефонной линии.
  • Как правило, на сегодняшний момент доступ в глобальную сеть есть у всех желающих, что позволяет сократить затраты на подключение или совсем исключить их.
  • Звонки в локальной сети могут использовать внутренний сервер и происходить без участия внешней АТС.
Вместе с вышеперечисленным, IP-телефония позволяет улучшить качество связи. Достигается это, опять же, благодаря трем основным факторам:
  • Телефонные серверы постоянно совершенствуются и алгоритмы их работы становятся более устойчивыми к задержкам или другим проблемам IP-сетей.
  • В частных сетях их владельцы обладают полным контролем над ситуацией и могут изменять такие параметры, как ширина полосы пропускания, количество абонентов на одной линии, и, как следствие, величину задержки.
  • Сети с коммутацией пакетов развиваются, и ежегодно вводятся новые протоколы и технологии, позволяющие улучшить качество связи (например, протокол резервирования полосы пропускания RSVP).
Благодаря IP-телефонии очень элегантно решается проблема занятой линии, так как переадресация, либо перевод в режим ожидания могут быть осуществлены несколькими командами в конфигурационном файле на АТС.

Физический уровень (Physical Layer)

На физическом уровне осуществляется передача потока битов по физической среде через соответствующий интерфейс. IP-телефония практически полностью опирается на уже существующую инфраструктуру сетей. В качестве среды передачи информации используются, как правило витая пара категории 5 (UTP5), одномодовое или многомодовое оптическое волокно, либо коаксиальный кабель. Тем самым в полной мере реализуется принцип конвергенции телекоммуникационных сетей.

PoE

Интересно рассмотреть технологию PoE (Power Over Ethernet) - стандарты IEEE 802.3 af-2003 и IEEE 802.3at-2009. Ее суть заключается в возможности обеспечения питанием устройств посредством стандартной витой пары. Большинство современных IP-телефонов, в частности, модельный ряд Cisco Unified IP Phones 7900 Series, поставляются с поддержкой PoE. Согласно стандарту 2009 года, устройства могут получать ток мощностью до 25,5 Ватт.

При подаче питания используются лишь две витых пары кабеля 100BASE-TX, однако некоторые производители задействуют все четыре, достигая мощности до 51 Ватт. Необходимо заметить, что технология не требует модификации уже существующих кабельных систем, в том числе и кабелей Cat 5.

Для определения того, является ли подключаемое устройство питаемым (PD - powered device) на кабель подается напряжение 2,8 - 10 В. Тем самым вычисляется сопротивление подключаемого устройства. Если данное сопротивление находится в диапазоне 19 - 26,5 кОм, то процесс переходит на следующий этап. Если же нет - проверка повторяется с интервалом ≥2 мс.

Далее происходит поиск диапазона мощностей питаемого устройства путем подачи более высокого напряжения и измерения тока в линии. Вслед за этим на линию подается 48 В - питающее напряжение. Также осуществляется постоянный контроль перегрузок.

Канальный уровень (Data Link Layer)

Согласно спецификации IEEE 802 канальный уровень разделяется на два подуровня:
  1. MAC (Media Access Control) - обеспечивает взаимодействие с физическим уровнем;
  2. LLC (Logical Link Control) - обслуживает сетевой уровень.
На канальном уровне работают коммутаторы - устройства, обеспечивающие соединение нескольких узлов компьютерной сети и распределение фреймов между хостами на основе физической (MAC) адресации.

Необходимо упомянуть механизм виртуальных локальных сетей (Virtual Local Area Network). Данная технология позволяет создавать логическую топологию сети без оглядки на ее физические свойства. Достигается это тегированием трафика, что подробно описано в стандарте IEEE 802.1Q.


Формат фрейма

В контексте IP-телефонии отметим Voice VLAN, широко применяющуюся для изоляции голосового трафика, генерируемого IP-телефонами, от других данных. Ее использование целесообразно по двум причинам:

  1. Безопасность. Создание отдельной голосовой VLAN уменьшает вероятность перехвата и анализа голосовых пакетов.
  2. Повышение качества передачи. Механизм VLAN позволяет задать повышенный приоритет голосовым пакетам, и, как следствие, улучшить качество связи.

Сетевой уровень (Network Layer)

На сетевом уровне происходит маршрутизация, соответственно основными устройствами сетевого уровня являются маршрутизаторы (Router). Именно здесь определяется, каким путем данные достигнут получателя с определенным IP-адресом.

Основной маршрутизируемый протокол - IP (Internet Protocol), на основе которого и построена IP-телефония, а также всемирная сеть Интернет. Также существует множество динамических протоколов маршрутизации, самый популярный среди которых OSPF (Open Shortest Path First) - внутренний протокол, основанный на текущем состоянии каналов связи;

На сегодняшний момент существуют специальные VoIP-шлюзы (Voice Over IP Gateway), обеспечивающие подключение обычных аналоговых телефонов к IP-сети. Как правило, они имеют и встроенный маршрутизатор, позволяющий вести учет трафика, авторизовать пользователей, автоматически раздавать IP-адреса, управлять полосой пропускания.

Среди стандартных функций VoIP-шлюзов:

  • Функции безопасности (создание списков доступа, авторизация);
  • Поддержка факсимильной связи;
  • Поддержка голосовой почты;
  • Поддержка протоколов H.323, SIP (Session Initiation Protocol).
Для борьбы с возможными задержками передачи IP необходимо дополнять дополнительными средствами, например протоколами установления очередности (чтобы голосовые данные не конкурировали с обычными).
Как правило, в этих целях на маршрутизаторах используется очередность с малой задержкой (LLQ - Low-Latency queuing), либо взвешенная организация очередей на основе классов (CBWFQ - Class-Based Weighted Fair Queuing).
Кроме того, необходимы схемы маркировки с заданием приоритетов для рассмотрения голосовых данных, как наиболее важных для передачи.

Транспортный уровень (Transport Layer)

Для транспортного уровня характерны:
  • Сегментация данных приложений верхнего уровня;
  • Обеспечение сквозного соединения;
  • Гарантия надежности данных.
Основные протоколы транспортного уровня - TCP (Transmission Control Protocol), UDP (User Datagram Protocol), RTP (Real-time Transport Protocol). Непосредственно в IP-телефонии используются протоколы UDP и RTP, причем основное их отличие от TCP заключается в том, что они не обеспечивают надежность доставки данных. Это является более приемлемым вариантом, нежели осуществление контроля за доставкой (TCP), так как телефонная связь чрезвычайно зависима от задержек передачи, но менее чувствительна к потерям пакетов.

UDP

UDP базируется на сетевом протоколе IP и предоставляет транспортные услуги прикладным процессам. Его главное отличие от TCP - обеспечение негарантированной доставки, то есть при отправке и получении данных никаких подтверждений не запрашивается. Также при отправке информации не обязательно установление логического соединения между модулями UDP (источник и приемник).

RTP

Несмотря на то, что RTP принято считать протоколом транспортного уровня, как правило он работает поверх UDP. С помощью RTP реализуется распознавание типа трафика, работа с метками времени, контроль передачи и нумерация последовательности пакетов.

Основное назначение RTP состоит в том, что он присваивает каждому исходящему пакету временные метки, обрабатывающиеся на приемной стороне. Это позволяет принимать данные в надлежащем порядке, снижает влияние неравномерности времени прохождения пакетов по сети, восстанавливает синхронизацию между аудио и видео данными.

Уровни данных (Data Layers)

Три последних уровня модели OSI рассмотрим совместно. Такое объединение допустимо, так как процессы, происходящие на данных уровнях тесно связаны между собой, и описывать их безотносительно разделения на подуровни будет логичнее.

H.323

Первым делом необходимо описать стек протоколов H.323, разработанный в 1996 году. Данный стандарт содержит описание оборудования, сетевых служб и терминальных устройств, предназначенных для осуществления аудио- и видеосвязи в сетях с коммутацией пакетов (Интернет). Для любого устройства стандарта H.323 обязательна поддержка обмена голосовой информацией.
  • Платформенную независимость.
  • Стандарты кодирования аналоговых данных.
  • Управление полосой пропускания.
  • Гибкость и совместимость.
Отметим очень важный факт: в рекомендациях не определены физическая среда передачи, транспортный протокол и сетевой интерфейс. Это значит, что устройства, поддерживающие стандарт H.323 могут работать в любых существующих сегодня сетях с коммутацией пакетов.

Согласно H.323 четырьмя основными компонентами VoIP-соединения являются:

  • терминал;
  • шлюз;
  • контроллер зоны;
  • контроллер управления многоточечной конференции (MCU - Multipoint Control Unit).


Пример структурной схемы сети в IP-телефонии 

Выдержка из документа, описывающего стек протоколов H.323

1. Управление соединением и сигнализация:
1.а. H.225.0: протоколы сигнализации и пакетирования мультимедийного потока (использует подмножество протокола сигнализации Q.931).
1.б. H.225.0/RAS: процедуры регистрации, допуска и состояния.
1.в. H.245: протокол управления для мультимедиа.
2. Обработка звуковых сигналов:
2.а. G.711: импульсно-кодовая модуляция тональных частот.
2.б. G.722: кодирование звукового сигнала 7 кГц в 64 кбит/с.
2.в. G.723.1: речевые кодеры на две скорости передачи для организации мультимедийной связи со скоростью передачи 5.3 и 6.3 кбит/с.
2.г. G.728: кодирование речевых сигналов 16 кбит/с с помощью линейного предсказания с кодированием сигнала возбуждения с малой задержкой.
2.д. G.729: кодирование речевых сигналов 8 кбит/с с помощью линейного предсказания с алгебраическим кодированием сигнала возбуждения сопряженной структуры.
3. Обработка видеосигналов:
3.а. H.261: видеокодеки для аудиовизуальных услуг со скоростью 64 кбит/с.
3.б. H.263: кодирование видеосигнала для передачи с малой скоростью.
4. Конференц-связь для передачи данных:
4.а. T.120: стек протоколов (включает T.123, T.124, T.125) для передачи данных между оконечными пунктами.
5. Мультимедийная передача:
5.а. RTP: транспортный протокол реального времени.
5.б. RTCP: протокол управления передачей в реальном времени.
6. Обеспечение безопасности:
6.а. H.235: обеспечение безопасности и шифрование для мультимедийных терминалов сети H.323.
7. Дополнительные услуги:
7.а. H.450.1: обобщенные функции для управления дополнительными услугами в H.323.
7.б. H.450.2: перевод соединения на телефонный номер третьего абонента.
7.в. H.450.3: переадресация вызова.
7.г. H.450.4: удержание вызова.
7.д. H.450.5: парковка вызова (park) и ответ на вызов (pick up).
7.е. H.450.6: уведомление о поступившем вызове в состоянии разговора.
7.ж. H.450.7: индикация ожидающего сообщения.
7.з. H.450.8: служба идентификации имен.
7.и. H.450.9: служба завершения соединения для сетей H.323.


Сценарий установки соединения на основе протокола H.323

SIP (Session Initiation Protocol)

SIP - протокол сигнализации, предназначенный для организации, изменения и завершения сеансов связи. SIP независим от транспортных технологий, однако при установлении соединения предпочтительно использовать UDP. Для передачи самой голосовой и видеоинформации рекомендовано применять RTP, но возможность использования других протоколов не исключена.

В SIP определены два типа сигнальных сообщений - запрос и ответ. Также существует шесть процедур:

  • INVITE (приглашение) - приглашает пользователя принять участие в сеансе связи (служит для установления нового соединения; может содержать параметры для согласования);
  • BYE (разъединение) - завершает соединение между двумя пользователями;
  • OPTIONS (опции) - используется для передачи информации о поддерживаемых характеристиках (эта передача может осуществляться напрямую между двумя агентами пользователей или через сервер SIP);
  • АСК (подтверждение) - используется для подтверждения получения сообщения или для положительного ответа на команду INVITE ;
  • CANCEL (отмена) - прекращает поиск пользователя;
  • REGISTER (регистрация) - передает информацию о местоположении пользователя на сервер SIP, который может транслировать ее на сервер адресов (Location Server).

Сценарий сеанса связи SIP

Кодеки

Аудиокодеком называют программу или алгоритм, который сжимает, либо разжимает цифровые звуковые данные, позволяя снизить требования к пропускной способности канала передачи данных. В IP-телефонии на сегодняшний день наиболее распространено преобразование посредством кодека G.729, а также сжатие G.711 по А-закону (alaw) и μ-закону (ulaw).
G.729
G.729 является кодеком, который сжимает исходный сигнал с потерей данных. Основная идея, заложенная в G.729 - передача не самого оцифрованного сигнала, а его параметров (спектральной характеристики, количества переходов через ноль), достаточных для последующего синтезирования на принимающей стороне. При этом все основные характеристики голоса, такие как амплитуда и тембр сохраняются.

Пропускная способность канала, на которую рассчитан данный кодек - 8 кбит/с. Длина кадра обрабатываемого G.729 - 10 мс, частота дискретизации - 8 кГц. Для каждого из таких кадров определяются параметры математической модели, которые в дальнейшем и передаются в канал в виде кодов.

При использовании кодирования G.729 задержка составляет 15 мс, из которых 5 мс тратится на заполнение предварительного буфера. Отметим также, что кодек G.729 предъявляет достаточно высокие требования к ресурсам процессора.

G.711
G.711 - голосовой кодек, который не предполагает никакого сжатия, помимо компандирования - метода уменьшения эффектов каналов с ограниченным динамическим диапазоном. В основе данного метода лежит принцип уменьшения количества уровней квантования сигнала в области высокой громкости, сохраняя при этом качество звука. Две широко использующиеся в телефонии схемы компандирования - alaw и ulaw.

Сигнал в данном кодеке предоставлен потоком величиной 64 кбит/с. Частота дискретизации - 8000 кадров по 8 бит в секунду. Качество голоса субъективно лучше, нежели при применении кодека G.729.

alaw
alaw или А-закон - алгоритм сжатия звуковых данных с потерей информации. В основном используется на территории Европы и России.

Для сигнала x преобразование по алгоритму alaw выглядит следующим образом:

Где А - параметр сжатия (обычно принимается равным 87,7).

ulaw
ulaw или μ-закон - алгоритм сжатия звуковых данных с потерей информации. В основном используется на территории Японии и Северной Америки.

Для сигнала x преобразование по алгоритму ulaw выглядит следующим образом:

где μ принимается равным 255 (8 бит) в стандартах Северной Америки и Японии.

Импульсно кодовая модуляция (PCM - Pulse Code Modulation)

Импульсно кодовая модуляция - передача непрерывной функции в виде серии последовательных импульсов.

Для получения на входе канала связи модулированного сигнала, мгновенное значение несущего сигнала измеряется АЦП с определенным периодом. При этом количество оцифрованных значений в секунду (иначе, частота дискретизации) должно быть большим или равным двукратной максимальной частоте в спектре аналогового сигнала.

Далее полученные значения округляются до одного из заранее принятых уровней. Заметим, что количество уровней необходимо принимать кратным степени двойки. В зависимости от того, сколько было определено уровней, сигнал кодируется определенным количеством бит.


Квантование сигнала

На данном рисунке представлено кодирование с помощью четырех битов (то есть все промежуточные значения аналогового сигнала будут округляться до одного из заранее заданных 16 уровней). Для примера, при времени равном нулю сигнал будет представлен подобным образом: 0111.

При демодуляции последовательность нулей и единиц преобразуется в импульсы демодулятором, уровень квантования которого равен уровню квантования модулятора. После этого ЦАП на основе данных импульсов восстанавливает сигнал, а сглаживающий фильтр окончательно убирает неточности.

В современной телефонии число уровней квантования должно быть большим или равным 100, то есть минимальное количество бит, которым может кодироваться сигнал - 7.

Вопросы качества обслуживания в IP-телефонии (Quality of Service - QoS)

В сетях на основе стека TCP/IP высокое качество обслуживания трафика, чувствительного к задержкам передачи не обеспечивается по умолчанию. При использовании протокола TCP имеется гарантия достоверной доставки информации, но ее перенос может осуществляться с непредсказуемыми задержками. Для UDP характерна минимизация задержек, но гарантия верной доставки пакета отсутствует.

В то же время добротность речевого трафика сильно зависит от качества передачи, и в сети, где не реализованы механизмы, гарантирующие соответственное качество, реализация IP-телефонии может быть не удовлетворяющей требованиям пользователей.

Основными показателями качества обслуживания являются пропускная способность сети и задержка передачи. Задержка при этом определяется как промежуток времени, прошедший с момента отправки пакета, до момента его приема.

Также существуют такие характеристики, как готовность сети и ее надежность (оцениваются по результатам контроля уровня обслуживания в течение длительного времени, либо по коэффициенту использования).

Для улучшения качества связи используются следующие механизмы:

  1. Перемаршрутизация. При перегрузке одного из каналов связи позволяет осуществить доставку при помощи резервных маршрутов.
  2. Резервирование ресурсов канала связи на время соединения.
  3. Приоретизация трафика. Дает возможность помечать пакеты в соответствии с уровнем их важности и производить обслуживание на основе меток.
Как было сказано ранее, голосовой трафик чрезвычайно чувствителен к задержкам передачи. Максимальное время задержки не должно превышать 400 мс (сюда включается и продолжительность обработки информации на конечных станциях). Различают два основных типа задержек:

Задержка при кодировании информации в голосовых шлюзах или терминальном оборудовании. Уменьшается путем улучшения алгоритмов обработки и преобразования голоса.
- Задержка, вносимая сетью передачи. Уменьшается путем улучшения сетевой инфраструктуры, в частности, сокращением количества маршрутизаторов и использованием высокоскоростных каналов.


Источники задержки в IP-телефонии

Джиттер

Еще одно явление, характерное для IP-телефонии - джиттер, или, иначе, случайная задержка распространения пакета.

Обуславливается джиттер тремя факторами:

  • Ограниченная полоса пропускания или некорректная работа активных сетевых устройств;
  • Высокая задержка распространения сигнала;
  • Тепловой шум.
Наиболее часто применяющийся метод борьбы с джиттером - джиттер-буфер, хранящий определенное количество пакетов.

Обычно предусматривается динамическая подстройка длины буфера в течение всего времени существования соединения. Для выбора наилучшей длины используются эвристические алгоритмы.

Джиттер буфер
Для компенсации неравномерной скорости поступления пакетов на приемной стороне создают временное хранилище пакетов, или так называемый джиттер буфер. Его задача, собрать поступающие пакеты в правильном порядке в соответствии с временными метками и выдать их кодеку с правильными интервалами и правильном порядке.

Джиттер буфер

Размер буфера приемное VOIP устройство рассчитывает в процессе работы, либо принудительно задается в настройках. С одной стороны он не может быть слишком большим, чтобы не увеличивать транспортную задержку. С другой стороны, маленький размер буфера вызывает потери пакетов при изменениях времени задержки в IP сети.

Отсюда и происходит одно из главных противоречий, между интернет провайдерами и пользователями IP телефонии. С точки зрения провайдера все пакеты доставлены абоненту, то есть, потерь нет. А с точки зрения VoIP устройства, разница во времени между приходом пакетов значительно превышает джиттер буфер. Поэтому фактически потери есть. На практике потеря более 1% вызывает определенные неприятные ощущения. При 2% разговор оказывается затруднен. При значениях больше 4% разговор уже практически невозможен.

Размер джиттер буфера
Случайная задержка распространения Ji для i-го пакета может определяться по формуле:

где:
Di – отклонение от ожидаемого времени прибытия i-го пакета.
Отклонение от ожидаемого времени прибытия i-го пакета Di определяется по формуле:

где:
R – время прибытия пакета в метках времени RTP,
S – временная метка RTP, взятая из пакета.

Приведем пример расчета ожидаемого размера случайной задержки распространения 5-го пакета, на основе двух предыдущих.

Пусть J4=10 мс; R4=10, R3=11, S4=6, S3=5, тогда D5 будет равно (10-11)-(6-5)=-2.

В среднем, случайная задержка времени распространения для одного пакета в текущем примере составит 10 мс (точнее можно посчитать по формуле, приведенной выше). Тогда для того, чтобы ни один пакет не был отброшен, размер джиттер буфера должен быть равным 10 мс.

Для определения требуемого размера джиттер буфера в мегабайтах, домножим полученное значение на 100 мбит/сек – среднюю пропускную способность сети: 10 10^-3 100 = 128 кб.

Размер джиттер-буфера должен быть больше, чем флуктуация транзитного времени в сети. Например, если для 10 пакетов время транзита колеблется от 5 до 10 мс, то буфер должен быть хотя бы 8 мс, чтобы ни один пакет не был потерян. Лучше, если буфер еще больше, например 12 мс, тогда сможет работать механизм перезапроса потерянных пакетов.

Решения для развертывания телефонной сети

Asterisk

Asterisk - программная АТС, способная коммутировать как VoIP вызовы, так и вызовы, осуществляемые между IP-телефонами и традиционной телефонной сетью общего пользования.

Поддерживаемые протоколы: IAX, SIP, H.323, Skinny, UNIStim.
Поддерживаемые кодеки: G.711 (ulaw и alaw), G.722, G.723, G.729, GSM, iLBC, LPC-10, Speex.

Asterisk - динамично развивающееся открытое программное обеспечение, которое может быть установлено без оглядки на лицензирование. Это делает данную программную АТС привлекательной для малого и среднего бизнеса. Количество абонентов в сети может достигать 2000 и ограничено только мощностью сервера.

Еще одно достоинство Asterisk - возможность гибкой настройки. Весь необходимый функционал либо уже реализован, либо может быть дописан самостоятельно без существенных временных и денежных затрат. Этому способствует принцип: одна задача - один программный модуль.

В сравнении с решениями от таких вендоров, как Cisco или Avaya, Asterisk привлекателен еще и стоимостью развертывания. Фактически все затраты сводятся только к покупке телефонных аппаратов и сервера, способного обеспечить требуемую нагрузку на сеть. Сама программа абсолютно бесплатна.

Cisco Unified Communication Manager (CallManager)

CallManager предназначен скорее для крупных сетей, включающих до 30000 абонентов. Данный программно-аппаратный комплекс обеспечивает надежность работы и позволяет конфигурировать множество параметров, таких как переадресация звонков или голосовое меню. Существует и “облегченная” express версия, предназначенная скорее для небольших офисов.

Из преимуществ Cisco CallManager следует отметить в первую очередь знаменитую техническую поддержку корпорации Cisco. При соответствующем уровне контракта на обслуживание, любая проблема, начиная с вопросов по настройке и заканчивая вышедшим из строя оборудованием, будет решена практически мгновенно. Поэтому Cisco CallManager подойдет компаниям, готовым платить немалые деньги, но и получать при этом высочайшее качество обслуживания.

Avaya IP Office


Система IP Office может стать неплохим выбором для среднего размера телефонной сети. Количество абонентов здесь ограничено не только мощностью сервера, но и количеством приобретенных лицензий. Лицензировать необходимо практически все - платы расширения, используемые приложения и т.д., что может доставить определенные неудобства.

Конфигурирование может осуществляться через ряд программ, но наиболее популярная и простая в обращении - Avaya IP Office Manager. Также возможно управление через консоль с помощью Avaya Terminal Emulator.

В целом, продукция корпорации Avaya не ограничивается одним IP Office. Avaya, в 2009 году слившаяся с еще одним известным производителем Nortel, является признанным лидером на рынке оборудования для IP-телефонии.

На первом этапе осуществляется оцифровка голоса. Затем оцифрованные данные анализируются и обрабатываются с целью уменьшения физического объема данных, передаваемых получателю. Как правило, на этом этапе происходит подавление ненужных пауз и фонового шума, а также компрессирование.

На следующем этапе полученная последовательность данных разбивается на пакеты и к ней добавляется протокольная информация - адрес получателя, порядковый номер пакета на случай, если они будут доставлены не последовательно, и дополнительные данные для коррекции ошибок. При этом происходит временное накопление необходимого количества данных для образования пакета до его непосредственной отправки в сеть.

Операторы сетей с пакетной коммутацией получают преимущества, присущие разделяемой инфраструктуре электросвязи по самой ее природе. Проще говоря, они могут продать больше, чем в действительности имеют, основываясь на статистическом анализе работы сети. Поскольку предполагается, что абоненты не будут круглосуточно и ежедневно задействовать всю оплаченную полосу, можно обслужить больше абонентов, не расширяя магистральную инфраструктуру. Оборот и прибыль при этом увеличиваются.

Иными словами, абонент, оплативший полосу 64 кбит/с, использует канал в среднем лишь на 25%. Следовательно, оператор способен продать имеющийся у него ресурс в четыре раза большему числу пользователей, не перегружая свою сеть. Такой сценарий выгоден обеим сторонам - и клиенту, и продавцу, - поскольку оператор увеличивает свои доходы и уменьшает абонентскую плату за счет снижения издержек. Это выигрышное решение уже признано в мире передачи данных, а теперь начинает использоваться и на рынке телефонии.

Полоса пропускания напрямую зависит от загруженности сети Интернет пакетами, содержащими данные, голос, графику и т.д., а значит, задержки при прохождении пакетов могут быть самыми разными. При использовании выделенных каналов исключительно для голосовых пакетов можно гарантировать фиксированную (или почти фиксированную) скорость передачи. Ввиду широкого распространения сети Интернет особый интерес вызывает реализация системы Интернет-телефонии, хотя следует признать, что в этом качество телефонной связи оператором не гарантируется.

Для того, чтобы осуществить междугородную (международную) связь с помощью телефонных серверов, организация или оператор услуги должны иметь по серверу в тех местах, куда и откуда планируются звонки. Стоимость такой связи на порядок меньше стоимости телефонного звонка по обычным телефонным линиям. Особенно велика эта разница для международных переговоров.

Общий принцип действия телефонных серверов Интернет-телефонии таков: с одной стороны, сервер связан с телефонными линиями и может соединиться с любым телефоном мира. С другой стороны, сервер с Интернетом и может связаться с любым компьютером в мире. Сервер принимает стандартный телефонный сигнал, оцифровывает его (если он исходно не цифровой), значительно сжимает, разбивает на пакеты и отправляет через Интернет по назначению с использованием протокола IP. Для пакетов, приходящих из сети на телефонный сервер и уходящих в телефонную линию, операция происходит в обратном порядке. Обе составляющие операции (вход сигнала в телефонную сеть и его выход из телефонной сети) происходит практически одновременно, что позволяет обеспечить полнодуплексный разговор.

Поскольку оператор представляет некоторый сервис и берет за него деньги, он обязан гарантировать его качество. Даже если клиент согласен (хотя в условиях жесткой конкуренции на рынке телекоммуникаций это маловероятно) время от времени мириться с не очень высоким уровнем качества, он может предъявить претензии в случае серьезных или длительных проблем. Как бы то ни было, оператор вынужден следить за качеством предоставляемых услуг, для чего в случае их масштабного предоставления ему требуется соответствующая аппаратура и программное обеспечение, которое достаточно дорого и имеется не во всех точках сети.

С точки зрения масштабируемости IP-телефония представляется вполне законченным решением. Во-первых, поскольку соединение на базе протокола IP может начинаться (и заканчиваться) в любой точке сети от абонента до магистрали. Соответственно, IP-телефонию в сети можно вводить участок за участком, что, кстати, на руку и с точки зрения миграции. Для решения IP-телефонии характерна определенная модульность: количество и мощность различных узлов - шлюзов, gatekeeper («привратников» - так в терминологии VoIP именуются серверы обработки номерных планов) - можно наращивать практически независимо, в соответствии с текущими потребностями.


Если вы никогда не слышали о VoIP, будьте готовы изменить свое мнение о междугородных телефонных звонках. Voice over Internet Protocol - это метод для приема аналоговых аудио сигналов, подобно тому, что вы слышите во время разговора по телефону, и преобразования их в цифровые, которые передаються через Интернет.

Чем это полезно? VoIP превращает обычное интернет-соединение в способ размещения бесплатных телефонных звонков. В результате, благодаря использованию некоторого бесплатного программного обеспечения VoIP, которое доступно для телефонных звонков в Интернете, вы полностью избавляетесь от расходов на звонки через телефонную сеть.

VoIP - это революционная технология, которая может полностью переделать телефонные системы в мире. Поставщики оборудования VoIP, такие как , уже давно существуют и постоянно растут. Крупные операторы, уже создают тарифные планы на рынках по всей территории США, Европы, Азии и FCC серьезно рассматривает потенциальные последствия обслуживания VoIP.

В этой статье мы рассмотрим принципы VoIP, приложения и потенциал этих новых технологий, которые, когда-то могут полностью заменить традиционную телефонную систему.

В настоящее время существует три разных особенностей VoIP-сервиса:

  • – это самый простой и наиболее распространенный способ. ATA позволяет подключать стандартный телефон к компьютеру или интернет-соединению для использования с VoIP. Адаптер является аналого-цифровым преобразователем. Он принимает аналоговый сигнал от вашего традиционного телефона и преобразует его в цифровые данные для передачи через Интернет. Большинство провайдеров связывают АТА со своим сервисом. Поэтому для подключения вы просто достаете адаптер из коробки, подключаете кабель от телефона, который обычно входит комплект, и вы готовы совершать VoIP-звонки. Некоторые телефонные адаптеры могут иметь дополнительное программное обеспечение, которое загружается на главный компьютер для его настройки.
  • - это специализированные телефоны, которые используют технологии передачи голоса по IP для размещения и передачи телефонных вызовов через Интернет. На вид они такие же, как и обычные телефоны: имеют телефонную трубку и кнопки. Но вместо стандартных телефонных разъемов RJ-11 IP-телефоны имеют разъем RJ-45. IP-телефоны подключаются непосредственно к вашему маршрутизатору и имеют все необходимое оборудование и программное обеспечение для работы с IP-вызовом. WiFi-телефоны позволяют абонентам VoIP совершать звонки с любой точки где доступен Wi-Fi.

  • Компьютер-компьютер - это, безусловно, самый простой способ использования VoIP. Вам даже не нужно платить за междугородние звонки. Существует несколько компаний, предлагающих бесплатное или очень дешевое программное обеспечение, которое вы можете использовать для VoIP этого типа. Вам потребуется только VoIP ПО и компьютер с микрофоном, динамиками, звуковой картой и подключением к Интернету. За исключением вашего обычного ежемесячного взноса ISP, обычно нет платы за вызовы компьютер-компьютер, независимо от расстояния.
  • унифицируют коммуникации в разных местах предприятия, поддерживают IP-телефоны, аналоговые устройства и различные интерфейсы соединительных линий. АТС управляют IP-телефонами и аналоговыми линиями, а также соединительными линиями PSTN, E1 и ITSP.

Если вы заинтересованы попробовать VoIP, то вы должны ознакомиться с некоторым бесплатным программными обеспечением VoIP, доступным в Интернете. Вы сможете загрузить и настроить его примерно за три-пять минут.

Как именно используется VoIP

Телефонные компании используют VoIP для оптимизации своих сетей. Путем маршрутизации тысяч телефонных звонков через в они могут серьезно уменьшить пропускную способность, которая используется для долгого пути. После получения вызова с другой стороны, он распаковывается, повторно собирается и перенаправляется на коммутатор локальной сети. Даже если это займет некоторое время, вы можете быть уверены, что в конечном итоге все существующие сети с коммутацией каналов будут заменены технологией пакетной коммутации. имеет смысл, как с точки зрения экономики, так и с точки зрения инфраструктуры. Все больше и больше компаний устанавливают проектные решения VoIP, и технология будет продолжать расти. Пожалуй, самая большая привлекательность VoIP для домашних пользователей, которые переключаются - это цена и гибкость.

С помощью VoIP вы можете совершать звонки из любого места, где есть широкополосное подключение. Поскольку или транслируют свою информацию через Интернет, они могут управляться провайдером везде, где есть соединение. Таким образом, деловые путешественники могут взять с собой свои телефоны или ATA в поездки и всегда иметь доступ к своему домашнему телефону.

Другой альтернативой является софтфон (программный телефон) - это клиентское программное обеспечение, которое загружает службу VoIP на ваш рабочий стол или ноутбук. Если у вас есть наушники и микрофон, вы можете совершать звонки с вашего ноутбука в любом месте мира, где есть широкополосное подключение.

Большинство VoIP-компаний предоставляют функции, за которые обычные телефонные компании взимают дополнительную плату.

VoIP включает:

  • Caller ID
  • Ожидание вызова
  • Перевод вызова
  • Повторный набор
  • Обратный вызов
  • Трехсторонний вызов

Существуют также расширенные опции фильтрации вызовов, доступные от некоторых операторов. Эти функции используют информацию идентификатора вызывающего абонента, чтобы вы могли выбрать способ обращения с определенным номером. Вы можете:

  • Переадресовать вызов на определенный номер
  • Отправить вызов непосредственно на голосовую почту
  • Дать вызывающему абоненту сигнал занятости
  • Воспроизвести сообщение «не в обслуживании»
  • Отправить вызывающего абонента на горячую линию отказа

Со многими услугами VoIP вы также можете проверять голосовую почту через Интернет или прикреплять сообщения к электронному письму, которое отправляется на ваш компьютер.

Теперь, когда мы рассмотрели VoIP в общем смысле, давайте посмотрим более внимательно на компоненты, которые заставляют систему работать. Чтобы понять, как работает VoIP, и почему это лучше по сравнению с традиционной телефонной системой, необходимо понять, как работает обычная телефонная система.

VoIP: коммутация каналов

Существующие телефонные системы управляются очень надежным, но несколько неэффективным методом для подключения вызовов, называемым коммутацией каналов. Коммутация каналов - это очень простая концепция, которая используется в сетях телефонной связи более 100 лет. Когда вызов выполняется между двумя сторонами, соединение поддерживается на время вызова. Поскольку вы соединяете две точки в обоих направлениях, соединение называется схемой. Это является основой коммутируемой телефонной сети общего пользования (Public Switched Telephone Network (PSTN)).


Вот как работает обычный телефонный звонок:

1. Вы поднимаете трубку и слушаете гудок. Это позволяет узнать, что у вас есть соединение с местным офисом телефонной связи.

2. Вы набираете номер участника, с которым хотите поговорить.

3. Вызов направляется через у вашего местного оператора на сторону, которую вы вызываете.

4. Соединение между телефоном и линией другой стороны осуществляется с помощью нескольких взаимосвязанных переключателей.

5. на другом конце звонит, и кто-то отвечает на звонок.

6. Соединение открывает цепь.

7. Вы говорите в течение некоторого времени, а затем вешаете трубку.

8. Когда вы повесите трубку, цепь закрывается, освобождая вашу линию и все линии между ними.

Телефонные разговоры по сегодняшней традиционной телефонной сети несколько более эффективны, и они стоят намного дешевле. Ваш голос оцифровывается, и вместе с тысячами других может быть объединен на одном оптоволоконном кабеле. Эти вызовы передаются с фиксированной скоростью 64 Кбит / с в каждом направлении, при общей скорости передачи 128 Кбит/с. Поскольку в килобайте имеется 8 килобит, это переводит на открытую передачу по 16 КБ каждую секунду и 960 КБ каждую минуту. В 10-минутном разговоре общая передача составляет 9 600 КБ, что примерно равно 10 мегабайтам. Если вы посмотрите на типичный телефонный разговор, большая часть этих переданных данных будет потрачена впустую.

VoIP: коммутация пакетов

Телефонная сеть с коммутацией пакетов является альтернативой коммутации каналов. Он работает следующим образом: пока вы говорите, другая сторона слушает, а это означает, что в любой момент времени используется только половина соединения. Исходя из этого, мы можем предположить, что мы могли бы сократить файл в два раза, вплоть до 4,7 МБ, для повышения эффективности. Кроме того, значительная часть времени в большинстве разговоров - мертвый воздух - в течение нескольких секунд, ни одна из сторон не разговаривает. Если бы мы могли удалить эти тихие интервалы, файл будет еще меньше.

Сети передачи данных не используют коммутацию каналов. Ваше интернет-соединение было бы намного медленнее, если бы оно поддерживало постоянное соединение с веб-страницей, которую вы просматривали б в любой момент времени. Вместо этого сети передачи данных просто отправляют и извлекают данные по мере необходимости. И вместо того, чтобы маршрутизировать данные по выделенной линии, пакеты данных проходят через хаотичную сеть по тысячам возможных путей. Это называется коммутацией пакетов.


В то время как коммутация каналов сохраняет соединение открытым и постоянным, пакетная коммутация открывает короткое соединение - достаточно долго, чтобы отправить небольшой фрагмент данных, называемый пакетом, из одной системы в другую. Он работает следующим образом:

    Передающий компьютер отбрасывает данные на небольшие пакеты, причем адрес каждого из них указывает сетевым устройствам, куда их отправлять.

    Внутри каждого пакета есть полезная нагрузка. Полезная нагрузка - это часть электронной почты, музыкальный файл или любой другой тип файла, который передается внутри пакета.

    Передающий компьютер отправляет пакет ближайшему маршрутизатору и забывает об этом. Ближайший маршрутизатор отправляет пакет другому маршрутизатору, который находится ближе к компьютеру-получателю. Этот маршрутизатор отправляет пакет другому, еще более близкому маршрутизатору и так далее.

    Когда принимающий компьютер окончательно получает пакеты, он использует инструкции, содержащиеся в пакетах, для сбора данных в исходное состояние.

Переключение пакетов очень эффективно. Оно позволяет сети маршрутизировать пакеты по наименее перегруженным и самым дешевым линиям. Он также освобождает два компьютера, взаимодействующих друг с другом, чтобы они могли принимать информацию с других компьютеров.

Преимущества использования VoIP

Использует возможности коммутации пакетов в Интернете для обеспечения телефонного обслуживания. VoIP имеет несколько преимуществ перед переключением каналов. Например, коммутация пакетов позволяет нескольким телефонным вызовам занимать пространство, занимаемое только одним в сети с коммутацией каналов. Используя PSTN, этот 10-минутный телефонный разговор о котором мы говорили потреблял 10 полных минут времени передачи по цене 128 Кбит/с. С VoIP этот же вызов мог занимать всего 3,5 минуты времени передачи по цене 64 Кбит/с, оставив еще 64 Кбит/с свободными эти 3,5 минуты и плюс дополнительные 128 Кбит / с в течение оставшихся 6,5 минут. Основываясь на этой простой оценке, еще три или четыре вызова могут легко вписаться в пространство, используемое одним вызовом в обычной системе. И этот пример даже не влияет на использование сжатия данных, что еще больше уменьшает размер каждого вызова.

Предположим, что вы и ваш друг оба обслуживаетесь через VoIP-провайдера. У вас обоих есть аналоговые телефоны, подключенные к , предоставляемым сервисом. Давайте еще раз рассмотрим типичный телефонный звонок, но на этот раз с использованием VoIP через сеть с коммутацией пакетов:

1. Вы поднимаете приемник, который посылает сигнал ATA.

2. ATA принимает сигнал и отправляет тональный сигнал ответа станции. Это позволяет узнать, что у вас есть подключение к Интернету.

3. Вы набираете номер телефона, с которым вы хотите поговорить. преобразует тоны в цифровые данные и временно их сохранит.

4. Данные телефонных номеров отправляются в форме запроса на процессор вызовов вашей VoIP-компании. Процессор вызова проверяет его, чтобы убедиться, что он в допустимом формате.

5. Обработчик вызовов определяет, кому сопоставить номер телефона. При сопоставлении номер телефона преобразуется в IP-адрес. Программный коммутатор соединяет два устройства с обоих концов вызова. С другой стороны, сигнал отправляется в ATA вашего друга, для того чтоб связанный телефон звонил.

6. Как только ваш друг берет трубку, сеанс устанавливается между вашим компьютером и компьютером вашего друга. Это означает, что каждой системе известно, что пакеты данных будут поступать из другой системы. В середине обычная инфраструктура Интернета обрабатывает вызов, как если бы это была электронная почта или веб-страница. Каждая система должна использовать один и тот же протокол для связи. В рамках сеанса системы реализуют два канала, по одному для каждого направления.

7. Вы говорите какое-то время. Во время разговора ваша система и система вашего друга передают пакеты туда и обратно, когда есть данные для отправки. ATA на каждом конце транслируют эти пакеты по мере их приема и преобразуют их в аналоговый аудиосигнал, который вы слышите. Ваш ATA также держит цепь открытой между собой и вашим аналоговым телефоном, пока он пересылает пакеты на и с IP-хоста на другом конце.

8. Вы закончите разговор и повесили трубку.

9. Когда вы повесите трубку, цепь закрывается между вашим телефоном и ATA.

10. ATA посылает сигнал на мягкий коммутатор, соединяющий вызов, завершая сеанс.

Вероятно, одним из самых убедительных преимуществ пакетной коммутации является то, что сети передачи данных уже понимают технологию. Переходя к этой технологии, телефонные сети сразу же получают возможность сообщать, как это делают компьютеры.

Недостатки использования VoIP

Текущая коммутируемая телефонная сеть общего пользования является надежной и довольно пуленепробиваемой системой для доставки телефонных звонков. Телефоны просто работают, и все мы зависим от этого. С другой стороны, компьютеры, электронная почта и другие связанные с ними устройства по-прежнему выглядят неровными. Посмотрим правде в глаза - мало кто действительно паникует, когда их электронная почта падает на 30 минут. Время от времени это ожидаемо. С другой стороны, полчаса без тонального сигнала набора номера могут легко отправить людей в панику. Так что PSTN может испытывать недостаток в эффективности, это более чем компенсирует надежность. Но сеть, которая составляет Интернет, намного сложнее и, следовательно, функционирует с гораздо большей погрешностью. Соответственно одним из основных недостатков VoIP есть надежность.

    Прежде всего, зависит от мощности сети. Ваш текущий телефон работает на фантомном питании, который предоставляется по линии от центрального офиса. Даже если ваша мощность гаснет, ваш телефон все еще работает. С помощью VoIP нет питания, нет телефона. Для VoIP должен быть создан стабильный источник питания.

    Другое рассмотрение заключается в том, что многие другие системы в вашем доме могут быть интегрированы в телефонную линию. Цифровые видеомагнитофоны, цифровые абонентские телевизионные услуги и системы домашней безопасности используют стандартную телефонную линию для выполнения своих задач. В настоящее время нет способа интегрировать эти продукты с VoIP.

    Чрезвычайные вызовы также становятся проблемой VoIP. Как указывалось ранее, VoIP использует IP-адресные номера телефонов, а не номера телефонов NANP. Невозможно связать географическое местоположение с IP-адресом. Поэтому, если вызывающий абонент не может сообщить оператору, где он находится, тогда нет способа узнать, какой центр обработки вызовов направит экстренный вызов и какой EMS должен ответить. Чтобы исправить это, возможно, географическая информация может быть каким-то образом интегрирована в пакеты.

    Поскольку VoIP использует интернет-соединение, он восприимчив ко всему, что обычно связанно с домашними широкополосными услугами. Все эти факторы влияют на качество связи: латентность, дрожание и потерю пакетов. Телефонные разговоры могут быть искажены или потеряны из-за ошибок передачи. Некоторая стабильность в передаче данных в Интернете должна быть гарантирована до того, как VoIP действительно сможет заменить традиционные телефоны

    VoIP уязвим для вирусов и взломов, хотя это очень редко, и разработчики VoIP работают над VoIP-шифрованием, чтобы противостоять этому.

Еще одна проблема, связанная с VoIP, заключается в том, что зависит от отдельных ПК с различными характеристиками и мощностью. На вызов может повлиять повреждение процессора. Предположим, вы разговариваете на своем программном телефоне, и вы решили открыть программу, которая уничтожает ваш процессор. Потеря качества сразу станет очевидной. В худшем случае ваша система может потерпеть крах в середине важного вызова. В VoIP все телефонные звонки зависят от обычных проблем с компьютером.

Одним из препятствий, которые были преодолены некоторое время назад, было преобразование аналогового аудиосигнала, который ваш телефон получает в пакеты данных. Как аналоговый звук превращается в пакеты для передачи VoIP? Ответ - это кодеки.

VoIP: программные коммутаторы и протоколы

Программный коммутатор содержит базу данных пользователей и телефонных номеров. Если у него нет необходимой информации, он передает запрос вниз по течению другим программным коммутаторам до тех пор, пока не найдет тот, который может ответить на запрос. Как только он находит пользователя, он находит текущий IP-адрес устройства, связанного с этим пользователем, в подобной серии запросов. Он отправляет всю соответствующую информацию на софтфон или , позволяя обмен данными между двумя конечными точками.

Софт коммутаторы работают в тандеме с сетевыми устройствами, чтобы сделать VoIP возможным. Чтобы все эти устройства работали вместе, они должны общаться одинаково. Это сообщение является одним из наиболее важных аспектов, которые нужно будет уточнить для VoIP.

Протоколы

На каждом конце VoIP-звонка мы можем использовать любую комбинацию аналогового или IP-телефона действующего как пользовательский интерфейс, или клиентское программное обеспечение, работающее с кодеком для обработки цифро-аналогового преобразования, и программные коммутаторы, отображающие вызовы. Как объеденить все эти совершенно разные аппаратные и программные средства для эффективного общения? Ответ - это протоколы.

В настоящее время для VoIP используется несколько протоколов. Эти протоколы определяют способы соединения устройств, таких как кодеки, друг с другом и с сетью с использованием VoIP. Они также включают спецификации для аудиокодеков. Наиболее широко используемый протокол - H.323, стандарт, созданный Международным союзом электросвязи (МСЭ). H.323 - это всеобъемлющий и очень сложный протокол, который был первоначально разработан для видеоконференций. Он предоставляет спецификации для интерактивных видеоконференций в режиме реального времени, обмена данными и аудио-приложениями, таких как VoIP. На самом деле набор протоколов, H.323 включает в себя множество отдельных протоколов, которые были разработаны для конкретных приложений.

Набор протоколов H.323:

Передача (транспортировка)

H.323 - это большой набор протоколов и спецификаций, что позволяет использовать его для столь многих приложений. Проблема с H.323 заключается в том, что он специально не предназначена для VoIP.

Альтернатива H.323 возникла при разработке протокола инициирования сеанса (SIP). SIP - это более оптимизированный протокол, разработанный специально для приложений VoIP. Меньше и эффективнее, чем H.323, SIP использует существующие протоколы для обработки определенных частей процесса. Протокол управления шлюзом мультимедиа (MGCP) является третьим широко используемым протоколом VoIP, который фокусируется на управлении конечной точкой. MGCP ориентирован на такие функции, как ожидание вызова.

Одна из проблем, с которыми сталкивается VoIP во всем мире, заключается в том, что эти три протокола не всегда совместимы. VoIP-звонки между несколькими сетями могут перехватываться, если они попадают в конфликтующие протоколы.

Мониторинг VoIP-вызовов

VoIP имеет свои отличительные преимущества и недостатки. Наибольшее преимущество VoIP - это цена, и самым большим недостатком является качество звонков. Для предприятий, которые развертывают , особенно те, кто работает с загруженными колл-центрами, проблемы с качеством вызовов являются неизбежными и неприемлемыми. Чтобы проанализировать и устранить проблемы с качеством связи, большинство из этих компаний используют технологию, называемую мониторингом VoIP-вызовов.

Мониторинг VoIP-вызовов, также известный как контроль качества, использует аппаратные и программные решения для тестирования, анализа и оценки общего качества вызовов, совершаемых по телефонной сети VoIP. Мониторинг вызовов является ключевым компонентом плана обеспечения качества обслуживания.

Оборудование и программное обеспечение для мониторинга вызовов используют различные математические алгоритмы для измерения качества VoIP-вызова и создания оценки. Самый общий балл называется средней оценкой (MOS). MOS измеряется в масштабе от одного до пяти, хотя 4.4 является технически самым высоким показателем в сети VoIP. MOS 3.5 или выше считается «хорошим вызовом».

Чтобы оценить MOS, аппаратные средства и программное обеспечение для мониторинга вызовов анализируют несколько различных параметров качества вызова, наиболее распространенными из которых являются:

    Период ожидания - это временная задержка между двумя концами телефонного разговора VoIP. Ее можно измерить как в одну сторону, так и в оба конца. Задержка в оба конца способствует «эффекту разговора», возникающему во время плохих вызовов VoIP, когда люди в конечном итоге не общаются друг с другом, потому что думают, что другой человек перестал говорить. Задержка в оба конца более 300 миллисекунд считается плохой.

    Дрожание (джиттер) - это латентность, вызванная появлением пакетов или неправильным порядком. Большинство сетей VoIP пытаются избавиться от джиттера с помощью чего-то, называемого буфером дрожания, который собирает пакеты в небольших группах, помещает их в правильном порядке и доставляет их конечному пользователю все сразу. VoIP-абоненты заметят дрожание 50 мс или более.

    Пакетная потеря. Частью проблемы с буфером дрожания является то, что иногда он перегружается, а опоздавшие пакеты «отбрасываются» или теряются. Иногда пакеты теряются во время разговора, и иногда целые предложения будут выпадать. Потеря пакетов измеряется как процент от потерянных пакетов к принятым пакетам.

Существует два разных типа мониторинга вызовов: активный и пассивный. Активный (или субъективный) мониторинг вызовов происходит до того, как компания развертывает свою сеть VoIP. Активный мониторинг часто осуществляется производителями оборудования и сетевыми специалистами, использующими VoIP-сеть компании исключительно для целей тестирования. Активное тестирование не может произойти после развертывания сети VoIP, и сотрудники уже используют эту систему.

Мониторинг пассивного вызова анализирует VoIP-звонки в режиме реального времени, пока их делают фактические пользователи. Мониторинг пассивных вызовов может обнаруживать проблемы сетевого трафика, перегрузки буфера и другие сбои, которые сетевые администраторы могут исправлять во время простоя сети.

Другим методом мониторинга звонков является запись телефонных звонков VoIP для последующего анализа. Однако этот тип анализа ограничен тем, что можно услышать во время разговора, а не тем, что происходит в реальной сети. Этот тип мониторинга обычно осуществляется людьми, а не компьютерами, и называется обеспечением качества.

Wi-Fi телефоны VoIP

Поддержывают как обычное проводное соединение или сотовую радиостанцию, так и Wi-Fi (802.11 b / g). Wi-Fi позволяет сотовому телефону подключаться к беспроводной сети Интернет через беспроводной маршрутизатор. Если у вас есть беспроводной интернет-маршрутизатор в вашем доме, вы можете использовать свой телефон для совершения VoIP-звонков.

Вот как это работает:

1. Когда телефон находится в зоне беспроводной сети Интернет, телефон автоматически распознает и подключается к сети.

2. Любые вызовы, которые вы инициируете в беспроводной сети, маршрутизируются через Интернет в виде VoIP-вызовов.

3. Если телефон находится вне зоны действия беспроводного интернет-сигнала, он автоматически переключается на обычную сотовую сеть, и звонки оплачиваются как обычно.

4. Двухрежимные телефоны могут беспрепятственно отключаться от Wi-Fi до сотовой (и наоборот) в середине вызова при входе и выходе из сетей Wi-Fi.

Подобны двухрежимным сотовым телефонам и , но не являются технически сотовыми телефонами, потому что у них есть только Wi-Fi-радио и нет сотовой радиосвязи. Телефоны Wi-Fi могут звонить только при подключении к беспроводной сети Интернет. Это означает, что все телефонные звонки Wi-Fi являются VoIP-звонками.

Wi-Fi-телефоны полезны в крупных компаниях и офисах с собственными обширными беспроводными сетями. И может оказаться следующей большой вещью, с расширяющимся рынком для муниципального Wi-Fi. Представьте, что весь ваш город был охвачен высокоскоростной беспроводной сетью. Это означает дешевые VoIP-звонки, куда бы вы ни пошли.

Например в Англии компания под названием Hutchinson 3G уже сотрудничает с популярным VoIP-сервисом Skype, чтобы представить Skypephone. Skypephone позволяет пользователям делать бесплатные сотовые телефонные звонки другим пользователям Skype. Телефон также может выполнять обычные сотовые вызовы для пользователей, не являющихся пользователями Skype, за обычные сборы.

В заключение

VoIP - это значительное улучшение по сравнению с существующей телефонной системой по эффективности, стоимости и гибкости. Как и любая новая технология, у VoIP есть некоторые проблемы для преодоления, но ясно, что разработчики будут продолжать совершенствовать эту технологию, пока она в конечном итоге не заменит текущую телефонную систему.

Технология может повысить общую производительность организации, позволяя своим сотрудникам выполнять многозадачность без перерывов. Она также позволяет организации выделять средства, обычно потраченные на традиционные телефонные счета, на другие аспекты бизнеса. VoIP дает возможность пользователям прикладывать документы, проводить виртуальные встречи и обмениваться данными посредством видеоконференций. На данный момент производители интенсивно работают над устранением основной проблемы VoIP - улучшение четкости голоса, чтобы сделать ее неотличимой от традиционной телефонии. Ранее версии VoIP производили искаженные телефонные звонки, отставание в передаче и отбрасываемые звонки, но изменения в технологии VoIP сделало ее более привлекательной для бизнеса и корпораций, учитывая, что идет постоянная работа над предыдущими ошибками.

Многие страны до сих пор не уверены в том, как регулировать VoIP - следует ли рассматривать его на уровне PSTN или он более похож на Интернет? Национальным и даже международным органам скоро придется решать, как бороться с будущим индустрии VoIP. Дополнительные проблемы для предприятий и потребителей включают конфиденциальность и безопасность. Однако эти области более туманны, и немногие знают о правильных вопросах, которые нужно задать, не говоря уже о поиске ответов. В быстрорастущих отраслях, таких как VoIP, единственная уверенность в том, что на горизонте всегда будет что-то новое.

За последние годы было предложено несколько решений по созданию универсальной инфраструктуры для передачи разнородного трафика. В условиях повышенных требований к качеству сервиса и ширине полосы пропускания необходимы сети с услугами высокого качества и повышенной скоростью передачи.

IP играет ключевую роль в обеспечении гибкости обслуживания. Для того чтобы увеличить общую рентабельность сети, поставщики должны предоставить услуги, основанные на IP или способные «понимать» IP, так как большинство приложений, требующих предоставления услуг глобальных сетей, использует IP. А поскольку потребители продолжают требовать от своих поставщиков предоставления дополнительных функциональных возможностей, поставщики должны постоянно искать все новые и новые услуги, которые смогут дополнить и усилить приложения потребителей. Можно с уверенностью говорить о том, что эти услуги должны быть основаны на IP.

IP становится стандартным протоколом для корпоративных, intranet- и extranet-сетей. В 80-е годы территориально-распределенные корпоративные сети строились на основе выделенных каналов E1/T1. Для уплотнения каналов применялись мультиплексоры, используемые для интеграции голоса и данных в сетях общего пользования и в частных сетях. В то же время принципы построения телефонных сетей кардинально не менялись. В таких сетях телефонные соединения устанавливаются по предопределенным маршрутам (основным и альтернативным) и «страдают» множеством ограничений: высокая стоимость поддержания большого количества маршрутных таблиц каждой УАТС (PBX) и их реконфигурации при изменении телефонных потоков, неэффективное использование полосы пропускания, ухудшение качества речи при применении механизмов сжатия в сетях с множеством АТС и другие.

В последние годы были разработаны устройства, обеспечивающие передачу голоса по сетям, изначально нацеленным на передачу данных, таким как Frame Relay и IP-сети. Движущей силой при этом является стремление сократить расходы на использование арендуемых линий связи и повысить эффективность применения выделенных корпоративных коммуникаций.

Новый стимул развитию телефонных сетей дало появление технологии передачи голоса по АТМ-сетям, которая предусматривает возможность подключения АТС к АТМ-коммутаторам, способным обрабатывать как потоки данных, так и телефонные сигналы.

В данной статье описываются:

  • технологии передачи голоса и данных по IP-сетям;
  • проблемы построения интегрированных сетей;
  • механизмы, обеспечивающие повышение эффективности полосы пропускания и гибкости управления потоками (компрессии, подавления пауз речи);
  • оборудование ведущих производителей.

Что такое IP-телефония

Телефонная связь по IP - сравнительно молодая служба, использующая, как правило, управляемую IP-сеть для передачи телефонного трафика.

В течение следующих пяти лет ожидаются феноменальные темпы роста рынка услуг VoIP (голос поверх IP). Согласно данным Killen & Associates, в компаниях, входящих в список Fortune 1000, по IP-сетям сейчас проходит менее 1% голосового трафика; к 2002 году эта доля должна достигнуть 18%, а к 2005-му - 33%.

Пользователей и поставщиков услуг привлекают экономические выгоды применения IP для передачи телефонного трафика, проведения конференц-связи с одновременным обменом информацией, IP-центры обслуживания звонков, прозрачная маршрутизация запросов пользователей.

Сравнение качества стандартной телефонной связи по сетям общего пользования с первым поколением устройств VoIP оказывается не в пользу последних, в первую очередь из-за низкой надежности и невысокого качества обслуживания. Однако появление сложных современных приложений и устройств - высокопроизводительных коммутаторов и маршрутизаторов, использующих развитые механизмы управления качеством обслуживания (QoS) процессоров цифровых сигналов (DSP), - устраняет многие проблемы VoIP-систем второго поколения.

Под IP-телефонией понимается технология использования IP- сети (Internet или любой другой) в качестве средства организации и ведения телефонных разговоров и передачи факсов в режиме реального времени. IP-телефония является одним из наиболее сложных приложений компьютерной телефонии.

В общих чертах передача голоса в IP-сети происходит следующим образом. Входящий звонок и сигнальная информация из телефонной сети передаются на пограничное сетевое устройство, называемое телефонным шлюзом, и обрабатываются специальной картой устройства голосового обслуживания. Шлюз, используя управляющие протоколы семейства H.323, перенаправляет сигнальную информацию другому шлюзу, находящемуся на приемной стороне IP-сети. Приемный шлюз обеспечивает передачу сигнальной информации на приемное телефонное оборудование согласно плану номеров, гарантируя сквозное соединение. После установления соединения голос на входном сетевом устройстве оцифровывается (если он не был цифровым), кодируется в соответствии со стандартными алгоритмами ITU, такими как G.711 или G.729, сжимается, инкапсулируется в пакеты и отправляется по назначению на удаленное устройство с использованием стека протоколов TCP/IP.

Таким образом, используя IP-сеть, можно обмениваться цифровой информацией для пересылки голосовых или факсимильных сообщений между двумя компьютерами в режиме реального времени. Применение Internet позволит реализовать данную службу в глобальном масштабе.

Основными проблемами построения IP-сети для передачи телефонного трафика являются механизмы управления задержками и поддержание достаточной ширины полосы пропускания. Кроме того, важны способы установления тарифов на услуги и выставления счета за их использование, а также варианты оплаты в IP-сети дополнительных услуг, таких как переадресация вызова, определение номера абонента, маршрутизация в зависимости от времени суток и др.

Немаловажной является проблема оценки прибыльности новой технологии. Действительно ли объединение средств связи на базе IP-сетей сулит значительную экономию? Ответ на этот вопрос можно получить только при комплексном рассмотрении проблемы. Возможно, все обстоит именно так. Если стоимость передачи информации по сети составляет лишь 15-20% от всех затрат на поддержку сетевой инфраструктуры, то 70-процентная экономия сетевых расходов может показаться не столь привлекательной по сравнению с объемом работы, который необходимо будет проделать для перевода всех функций на универсальную основу, а также по сравнению с количеством затрачиваемых средств на создание универсальной инфраструктуры и возможностью использования имеющегося оборудования.

И это лишь малая часть всех проблем, связанных с внедрением универсальных линий связи. Поэтому, как правило, предложение поставщиками услуг интегрированных сетей начинается с создания небольших специализированных сетей, на которых происходит обкатка интеграционных технологий, поиск ответов на вопросы, возникающие при объединении различных видов связи. Однако уже сейчас можно говорить о реальности построения интегрированной инфраструктуры.

Общий подход к построению IP-сети для передачи телефонного трафика

  • «компьютер - компьютер»

    Данный вариант не является примером IP-телефонии, так как голос передается только по сети передачи данных, без выхода в телефонную сеть. Для организации передачи трафика пользователь приобретает необходимое оборудование и программное обеспечение, а также платит провайдеру за эксплуатацию канала связи. Достоинство этого варианта заключается в максимальной экономии средств. Недостаток - минимальное качество связи.

  • «телефон - телефон»

    Для организации такой связи необходимо наличие определенных сетевых устройств и механизмов взаимодействия. Голосовой трафик передается через IP-сеть, как правило, на отдельном дорогостоящем участке. Устройствами, организующими взаимодействие, являются шлюзы, состыкованные, с одной стороны, с телефонной сетью общего пользования, а с другой - с IP-сетью. Голосовая связь в таком режиме, по сравнению с вариантом «компьютер - компьютер», стоит дороже, однако качество ее значительно выше и пользоваться ею удобнее. Для того чтобы воспользоваться этой услугой, надо позвонить провайдеру, обслуживающему шлюз, ввести с телефонного аппарата код и номер вызываемого абонента и разговаривать так же, как при обычной телефонной связи. Все необходимые операции по маршрутизации вызова выполнит шлюз.

  • «компьютер - телефон»

    Здесь открывается больше возможностей использования для корпоративных пользователей, так как чаще всего применяется корпоративная сеть, обслуживающая вызовы от компьютеров до шлюза, которые уже затем передаются по телефонной сети общего пользования. Корпоративные решения с использованием связи «компьютер - телефон» могут помочь сэкономить деньги, а необходимое для этого оборудование будет рассмотрено ниже.

Итак, очевидно, что для построения сети IP-телефонии необходимы два основных элемента (рис. 1).

Первый - шлюз (gateway), обеспечивающий функции преобразования между пакетно-коммутируемой IP-сетью и телефонной сетью общего пользования, аналого-цифровое преобразование, управление форматами передачи и процедурами VoIP-вызовов. Возможно использование множества шлюзов в сети.

Второй основной элемент - устройство управления (gatekeeper), обеспечивающее ряд функций по управлению доступом в IP-сеть и из IP-сети, шириной полосы пропускания и адресацией. Кроме того, устройство управления осуществляет контроль всех шлюзов и терминалов, исполняет функции службы каталогов, контролирует счета пользователей.

Шлюз может поставляться в виде отдельного сетевого устройства или устанавливаться на персональном компьютере. При использовании шлюза VoIP-функция прозрачна для пользователя, использующего обычный телефон или факсимильный аппарат. Рассмотрим более подробно основные функции шлюза при передаче голоса через IP-сеть.

1. Функция поиска. Когда исходящий IP-шлюз размещает телефонный вызов через IP-сеть, он принимает номер вызывающего абонента и конвертирует его в IP-адрес шлюза назначения, исходя или из таблицы в исходящем шлюзе, или из данных централизованного сервера. Просмотр таблицы в исходящем шлюзе часто требует меньше времени, чем в централизованном сервере, и сокращает время соединения с 4-5 секунд до 1-2 секунд.

2. Функция связи. Исходящий шлюз устанавливает соединение со шлюзом назначения, обмениваясь информацией о параметрах соединения и совместимости устройств.

3. Оцифровка. Аналоговые сигналы телефонной связи оцифровываются шлюзом и преобразуются обычно в 64 Kбит/c ИКМ (импульсно-кодовая модуляция)-сигнал. Эта функция требует от шлюза поддержки разнообразных интерфейсов аналоговой телефонной связи.

Во многих случаях требуется также поддержка цифровой сети с интеграцией служб и интерфейсов T1/E1. Цифровая сеть с интеграцией служб и интерфейсы T1/E1 работают в формате ИКМ, так что аналого-цифровое преобразование в этом случае не требуется. Цифровая сеть с интеграцией служб BRI имеет один или два ИКМ-канала, T1 - до 24 каналов ИКМ и E1 - до 30 ИКМ-каналов. Цифровая сеть с интеграцией служб PRI может иметь до 24 или 30 каналов ИКМ.

4. Демодуляция. Поскольку некоторые шлюзы могут принимать только голосовой или только факсимильный сигнал, должны быть заранее определены магистральные каналы к модулям обработки голоса или факса. Более сложные шлюзы могут обрабатывать данные обоих типов, автоматически определяя, является ли цифровой сигнал звуковым или факсимильным, и производя обработку сигнала в зависимости от его типа. Факсимильный сигнал демодулируется сигнальным процессором (DSP) обратно в цифровой формат 2,4-14,4 Kбит/c, то есть в первоначальное представление до выдачи из факс-аппарата (факс-аппарат представляет выходной сигнал в аналоговом виде). Этот демодулированный сигнал затем помещается в IP-пакеты для передачи шлюзу назначения (рис. 2).

Демодулированная информация затем снова преобразуется шлюзом назначения в аналоговый факс-сигнал для доставки факс-аппарату.

Передача факса может быть осуществлена с использованием UDP/IP- или TCP/IP-протоколов. UDP/IP, в отличие от TCP/IP, не требует исправления ошибок, возникающих при передаче пакетов.

5. Компрессия. После того как определено, что сигнал является голосовым, он обычно сжимается сигнальным процессором с использованием одного из методов компрессии/декомпрессии (КОДЕК) (табл. 1) и помещается в IP-пакеты. При этом важно обеспечить хорошее качество речи и низкую задержку при оцифровывании сигнала.

Таблица 1. Методы компрессии (сжатия) речи

Метод компрессии Сложность Качество Задержка
G.726, G.727, ADPCM 40, 32, 24 Кбит/с низкая (8 MIPS) хорошее (40К), плохое (16К) очень низкая (10-17 мс)
G.729 CS-ACELP 8 Кбит/с высокая (30 MIPS) хорошее низкая
G.729A CA-ACELP 8 Кбит/с умеренная среднее низкая
G.723.1 MP-MLQ 6,4/5,3 Кбит/с умеренно высокая (20 MIPS) хорошее (6,4), среднее (5,3) высокая
G.728 LD-CELP 16 Кбит/с очень высокая (40 MIPS) хорошее низкая

Звуковой пакет передается как пакет UDP/IP, а не TCP/ IP для избежания довольно больших задержек, возникающих при повторной передаче TCP/IP-пакетов. Если используется режим FEC (непосредственное исправление ошибок), то искаженный или отсутствующий звуковой пакет может быть восстановлен на основе данных предыдущего звукового пакета. Если механизм FEC не применяется, то искаженный пакет просто отвергается и шлюз использует предыдущий хороший пакет. Этот механизм работает незаметно для пользователя в случае низкого процента искажения/потерь пакетов (< 5%).

Данные, оцифровываемые КОДЕКом, не содержат адрес IP-пакета и управляющую информацию («заголовок») (рис. 3), которые обычно составляют дополнительные 7 Кбит/с, если IP-маршрутизатор отдельно не компрессирует заголовок, в противном случае - 2-3 Кбит/с.

Сложность реализации КОДЕКа определяет мощность требуемого сигнального процессора, измеряемую в миллионах операций в секунду (MIPS), для обработки голосового сигнала, исключая функции компенсации эхо-сигнала и подавления молчания.

6. Декомпрессия/демодуляция. Шлюз, исполняя шаги 1-4, описанные выше, в то же самое время принимает пакеты от других IP-шлюзов и декомпрессирует пакеты в форму, понятную соответствующим устройствам аналоговой телефонной связи, цифровой сети с интеграцией служб или с интерфейсами T1/E1. Шлюз также осуществляет демодуляцию цифрового факсимильного сигнала в первоначальную форму, а затем в соответствующий интерфейс телефонной связи.

Кроме того, шлюз может выполнять функции согласования интерфейсов инициатора звонка и принимающего вызов.

Качество IP-речи

Для обеспечения высокого качества речи VoIP-шлюз должен использовать кодек с хорошим качеством речи и низкой задержкой. Кроме того, имеется несколько дополнительных технологий, необходимых для того, чтобы гарантировать хорошее качество речи: две из них - система приоритетов пакетов и компенсация эха. Компенсация эха - функция сигнального процессора, система приоритетов пакета - функция маршрутизатора и шлюза.

Когда двухпроводный телефонный кабель соединяется с четырехпроводным интерфейсом УАТС (PBX) или telco-интерфейсом центральной станции (СО), используется специальное электрическое соединение, называемое гибридной схемой, для согласования двухпроводного и четырехпроводного соединения. Хотя гибридные схемы очень эффективны для выполнения функций согласования, небольшой процент энергии телефонного сигнала не конвертируется, а отражается обратно к вызывающему абоненту. Этот сигнал называется «эхо-сигналом».

Если вызывающий абонент находится около УАТС или центрального коммутатора, эхо-сигнал возвращается достаточно быстро и для человека неразличим. Однако если задержка составляет более 10 мс, вызывающий абонент может услышать отраженный сигнал. Чтобы предотвратить появление эхо-сигнала, поставщики шлюзов включают специальный код в сигнальные процессоры, которые прослушивают эхо-сигнал и удаляют его из аудиосигнала. Компенсация эха особенно важна для поставщиков шлюзов, потому что задержка в IP-сети может легко превысить 40-50 миллисекунд, так что эхо-сигнал будет явно ощущаться на ближнем конце. Компенсация эхо-сигнала, идущего от дальнего конца линии, позволяет существенно повлиять на качество сигнала.

Основными источниками снижения качества речи являются сетевая задержка и флуктуация пакетов. Сетевая задержка представляет собой среднее значение времени передачи пакета по сети. Флуктуация - отклонение от среднего времени передачи пакета. Оба параметра важны для определения качества речи.

Поскольку время передачи по сети (полное время, включая время обработки кодеком) часто превышает 150 мс, общение двух абонентов будет все более и более напоминать режим полудуплексной связи с установлением нужной паузы при разговоре. Если паузы фиксируются плохо, то речь одного собеседника как бы «набегает» на речь другого.

Одним из основных средств борьбы с перегруженностью сети должно стать обеспечение качества сервиса (Quality of Service - QoS).

В чем смысл QoS? QoS означает динамическое предоставление гарантированной полосы пропускания для различных приложений и передачу данных в соответствии с требованиями, определяемыми пользователем. До сих пор не существует принимаемой всеми трактовки термина «QoS»; чаще всего под QoS понимают установку трафику приоритетов без гарантий на ширину полосы пропускания, обеспечение полосы пропускания фиксированной ширины при передаче данных между двумя заданными узлами сети на основе постоянных или коммутируемых виртуальных каналов, гарантированную поставщиками услуг Internet общую ширину полосы пропускания.

Хорошее качество речи, передаваемой через IP-сеть, объясняется в основном небольшой флуктуацией пакетов, а не низкими значениями сетевой задержки. Значения флуктуации пакетов сети поддерживаются интеллектуальными возможностями маршрутизаторов, которые могут управлять приоритетами голосовых пакетов в IP-сети. Маршрутизатор настраивается на поиск голосовых IP-пакетов и размещение их перед пакетами данных, ожидающими передачи. Система приоритетов голосовых пакетов особенно важна в региональных сетях связи со скоростями от 56 до 512 Кбит/с. При скоростях, характерных для линий T1/E1, это может не потребоваться.

Таким образом, в настоящее время требуемое качество обслуживания обеспечивается в основном средствами управления приоритетом трафика. Отметим, что в IP-сетях возможны и более сложные процедуры управления качеством.

Сегментация IP-пакетов является еще одним важным механизмом управления задержкой VoIP, позволяющим гарантировать, что очень длинный пакет данных не задержит пакет с речевой информацией на выходе из маршрутизатора. Это достигается настройкой маршрутизатора на сегментирование всех исходящих пакетов данных в соответствии с быстродействием сети связи. Комбинация системы приоритетов голоса/факсов и механизмов сегментации пакета создает хорошие предпосылки для построения VoIP-сети.

Другая технология, используемая некоторыми шлюзами для обеспечения хорошего качества речи, - непосредственное исправление ошибок (FEC).

Управление полосой пропускания

Как уже отмечалось, второй важной проблемой внедрения технологий передачи речи по IP-сети является минимизация используемой полосы пропускания канала связи. Здесь важную роль играют механизмы компрессии и подавления пауз. Механизмы, использующие технологию подавления пауз, определяют периоды молчания абонентов в течение сеанса связи или факсимильной передачи и останавливают посылку IP-пакетов в течение этих периодов.

Стремление к более эффективному использованию полосы пропускания стимулирует развитие механизмов сжатия речи. Стандартный ИКМ-сигнал для передачи речи, как уже отмечалось, требует выделения полосы пропускания шириной 64 Кбит/с (рекомендация МСЭ-Т G.711), что на самом деле слишком много.

Один из давно используемых алгоритмов сжатия речи называется АДИКМ (ADPCM, Adaptive Differential Pulse Code Modulation; стандарт G.726 был принят в 1984 году). Этот алгоритм дает практически такое же качество воспроизведения речи, как и ИКМ, однако для передачи информации при его использовании требуется полоса всего в 16 Кбит/с. Метод основан на кодировании не самой амплитуды сигнала, а ее изменения по сравнению с предыдущим значением; поэтому можно обойтись меньшим числом разрядов. В АДИКМ изменение уровня сигнала кодируется четырехразрядным числом, при этом частота измерения амплитуды сигнала сохраняется неизменной.

Все методы кодирования, основанные на определенных предположениях о форме сигнала, не подходят для передачи сигнала с резкими скачками амплитуды. Именно такой вид имеет сигнал, генерируемый модемами или факсимильными аппаратами, поэтому аппаратура, поддерживающая сжатие, должна автоматически распознавать сигналы факс-аппаратов и модемов и обрабатывать их иначе, чем голосовой трафик.

Многие методы кодирования берут свое начало от метода кодирования с линейным предсказанием (LPC, Linear Predictive Coding). В качестве входного сигнала в LPC используется последовательность цифровых значений амплитуды, но кодирование применяется не к отдельным цифровым значениям, а к определенным их блокам. Для каждого такого блока значений вычисляются его характерные параметры: частота, амплитуда и ряд других. Именно эти значения и передаются по сети. При таком подходе к кодированию речи, во-первых, возрастают требования к вычислительным мощностям специализированных процессоров, используемых для обработки сигнала, а во-вторых, увеличивается задержка при передаче, поскольку кодирование применяется не к отдельным значениям, а к некоторому их набору, который перед началом преобразования следует накопить в определенном буфере. Важно, что задержка в передаче речи не только связана с необходимостью обработки цифрового сигнала (эту задержку можно уменьшить, увеличив мощность процессора), но и определяется методом сжатия. Этот метод позволяет достигать очень больших степеней сжатия с полосой пропускания 2,4 или 4,8 Кбит/с, однако качество звука сильно страдает. Поэтому в коммерческих приложениях он не используется, а применяется в основном для ведения служебных переговоров.

Более сложные методы сжатия речи основаны на применении ЛКП в сочетании с элементами кодирования формы сигнала. В этих алгоритмах используется кодирование с обратной связью, когда при передаче сигнала осуществляется оптимизация кода. Закодировав сигнал, процессор пытается восстановить его форму и сравнивает результат с исходным сигналом, после чего начинает варьировать параметры кодировки, добиваясь наилучшего совпадения. Добившись совпадения, аппаратура передает полученный код по линиям связи; на противоположном конце происходит восстановление звукового сигнала. Ясно, что для использования такого метода требуются еще более серьезные вычислительные мощности.

Одной из наиболее распространенных разновидностей описанного метода кодирования является метод LD-CELP (Low-Delay Code-Excited Linear Prediction). Этот метод позволяет достичь удовлетворительного качества воспроизведения при пропускной способности 16 Кбит/с; он был стандартизован Международным союзом электросвязи (International Telecommunications Union - ITU) в 1992 году как алгоритм кодирования речи G.728. Алгоритм применяется к последовательности цифр, получаемых в результате аналого-цифрового преобразования голосового сигнала с 16-разрядным разрешением. Пять последовательных цифровых значений кодируются одним 10-битным блоком - это и дает 16 Кбит/с. Для применения этого метода требуются большие вычислительные мощности: в частности, для непосредственной реализации G.728 необходим процессор с быстродействием 44 MIPS.

В марте 1995 года ITU принял новый стандарт G.723, который предполагается использовать при сжатии речи для организации видеоконференций по телефонным сетям. Этот стандарт является частью более общего стандарта H.324, описывающего подход к организации таких видеоконференций. Целью его принятия является обеспечение видеоконференций с использованием обычных модемов. Основой G.723 является метод сжатия речи MP-MLQ (Multipulse Maximum Likelihood Quantization). Он позволяет добиться весьма существенного сжатия речи при сохранении достаточно высокого качества звучания. В основе метода лежит описанная выше процедура оптимизации; с помощью различных усовершенствований можно сжимать речь до уровня 4,8; 6,4; 7,2 и 8,0 Кбит/с. Структура алгоритма позволяет изменять степень сжатия голоса в ходе передачи. Вносимая кодированием задержка не превышает 20 мс.

Повышая эффективность использования полосы пропускания, механизмы сжатия речи в то же время могут привести к снижению качества речи и увеличению задержек. Некоторые основные алгоритмы сжатия речи и создаваемые при этом задержки приведены в табл. 1.

Количественными характеристиками ухудшения качества речи являются параметры ухудшения качества сигнала при квантовании (QDU, Quantization Distortion Units). Один QDU соответствует ухудшению качества при оцифровке с использованием стандартной процедуры ИКМ; значения QDU для основных методов компрессии приведены в табл. 2. Дополнительная обработка речи ведет к дальнейшей потере качества. Согласно рекомендациям МСЭ-Т, для международных вызовов величина QDU не должна превышать 14. Отметим, что передача разговора по международным магистральным каналам ухудшает качество речи, как правило, на 4 QDU.

Таблица 2. Ухудшение качества речи при использовании различных алгоритмов компрессии

Методы компрессии QDU
ADPCM 32 Кбит/с 3,5
ADPCM 24 Кбит/с 7
LD-CELP 16 Кбит/с 3,5
CS-CELP 8 Кбит/с 3,5

Следовательно, при передаче разговора по национальным сетям должно теряться не более 5 QDU. Поэтому для качественной передачи речи процедуру компрессии/декомпрессии желательно применять в сети только один раз. В некоторых странах это является обязательным требованием регулирующих органов, предъявляемым к сетям, подключенным к сетям общего пользования.

Подавление пауз - важная функция оборудования, обеспечивающего передачу голоса по IP-сетям. Суть технологии подавления пауз заключается в определении различия между моментами активной речи и молчания в период соединения. В результате применения этой технологии генерация пакетов происходит только в моменты активного разговора. Поскольку при типичном разговоре по телефону паузы составляют до 60% времени, возможна двукратная оптимизация количества передаваемых по линии данных. Объединение технологии сжатия речи и подавления пауз речи в коммутаторах приводит к уменьшению потока данных в канале в восемь раз.

Продолжение следует

КомпьютерПресс 5"1999