H323 протокол используется. Основы IP-телефонии, базовые принципы, термины и протоколы

08.04.2019

Характеристика стека протоколов H.323

Стек протоколов стандарта Н.323 разработан международным телекоммуникационным союзом ITU для передачи мультисервисного трафика через пакетные сети. Широко используется при передаче голоса через IP-сети (VoIP).

Рекомендации набора Н.323 определяют основные требования к оборудованию и программному обеспечению для обмена аудио-, видеоинформации, цифровых данных в IP-сетях и обеспечивает совместимость продуктов разных производителей. Разработан набор для поддержки медиа технологий в сетях с негарантированным качеством обслуживания. В соответствии с рекомендациями Н.323 устанавливаются следующие четыре компоненты:

· терминал,

· шлюз GW (Gateway),

· устройство управления доступом GK (Gatekeeper),

· блок управления многоточечными конференциями MCU (Multipoint Conference Unit) (рис. 7.1).

Рисунок 7.1

Терминалом называют любое оконченное сетевое устройство, обеспечивающее возможность двухсторонней связи в реальном масштабе времени.

Устройство управления доступом GK (Gatekeeper) обеспечивает трансляцию имен терминалов в ІР-адреса. Совокупность всех терминалов, шлюзов и блока управления многоточечными конференциями, управляемых с помощью одного GK, называется зоной. Зона независима от топологии сети и может быть составлена из множества сегментов, соединенных с помощью маршрутизаторов. Шлюз обеспечивает функции преобразования информации между ІР-сетями и телефонными станциями общего пользования ТфОП (PSTN). Блок управления многоточечными конференциями MCU обеспечивает возможность общения трех и более терминалов и шлюзов.

Коммуникационный поток в Н323 состоит из видео, аудиосигналов, цифровых данных и сигналов управления. Аудиосигналы – преобразованная в цифровую форму и сжатая по определенному алгоритму речь. Видеосигналы содержат цифровое представление видеоизображений.

Сигналы управления включают: сигнализацию установления соединения, сигнализацию возможностей обмена данными, сигнализацию вызова команд и индикацию их выполнения, сигнализацию открытия и описания логического канала. Стек Н323 включает следующие виды протоколов (рис. 7.2):

Рисунок 7.2

В стеке H323 используется система трех стандартов H225, H235, H245. Стандарт H225 формирует поток данных сетевого уровня и отвечает за упаковку и сортировку данных. Стандарт H235 обеспечивает аутентификацию данных. Стандарт H245 управляет соединениями, по которым будут передаваться аудио и видео данные.

Протоколы (Т122-Т127) входят в семейство Т120. Семейство Т120 представляет собой набор телекоммуникационных и прикладных протоколов для организации и проведения многоточечных конференций в реальном времени. Главная особенность Т120 заключается в организации и поддержании конференций на любой платформе, управлении множеством участников и программ, безошибочном и безопасном обмене данными при всем многообразии возможных сетевых сценариев.

Архитектура Т120 – это двухуровневая архитектура. Протоколы Т122 - Т125 описывают независимый от приложений механизм для организации многоточечной связи, а протоколы верхнего уровня Т126 и Т127 являются прикладными.

Стек Н323 использует как «надежные» (с подтверждением) TCP, так и «ненадежные» UDP. По протоколу ТСР передается управляющая информация (сигналы управления Н245 и сигнализации Q931), по UDP – аудио и видеоданные.

«Надежный» канал на основе протокола ТСР гарантирует доставку сообщений и сборку пакетов на приемной стороне в исходной последовательности, восстановление ошибок, но обладает низкой пропускной способностью и вносит значительные задержки в передачу информации.

Транспортный протокол реального времени RTP (Real-Time Transport Protocol) гарантирует доставку данных одному или более адресатам с задержкой в заданных пределах. В типичной среде реального времени отправитель генерирует пакеты с постоянной скоростью. Они отправляются им через сеть и принимаются получателем. Однако ввиду вариации задержки при передаче по сети пакеты прибывают через нерегулярные интервалы. Для компенсации этого явления пакеты буферизируются, а затем с постоянной скоростью выдаются получателю.

RTP поддерживает передачу данных между несколькими участниками сеанса. Для этого каждый блок данных RTP содержит идентификатор отправителя, указывающий, кому принадлежат генерируемые данные. Каждый пакет RTP содержит основной заголовок, поле типа полезной нагрузки, в котором указывается наличие сжатия и кодирования, поле порядкового номера пакета.

Протокол RTP используется только для передачи пользовательских данных – всем участникам сеанса. Отдельный протокол управления реального времени RTCP (Real-Time Transport Control Protocol) работает с несколькими адресатами для обеспечения обратной связи с отправителем данных. RTCP использует транспортный протокол UDP, но с другим номером порта. Этот протокол является также многоадресным.

Частота передачи этих пакетов зависит от числа участников и снижается с увеличением количества участников. Цель такого решения состоит в том, чтобы трафик RTCP не превышает 5% общего времени трафика сеанса.

Работу набора протоколов Н323 обеспечивает также протокол резервирования ресурсов RSVP (Resource Reservation Protocol). Этот протокол должен поддерживать все компоненты Н323 (терминалы, шлюзы, MCU), а также коммутаторы и маршрутизаторы.

Министерство образования Российской Федерации

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ

ЭЛЕКТРОНИКИ И МАТЕМАТИКИ (ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)

Реферат по предмету

Управление сетями ЭВМ

«Интернет телефония. Протокол H.323»

Проверил Харламов А.Г.

Исполнитель Группа С-94

Мерчи А. Э.

Москва 2010

Введение

Всего за несколько лет технологии IP-телефонии значительно эволюционировали, и распространенные сегодня решения существенно отличаются от прежних. С одной стороны, это обусловлено развитием аппаратных решений, в частности появлением мощных магистральных и транзитных маршрутизаторов и высокоскоростных телекоммуникационных каналов. С другой стороны, нельзя не отметить и появления таких качественно новых технологий, как динамическая маршрутизация с учетом качества обслуживания в мультисервисных IP-сетях и резервирование ресурсов для контроля качества обслуживания транзитных маршрутизаторов.

Современное оборудование для передачи голоса посредством протокола IP (VoIP) позволяет обеспечивать приоритет передачи голосового трафика над передачей обычных данных, получать приемлемое качество звукового сигнала при сильном сжатии, эффективно подавлять различные шумы.

Сегодня телекоммуникационные операторы, специализирующиеся на предоставлении услуг IP-телефонии, применяют выделенные каналы с приоритетом голосового трафика над трафиком данных, что гарантирует высокое качество передачи речи. При этом используется сразу несколько вариантов маршрутизации голосового трафика для каждого из тысяч направлений, а в случае возникновения каких-либо проблем трафик автоматически перенаправляется на другие каналы.

По мере своего развития IP-телефония претерпевает важные качественные изменения: из дополнительной услуги она постепенно превращается в некий базовый сервис, который в скором времени может стать одним из компонентов мультисервисной технологии.

Важную роль играет протокол для передачи голосового трафика. Активно развиваются, во-первых, Н.323, берущий свое начало от традиционных телефонных протоколов, и, во-вторых, протоколы, созданные на базе IP-технологий, - такие как SIP, MGCP, MEGACO.

Российские операторы IP-телефонии наиболее часто используют протоколы группы Н.323. Это вызвано тем, что данный протокол был первым общепринятым стандартом промышленной реализации IP-телефонии. В настоящее время все большее внимание уделяется SIP. Протокол SIP в этой группе является самым простым видом протокола, более доступным для восприятия и понимания рядовым IT-специалистом. SIP особенно хорош в использовании во внутрикорпоративных сетях. При этом внешним протоколом в сети телекоммуникационного оператора для предприятия, как правило, все равно останется либо Н.323, либо MGCP/MEGACO.

Как было отмечено, IP-телефония становится одним из компонентов решения передачи разнородного мультимедийного трафика с использованием протокола TCP/IP. И вполне естественно, что развитие отдельных инструментов управления мультимедийным трафиком влияет на всю систему технологий пакетной передачи данных.

Следует также иметь в виду, что IP-телефония - это не просто альтернатива обычной телефонии. Актуальность развития решений IP-телефонии обусловлена не только возможностью снижения затрат на телефонные переговоры и техническое обслуживание инфраструктуры (хотя и это, безусловно, имеет значение). В стратегическом плане IP-телефония может стать единой технической платформой, которая позволит объединить решения для передачи данных и голоса, а также для обработки и последующего использования этой информации во всех бизнес-процессах. Таким образом, развитие IP-телефонии в определенном смысле является средством повышения производительности труда и развития бизнеса.


Протокол H .323

В 1990 г. был одобрен первый международный стандарт в области видео-конференц-связи - спецификация H.320 для поддержки видеоконференций по ISDN. Затем ITU-T одобрил еще целую серию рекомендаций, относящихся к видео-конференц-связи. Эта серия рекомендаций, часто называемая H.32x, помимо H.320, включает в себя стандарты H.321-H.324, которые предназначены для различных типов сетей. Во второй половине 90-х годов интенсивное развитие получили IP-сети и Интернет. Они превратились в экономичную среду передачи данных и стали практически повсеместными. Однако, в отличие от ISDN, IP-сети плохо приспособлены для передачи аудио- и видеоданных. Стремление использовать сложившуюся структуру IP-сетей привело к появлению в 1996 г. стандарта H.323, который содержит описания терминальных устройств, оборудования и сетевых служб, предназначенных для осуществления мультимедийной связи в сетях с коммутацией пакетов (например, Intranet или Интернет). Терминальные устройства и сетевое оборудование стандарта H.323 могут передавать данные, речь и видеоинформацию в масштабе реального времени. В рекомендации H.323 не определены: сетевой интерфейс, физическая среда передачи информации и транспортный протокол, используемый в сети. Сеть, через которую осуществляется связь между терминалами H.323, может представлять собой сегмент или множество сегментов со сложной топологией. Терминалы H.323 могут быть интегрированы в персональные компьютеры или реализованы как автономные устройства. Но поддержка речевого обмена - обязательная функция для любого устройства стандарта H.323.

· управление полосой пропускания;

· возможность взаимодействия сетей;

· платформенную независимость;

· поддержку многоточечных конференций;

· поддержку многоадресной передачи;

· стандарты для кодеков;

· поддержку групповой адресации.

Управление полосой пропускания

Передача аудио- и видеоинформации весьма интенсивно нагружает каналы связи, и, если не следить за ростом этой нагрузки, работоспособность критически важных сетевых сервисов может быть нарушена. Поэтому рекомендации H.323 предусматривают управление полосой пропускания. Можно ограничить как число одновременных соединений, так и суммарную полосу пропускания для всех приложений H.323. Эти ограничения помогают сохранить необходимые ресурсы для работы других сетевых приложений. Каждый терминал H.323 может управлять своей полосой пропускания в конкретной сессии конференции.

Межсетевые конференции
Платформенная независимость

H.323 "не привязан" к каким-либо технологическим решениям, связанным с оборудованием или программным обеспечением. Взаимодействующие между собой приложения могут создаваться на основе разных платформ, с разными операционными системами.

Поддержка многоточечных конференций

Рекомендации H.323 позволяют организовывать конференцию с тремя или более участниками. Многоточечные конференции могут проводиться как с использованием центрального контроллера - MCU (устройства многоточечной конференции), так и без него.

Поддержка многоадресной передачи

H.323 поддерживает многоадресную передачу в многоточечной конференции, если сеть поддерживает протокол управления групповой адресацией. При многоадресной передаче один пакет информации отправляется всем необходимым адресатам без лишнего дублирования. Многоадресная передача использует полосу пропускания гораздо более эффективно, поскольку всем адресатам - участникам списка рассылки отправляется ровно один поток.

Стандарты для кодеков

H.323 устанавливает стандарты для кодирования и декодирования аудио- и видеопотоков с целью обеспечения совместимости оборудования разных производителей. Вместе с тем стандарт достаточно гибок. Сформулированы требования, выполнение которых обязательно, и существуют опциональные возможности, в случае использования которых также необходимо строго следовать стандарту. Помимо этого, производитель может включать в мультимедийные продукты и приложения дополнительные возможности, если они не противоречат обязательным и опциональным требованиям стандарта.

Совместимость

Возможны случаи, когда участники конференции хотят общаться друг с другом, не заботясь о вопросах совместимости между собой. Рекомендации H.323 поддерживают выяснение общих возможностей оборудования конечных пользователей и устанавливают наилучшие из общих для участников конференции протоколов кодирования, вызова и управления.

И если H.323 можно сравнить с ванилью, то протокол Session Initialization Protocol (SIP) вполне уместно в таком случае считать клубникой. Он не лучше и не хуже, чем H.323; он просто другой.

Действительно, SIP - часть предложений IETF, призванных заменить H.323. В то время как H.323 является набором протоколов, SIP - лишь один из нескольких протоколов, взаимодействующих друг с другом с целью организации сеансов передачи голоса по IP-сетям.

SIP - это протокол прикладного уровня, предназначенный для установления, изменения и окончания сеансов с одним или несколькими участниками. Эти сеансы могут включать в себя мультимедиа-конференции, дистанционное обучение, телефонные звонки по Internet и распространение мультимедийного информационного наполнения. Для участия в сеансе SIP способен «пригласить» людей или «роботов», таких, например, как службы хранения мультимедиа-информации.

Данный протокол может применяться для инициации сеансов, для приглашения к участию в сеансах, «объявленных» с помощью иных средств, для организации голосовых конференций с использованием устройств, поддерживающих звонки с участием многих абонентов. SIP поддерживает службы отображения имен и перенаправления, позволяя реализовать такие услуги для абонентов интеллектуальной сети, как обеспечение мобильной связи.

Этот протокол не предоставляет возможностей управления конференциями и не указывает, каким именно образом должно осуществляться это управление. SIP не резервирует адреса для многоадресной рассылки и не захватывает ресурсы, но может передавать «приглашенной» системе необходимую для этого информацию.

Абоненты, как инициирующие звонок, так и принимающие его, идентифицируются с помощью адресов SIP. Звонящий сначала определяет местонахождение соответствующего сервера, затем передает запрос SIP. В идеальном случае запрос передается адресату, который возвращает код ответа SIP, равный 200. Как и в случае с другими кодами ответа TCP/IP, двойка в начале свидетельствует об отсутствии ошибки.

Затем инициатор звонка посылает подтверждение получателю, что несколько необычно, потому что станция, которая инициировала звонок, также посылает подтверждение.

SIP позволяет взаимодействовать в рамках многоадресной рассылки, в сети одноадресных связей или посредством сочетания много- и одноадресных связей.

Объекты, к которым обращаются посредством SIP, являются пользователями на хостах, которые идентифицируются с помощью URL-адресов SIP. Пользовательская часть - это имя пользователя или номер телефона. Хостовая часть - это имя домена или IP-адрес.

SIP использует разнообразные серверы, каждый из которых служит для определенной цели. Среди них имеются серверы с пользовательскими агентами, proxy-серверы, серверы перенаправления и регистраторы. Существует также сервер, занимающийся определением местонахождения абонента, причем этот сервер может быть объединен с сервером SIP.

Транзакция SIP состоит из запроса и соответствующего ответа. В парных запросах и ответах имеются несколько полей, содержащих идентичные значения. К таким полям относятся поле с идентификатором звонка, номер командной последовательности, поле получателя, поле отправителя и тег (если присутствует). Поля отправителя и получателя идентичны в обоих направлениях. Это необычно, но отнюдь не ново в отличие от метода, применяемого в High-Level Data Link Control. Это помогает решить возникающие проблемы при использовании анализатора протокола для поиска и устранения аномалий в сети.

Запрос на приглашение представляет собой обращение к абоненту с просьбой присоединиться к конференции или принять участие в двустороннем звонке. Такое приглашение включает в себя описание сеанса, где перечисляются типы носителей и форматы. Если вызываемый абонент дает свое согласие, звонящий посылает подтверждение и возвращает описание с указанием носителя, который он хочет использовать.

Если говорить очень упрощенно, IETF создала SIP и связанные с ним протоколы потому, что убеждена в недостаточной масштабируемости H.323. Пока же совершенно очевидно, что H.323 опережает SIP в этой гонке. Но каков будет финиш?

Как работает протокол SIP

Протокол Session Initialization Protocol (SIP) - это протокол обмена сигналами для создания, изменения и прекращения телефонных сессий, в том числе телефонных звонков по Internet и мультимедийных конференций. SIP - это только один из целого числа протоколов, которые служат для замены фрагментов протокола H.323

  1. От звонящего исходит приглашение на перенаправляющий сервер, который, в свою очередь, сообщает звонящему DNS предполагаемого абонента и предоставляет адреса сервера пользовательского агента (UAS)
  2. Звонящий формирует новое приглашение UAS
  3. UAS посылает «звонок» принимающей стороне и подтверждение вызывающего. После этого звонок считается установленным, даже если на него не поступило ответа
  4. Звонящий выдает подтверждение UAS


Добрый день, уважаемые хабражители. В данной статье я постараюсь рассмотреть основные принципы IP-телефонии, описать наиболее часто используемые протоколы, указать способы кодирования и декодирования голоса, разобрать некоторые характерные проблемы.

Под IP-телефонией подразумевается голосовая связь, которая осуществляется по сетям передачи данных, в частности по IP-сетям (IP - Internet Protocol). На сегодняшний день IP-телефония все больше вытесняет традиционные телефонные сети за счет легкости развертывания, низкой стоимости звонка, простоты конфигурирования, высокого качества связи и сравнительной безопасности соединения. В данном изложении будем придерживаться принципов эталонной модели OSI (Open Systems Interconnection basic reference model) и рассказывать о предмете “снизу-вверх”, начиная с физического и канального уровней и заканчивая уровнями данных.

"
Модель OSI и инкапсуляция данных

Принципы IP-телефонии

При осуществлении звонка голосовой сигнал преобразуется в сжатый пакет данных (подробнее этот процесс будет рассмотрен в главах “Импульсно кодовая модуляция” и “Кодеки”). Далее происходит пересылка данных пакетов поверх сетей с коммутацией пакетов, в частности, IP сетей. При достижении пакетами получателя, они декодируются в оригинальные голосовые сигналы. Эти процессы возможны благодаря большому количеству вспомогательных протоколов, часть из которых будет рассмотрена далее.

В данном контексте, протокол передачи данных - некий язык, позволяющий двум абонентам понять друг друга и обеспечить качественную пересылку данных между двумя пунктами.

Отличие от традиционной телефонии

В традиционной телефонии установка соединения происходит при помощи телефонной станции и преследует исключительно цель разговора. Здесь голосовые сигналы передаются по телефонным линиям, через выделенное подключение. В случае же IP-телефонии, сжатые пакеты данных поступают в глобальную или локальную сеть с определенным адресом и передаются на основе данного адреса. При этом используется уже IP-адресация, со всеми присущими ей особенностями (такими как маршрутизация).

При этом IP-телефония оказывается более дешевым решением как для оператора, так и для абонента. Происходит это благодаря тому, что:

  • Традиционные телефонные сети обладают избыточной производительностью, в то время, как IP-телефония использует технологию сжатия голосовых пакетов и позволяет полностью использовать емкость телефонной линии.
  • Как правило, на сегодняшний момент доступ в глобальную сеть есть у всех желающих, что позволяет сократить затраты на подключение или совсем исключить их.
  • Звонки в локальной сети могут использовать внутренний сервер и происходить без участия внешней АТС.
Вместе с вышеперечисленным, IP-телефония позволяет улучшить качество связи. Достигается это, опять же, благодаря трем основным факторам:
  • Телефонные серверы постоянно совершенствуются и алгоритмы их работы становятся более устойчивыми к задержкам или другим проблемам IP-сетей.
  • В частных сетях их владельцы обладают полным контролем над ситуацией и могут изменять такие параметры, как ширина полосы пропускания, количество абонентов на одной линии, и, как следствие, величину задержки.
  • Сети с коммутацией пакетов развиваются, и ежегодно вводятся новые протоколы и технологии, позволяющие улучшить качество связи (например, протокол резервирования полосы пропускания RSVP).
Благодаря IP-телефонии очень элегантно решается проблема занятой линии, так как переадресация, либо перевод в режим ожидания могут быть осуществлены несколькими командами в конфигурационном файле на АТС.

Физический уровень (Physical Layer)

На физическом уровне осуществляется передача потока битов по физической среде через соответствующий интерфейс. IP-телефония практически полностью опирается на уже существующую инфраструктуру сетей. В качестве среды передачи информации используются, как правило витая пара категории 5 (UTP5), одномодовое или многомодовое оптическое волокно, либо коаксиальный кабель. Тем самым в полной мере реализуется принцип конвергенции телекоммуникационных сетей.

PoE

Интересно рассмотреть технологию PoE (Power Over Ethernet) - стандарты IEEE 802.3 af-2003 и IEEE 802.3at-2009. Ее суть заключается в возможности обеспечения питанием устройств посредством стандартной витой пары. Большинство современных IP-телефонов, в частности, модельный ряд Cisco Unified IP Phones 7900 Series, поставляются с поддержкой PoE. Согласно стандарту 2009 года, устройства могут получать ток мощностью до 25,5 Ватт.

При подаче питания используются лишь две витых пары кабеля 100BASE-TX, однако некоторые производители задействуют все четыре, достигая мощности до 51 Ватт. Необходимо заметить, что технология не требует модификации уже существующих кабельных систем, в том числе и кабелей Cat 5.

Для определения того, является ли подключаемое устройство питаемым (PD - powered device) на кабель подается напряжение 2,8 - 10 В. Тем самым вычисляется сопротивление подключаемого устройства. Если данное сопротивление находится в диапазоне 19 - 26,5 кОм, то процесс переходит на следующий этап. Если же нет - проверка повторяется с интервалом ≥2 мс.

Далее происходит поиск диапазона мощностей питаемого устройства путем подачи более высокого напряжения и измерения тока в линии. Вслед за этим на линию подается 48 В - питающее напряжение. Также осуществляется постоянный контроль перегрузок.

Канальный уровень (Data Link Layer)

Согласно спецификации IEEE 802 канальный уровень разделяется на два подуровня:
  1. MAC (Media Access Control) - обеспечивает взаимодействие с физическим уровнем;
  2. LLC (Logical Link Control) - обслуживает сетевой уровень.
На канальном уровне работают коммутаторы - устройства, обеспечивающие соединение нескольких узлов компьютерной сети и распределение фреймов между хостами на основе физической (MAC) адресации.

Необходимо упомянуть механизм виртуальных локальных сетей (Virtual Local Area Network). Данная технология позволяет создавать логическую топологию сети без оглядки на ее физические свойства. Достигается это тегированием трафика, что подробно описано в стандарте IEEE 802.1Q.


Формат фрейма

В контексте IP-телефонии отметим Voice VLAN, широко применяющуюся для изоляции голосового трафика, генерируемого IP-телефонами, от других данных. Ее использование целесообразно по двум причинам:

  1. Безопасность. Создание отдельной голосовой VLAN уменьшает вероятность перехвата и анализа голосовых пакетов.
  2. Повышение качества передачи. Механизм VLAN позволяет задать повышенный приоритет голосовым пакетам, и, как следствие, улучшить качество связи.

Сетевой уровень (Network Layer)

На сетевом уровне происходит маршрутизация, соответственно основными устройствами сетевого уровня являются маршрутизаторы (Router). Именно здесь определяется, каким путем данные достигнут получателя с определенным IP-адресом.

Основной маршрутизируемый протокол - IP (Internet Protocol), на основе которого и построена IP-телефония, а также всемирная сеть Интернет. Также существует множество динамических протоколов маршрутизации, самый популярный среди которых OSPF (Open Shortest Path First) - внутренний протокол, основанный на текущем состоянии каналов связи;

На сегодняшний момент существуют специальные VoIP-шлюзы (Voice Over IP Gateway), обеспечивающие подключение обычных аналоговых телефонов к IP-сети. Как правило, они имеют и встроенный маршрутизатор, позволяющий вести учет трафика, авторизовать пользователей, автоматически раздавать IP-адреса, управлять полосой пропускания.

Среди стандартных функций VoIP-шлюзов:

  • Функции безопасности (создание списков доступа, авторизация);
  • Поддержка факсимильной связи;
  • Поддержка голосовой почты;
  • Поддержка протоколов H.323, SIP (Session Initiation Protocol).
Для борьбы с возможными задержками передачи IP необходимо дополнять дополнительными средствами, например протоколами установления очередности (чтобы голосовые данные не конкурировали с обычными).
Как правило, в этих целях на маршрутизаторах используется очередность с малой задержкой (LLQ - Low-Latency queuing), либо взвешенная организация очередей на основе классов (CBWFQ - Class-Based Weighted Fair Queuing).
Кроме того, необходимы схемы маркировки с заданием приоритетов для рассмотрения голосовых данных, как наиболее важных для передачи.

Транспортный уровень (Transport Layer)

Для транспортного уровня характерны:
  • Сегментация данных приложений верхнего уровня;
  • Обеспечение сквозного соединения;
  • Гарантия надежности данных.
Основные протоколы транспортного уровня - TCP (Transmission Control Protocol), UDP (User Datagram Protocol), RTP (Real-time Transport Protocol). Непосредственно в IP-телефонии используются протоколы UDP и RTP, причем основное их отличие от TCP заключается в том, что они не обеспечивают надежность доставки данных. Это является более приемлемым вариантом, нежели осуществление контроля за доставкой (TCP), так как телефонная связь чрезвычайно зависима от задержек передачи, но менее чувствительна к потерям пакетов.

UDP

UDP базируется на сетевом протоколе IP и предоставляет транспортные услуги прикладным процессам. Его главное отличие от TCP - обеспечение негарантированной доставки, то есть при отправке и получении данных никаких подтверждений не запрашивается. Также при отправке информации не обязательно установление логического соединения между модулями UDP (источник и приемник).

RTP

Несмотря на то, что RTP принято считать протоколом транспортного уровня, как правило он работает поверх UDP. С помощью RTP реализуется распознавание типа трафика, работа с метками времени, контроль передачи и нумерация последовательности пакетов.

Основное назначение RTP состоит в том, что он присваивает каждому исходящему пакету временные метки, обрабатывающиеся на приемной стороне. Это позволяет принимать данные в надлежащем порядке, снижает влияние неравномерности времени прохождения пакетов по сети, восстанавливает синхронизацию между аудио и видео данными.

Уровни данных (Data Layers)

Три последних уровня модели OSI рассмотрим совместно. Такое объединение допустимо, так как процессы, происходящие на данных уровнях тесно связаны между собой, и описывать их безотносительно разделения на подуровни будет логичнее.

H.323

Первым делом необходимо описать стек протоколов H.323, разработанный в 1996 году. Данный стандарт содержит описание оборудования, сетевых служб и терминальных устройств, предназначенных для осуществления аудио- и видеосвязи в сетях с коммутацией пакетов (Интернет). Для любого устройства стандарта H.323 обязательна поддержка обмена голосовой информацией.
  • Платформенную независимость.
  • Стандарты кодирования аналоговых данных.
  • Управление полосой пропускания.
  • Гибкость и совместимость.
Отметим очень важный факт: в рекомендациях не определены физическая среда передачи, транспортный протокол и сетевой интерфейс. Это значит, что устройства, поддерживающие стандарт H.323 могут работать в любых существующих сегодня сетях с коммутацией пакетов.

Согласно H.323 четырьмя основными компонентами VoIP-соединения являются:

  • терминал;
  • шлюз;
  • контроллер зоны;
  • контроллер управления многоточечной конференции (MCU - Multipoint Control Unit).


Пример структурной схемы сети в IP-телефонии 

Выдержка из документа, описывающего стек протоколов H.323

1. Управление соединением и сигнализация:
1.а. H.225.0: протоколы сигнализации и пакетирования мультимедийного потока (использует подмножество протокола сигнализации Q.931).
1.б. H.225.0/RAS: процедуры регистрации, допуска и состояния.
1.в. H.245: протокол управления для мультимедиа.
2. Обработка звуковых сигналов:
2.а. G.711: импульсно-кодовая модуляция тональных частот.
2.б. G.722: кодирование звукового сигнала 7 кГц в 64 кбит/с.
2.в. G.723.1: речевые кодеры на две скорости передачи для организации мультимедийной связи со скоростью передачи 5.3 и 6.3 кбит/с.
2.г. G.728: кодирование речевых сигналов 16 кбит/с с помощью линейного предсказания с кодированием сигнала возбуждения с малой задержкой.
2.д. G.729: кодирование речевых сигналов 8 кбит/с с помощью линейного предсказания с алгебраическим кодированием сигнала возбуждения сопряженной структуры.
3. Обработка видеосигналов:
3.а. H.261: видеокодеки для аудиовизуальных услуг со скоростью 64 кбит/с.
3.б. H.263: кодирование видеосигнала для передачи с малой скоростью.
4. Конференц-связь для передачи данных:
4.а. T.120: стек протоколов (включает T.123, T.124, T.125) для передачи данных между оконечными пунктами.
5. Мультимедийная передача:
5.а. RTP: транспортный протокол реального времени.
5.б. RTCP: протокол управления передачей в реальном времени.
6. Обеспечение безопасности:
6.а. H.235: обеспечение безопасности и шифрование для мультимедийных терминалов сети H.323.
7. Дополнительные услуги:
7.а. H.450.1: обобщенные функции для управления дополнительными услугами в H.323.
7.б. H.450.2: перевод соединения на телефонный номер третьего абонента.
7.в. H.450.3: переадресация вызова.
7.г. H.450.4: удержание вызова.
7.д. H.450.5: парковка вызова (park) и ответ на вызов (pick up).
7.е. H.450.6: уведомление о поступившем вызове в состоянии разговора.
7.ж. H.450.7: индикация ожидающего сообщения.
7.з. H.450.8: служба идентификации имен.
7.и. H.450.9: служба завершения соединения для сетей H.323.


Сценарий установки соединения на основе протокола H.323

SIP (Session Initiation Protocol)

SIP - протокол сигнализации, предназначенный для организации, изменения и завершения сеансов связи. SIP независим от транспортных технологий, однако при установлении соединения предпочтительно использовать UDP. Для передачи самой голосовой и видеоинформации рекомендовано применять RTP, но возможность использования других протоколов не исключена.

В SIP определены два типа сигнальных сообщений - запрос и ответ. Также существует шесть процедур:

  • INVITE (приглашение) - приглашает пользователя принять участие в сеансе связи (служит для установления нового соединения; может содержать параметры для согласования);
  • BYE (разъединение) - завершает соединение между двумя пользователями;
  • OPTIONS (опции) - используется для передачи информации о поддерживаемых характеристиках (эта передача может осуществляться напрямую между двумя агентами пользователей или через сервер SIP);
  • АСК (подтверждение) - используется для подтверждения получения сообщения или для положительного ответа на команду INVITE ;
  • CANCEL (отмена) - прекращает поиск пользователя;
  • REGISTER (регистрация) - передает информацию о местоположении пользователя на сервер SIP, который может транслировать ее на сервер адресов (Location Server).

Сценарий сеанса связи SIP

Кодеки

Аудиокодеком называют программу или алгоритм, который сжимает, либо разжимает цифровые звуковые данные, позволяя снизить требования к пропускной способности канала передачи данных. В IP-телефонии на сегодняшний день наиболее распространено преобразование посредством кодека G.729, а также сжатие G.711 по А-закону (alaw) и μ-закону (ulaw).
G.729
G.729 является кодеком, который сжимает исходный сигнал с потерей данных. Основная идея, заложенная в G.729 - передача не самого оцифрованного сигнала, а его параметров (спектральной характеристики, количества переходов через ноль), достаточных для последующего синтезирования на принимающей стороне. При этом все основные характеристики голоса, такие как амплитуда и тембр сохраняются.

Пропускная способность канала, на которую рассчитан данный кодек - 8 кбит/с. Длина кадра обрабатываемого G.729 - 10 мс, частота дискретизации - 8 кГц. Для каждого из таких кадров определяются параметры математической модели, которые в дальнейшем и передаются в канал в виде кодов.

При использовании кодирования G.729 задержка составляет 15 мс, из которых 5 мс тратится на заполнение предварительного буфера. Отметим также, что кодек G.729 предъявляет достаточно высокие требования к ресурсам процессора.

G.711
G.711 - голосовой кодек, который не предполагает никакого сжатия, помимо компандирования - метода уменьшения эффектов каналов с ограниченным динамическим диапазоном. В основе данного метода лежит принцип уменьшения количества уровней квантования сигнала в области высокой громкости, сохраняя при этом качество звука. Две широко использующиеся в телефонии схемы компандирования - alaw и ulaw.

Сигнал в данном кодеке предоставлен потоком величиной 64 кбит/с. Частота дискретизации - 8000 кадров по 8 бит в секунду. Качество голоса субъективно лучше, нежели при применении кодека G.729.

alaw
alaw или А-закон - алгоритм сжатия звуковых данных с потерей информации. В основном используется на территории Европы и России.

Для сигнала x преобразование по алгоритму alaw выглядит следующим образом:

Где А - параметр сжатия (обычно принимается равным 87,7).

ulaw
ulaw или μ-закон - алгоритм сжатия звуковых данных с потерей информации. В основном используется на территории Японии и Северной Америки.

Для сигнала x преобразование по алгоритму ulaw выглядит следующим образом:

где μ принимается равным 255 (8 бит) в стандартах Северной Америки и Японии.

Импульсно кодовая модуляция (PCM - Pulse Code Modulation)

Импульсно кодовая модуляция - передача непрерывной функции в виде серии последовательных импульсов.

Для получения на входе канала связи модулированного сигнала, мгновенное значение несущего сигнала измеряется АЦП с определенным периодом. При этом количество оцифрованных значений в секунду (иначе, частота дискретизации) должно быть большим или равным двукратной максимальной частоте в спектре аналогового сигнала.

Далее полученные значения округляются до одного из заранее принятых уровней. Заметим, что количество уровней необходимо принимать кратным степени двойки. В зависимости от того, сколько было определено уровней, сигнал кодируется определенным количеством бит.


Квантование сигнала

На данном рисунке представлено кодирование с помощью четырех битов (то есть все промежуточные значения аналогового сигнала будут округляться до одного из заранее заданных 16 уровней). Для примера, при времени равном нулю сигнал будет представлен подобным образом: 0111.

При демодуляции последовательность нулей и единиц преобразуется в импульсы демодулятором, уровень квантования которого равен уровню квантования модулятора. После этого ЦАП на основе данных импульсов восстанавливает сигнал, а сглаживающий фильтр окончательно убирает неточности.

В современной телефонии число уровней квантования должно быть большим или равным 100, то есть минимальное количество бит, которым может кодироваться сигнал - 7.

Вопросы качества обслуживания в IP-телефонии (Quality of Service - QoS)

В сетях на основе стека TCP/IP высокое качество обслуживания трафика, чувствительного к задержкам передачи не обеспечивается по умолчанию. При использовании протокола TCP имеется гарантия достоверной доставки информации, но ее перенос может осуществляться с непредсказуемыми задержками. Для UDP характерна минимизация задержек, но гарантия верной доставки пакета отсутствует.

В то же время добротность речевого трафика сильно зависит от качества передачи, и в сети, где не реализованы механизмы, гарантирующие соответственное качество, реализация IP-телефонии может быть не удовлетворяющей требованиям пользователей.

Основными показателями качества обслуживания являются пропускная способность сети и задержка передачи. Задержка при этом определяется как промежуток времени, прошедший с момента отправки пакета, до момента его приема.

Также существуют такие характеристики, как готовность сети и ее надежность (оцениваются по результатам контроля уровня обслуживания в течение длительного времени, либо по коэффициенту использования).

Для улучшения качества связи используются следующие механизмы:

  1. Перемаршрутизация. При перегрузке одного из каналов связи позволяет осуществить доставку при помощи резервных маршрутов.
  2. Резервирование ресурсов канала связи на время соединения.
  3. Приоретизация трафика. Дает возможность помечать пакеты в соответствии с уровнем их важности и производить обслуживание на основе меток.
Как было сказано ранее, голосовой трафик чрезвычайно чувствителен к задержкам передачи. Максимальное время задержки не должно превышать 400 мс (сюда включается и продолжительность обработки информации на конечных станциях). Различают два основных типа задержек:

Задержка при кодировании информации в голосовых шлюзах или терминальном оборудовании. Уменьшается путем улучшения алгоритмов обработки и преобразования голоса.
- Задержка, вносимая сетью передачи. Уменьшается путем улучшения сетевой инфраструктуры, в частности, сокращением количества маршрутизаторов и использованием высокоскоростных каналов.


Источники задержки в IP-телефонии

Джиттер

Еще одно явление, характерное для IP-телефонии - джиттер, или, иначе, случайная задержка распространения пакета.

Обуславливается джиттер тремя факторами:

  • Ограниченная полоса пропускания или некорректная работа активных сетевых устройств;
  • Высокая задержка распространения сигнала;
  • Тепловой шум.
Наиболее часто применяющийся метод борьбы с джиттером - джиттер-буфер, хранящий определенное количество пакетов.

Обычно предусматривается динамическая подстройка длины буфера в течение всего времени существования соединения. Для выбора наилучшей длины используются эвристические алгоритмы.

Джиттер буфер
Для компенсации неравномерной скорости поступления пакетов на приемной стороне создают временное хранилище пакетов, или так называемый джиттер буфер. Его задача, собрать поступающие пакеты в правильном порядке в соответствии с временными метками и выдать их кодеку с правильными интервалами и правильном порядке.

Джиттер буфер

Размер буфера приемное VOIP устройство рассчитывает в процессе работы, либо принудительно задается в настройках. С одной стороны он не может быть слишком большим, чтобы не увеличивать транспортную задержку. С другой стороны, маленький размер буфера вызывает потери пакетов при изменениях времени задержки в IP сети.

Отсюда и происходит одно из главных противоречий, между интернет провайдерами и пользователями IP телефонии. С точки зрения провайдера все пакеты доставлены абоненту, то есть, потерь нет. А с точки зрения VoIP устройства, разница во времени между приходом пакетов значительно превышает джиттер буфер. Поэтому фактически потери есть. На практике потеря более 1% вызывает определенные неприятные ощущения. При 2% разговор оказывается затруднен. При значениях больше 4% разговор уже практически невозможен.

Размер джиттер буфера
Случайная задержка распространения Ji для i-го пакета может определяться по формуле:

где:
Di – отклонение от ожидаемого времени прибытия i-го пакета.
Отклонение от ожидаемого времени прибытия i-го пакета Di определяется по формуле:

где:
R – время прибытия пакета в метках времени RTP,
S – временная метка RTP, взятая из пакета.

Приведем пример расчета ожидаемого размера случайной задержки распространения 5-го пакета, на основе двух предыдущих.

Пусть J4=10 мс; R4=10, R3=11, S4=6, S3=5, тогда D5 будет равно (10-11)-(6-5)=-2.

В среднем, случайная задержка времени распространения для одного пакета в текущем примере составит 10 мс (точнее можно посчитать по формуле, приведенной выше). Тогда для того, чтобы ни один пакет не был отброшен, размер джиттер буфера должен быть равным 10 мс.

Для определения требуемого размера джиттер буфера в мегабайтах, домножим полученное значение на 100 мбит/сек – среднюю пропускную способность сети: 10 10^-3 100 = 128 кб.

Размер джиттер-буфера должен быть больше, чем флуктуация транзитного времени в сети. Например, если для 10 пакетов время транзита колеблется от 5 до 10 мс, то буфер должен быть хотя бы 8 мс, чтобы ни один пакет не был потерян. Лучше, если буфер еще больше, например 12 мс, тогда сможет работать механизм перезапроса потерянных пакетов.

Решения для развертывания телефонной сети

Asterisk

Asterisk - программная АТС, способная коммутировать как VoIP вызовы, так и вызовы, осуществляемые между IP-телефонами и традиционной телефонной сетью общего пользования.

Поддерживаемые протоколы: IAX, SIP, H.323, Skinny, UNIStim.
Поддерживаемые кодеки: G.711 (ulaw и alaw), G.722, G.723, G.729, GSM, iLBC, LPC-10, Speex.

Asterisk - динамично развивающееся открытое программное обеспечение, которое может быть установлено без оглядки на лицензирование. Это делает данную программную АТС привлекательной для малого и среднего бизнеса. Количество абонентов в сети может достигать 2000 и ограничено только мощностью сервера.

Еще одно достоинство Asterisk - возможность гибкой настройки. Весь необходимый функционал либо уже реализован, либо может быть дописан самостоятельно без существенных временных и денежных затрат. Этому способствует принцип: одна задача - один программный модуль.

В сравнении с решениями от таких вендоров, как Cisco или Avaya, Asterisk привлекателен еще и стоимостью развертывания. Фактически все затраты сводятся только к покупке телефонных аппаратов и сервера, способного обеспечить требуемую нагрузку на сеть. Сама программа абсолютно бесплатна.

Cisco Unified Communication Manager (CallManager)

CallManager предназначен скорее для крупных сетей, включающих до 30000 абонентов. Данный программно-аппаратный комплекс обеспечивает надежность работы и позволяет конфигурировать множество параметров, таких как переадресация звонков или голосовое меню. Существует и “облегченная” express версия, предназначенная скорее для небольших офисов.

Из преимуществ Cisco CallManager следует отметить в первую очередь знаменитую техническую поддержку корпорации Cisco. При соответствующем уровне контракта на обслуживание, любая проблема, начиная с вопросов по настройке и заканчивая вышедшим из строя оборудованием, будет решена практически мгновенно. Поэтому Cisco CallManager подойдет компаниям, готовым платить немалые деньги, но и получать при этом высочайшее качество обслуживания.

Avaya IP Office


Система IP Office может стать неплохим выбором для среднего размера телефонной сети. Количество абонентов здесь ограничено не только мощностью сервера, но и количеством приобретенных лицензий. Лицензировать необходимо практически все - платы расширения, используемые приложения и т.д., что может доставить определенные неудобства.

Конфигурирование может осуществляться через ряд программ, но наиболее популярная и простая в обращении - Avaya IP Office Manager. Также возможно управление через консоль с помощью Avaya Terminal Emulator.

В целом, продукция корпорации Avaya не ограничивается одним IP Office. Avaya, в 2009 году слившаяся с еще одним известным производителем Nortel, является признанным лидером на рынке оборудования для IP-телефонии.