HD-Voice для сотовой связи — Харитон, Дмитрий, Владимир

HD-Voice для сотовой связи — Харитон, Дмитрий, Владимир

HD-Voice для сотовой связи — Харитон, Дмитрий, Владимир, Олег, Ирина, Слава!

Мы включили HD-Voice на сети «Билайн » в Москве. Ниже записи звука до и после, а также технические детали.

В основе режима HD-voice лежит технология AMR-WB (Adaptive Multi Rate Wadeband) – широкополосное адаптивное кодирование с переменной скоростью, также данный кодек известен как стандарт G.722.22. В теории человек может услышать звуки в диапазоне 20Гц – 20кГц, но на практике достаточно передавать звук в существенно более узком диапазоне. При кодировании речи в AMR-WB используется диапазон частот 50Гц-7кГЦ, этого абсолютно достаточно для полноценной передачи голоса. Для примера, в кодеке AMR используется диапазон 300-3кГц. Метод может использоваться в сетях 2G и 3G.

Проще говоря, теперь человеческий голос будет звучать естественнее. потому что перестанет «ужиматься» в довольно узкую полосу, необходимость которой была когда-то продиктована ограничениями инфраструктуры. Кроме того, при HD-кодировании, внешние шумы оказывают меньшее воздействие на разборчивость речи.

Как мы дошли до HD-Voice, и как это работает?

Речь человека занимает некоторую полосу звуковых частот, обычно её принимают равной 20Гц-20кГц. Передать весь спектр по беспроводным каналам связи без сжатия сложно, поэтому голос без урезания полосы передается только в проводных системах. Для целей сжатия речи используются голосовые кодеки или вокодеры. Их побочным действием является искажение передаваемого голоса за счет ограничения полосы частот голосового сообщения.

Самым первым голосовым кодеком, использовавшимся в мобильных сетях, был «Full Rate» — FR. Одновременно с FR, был введен и кодек «Half Rate», единственное предназначение которого – увеличение количества одновременно обслуживаемых абонентов, и, как понятно из его названия, он занимает в радиоканале половину полосы кодека FR. Однако качество голоса после перекодирования в FR, было не очень высоким, а для некоторых стран (к примеру, арабских, где скорость речи высокая и много высочастотных звуков), и вовсе неприемлемым. Поэтому кодек FR был переработан, и появился «Enhanced Full Rate», обеспечивающий существенно лучшее качество голоса, при меньшем создаваемом битрейте.

С ростом проникновения мобильных сетей, требования к качеству голосовых услуг стали расти, и проявилась проблема с ухудшением качества голоса, при низком уровне радиосигнала от базовой станции. Для решения этой задачи, был разработан новый кодек — «Adaptive Multi Rate», который использовал тот же диапазон частот для анализа и сжатия, но алгоритм был реализован таким образом, что битрейт кодека динамически менялся, в зависимости от качества принимаемого сигнала. Благодаря этому, появилась возможность при хороших радиоусловиях предоставить отличное качество голоса, а при плохих – сохранять разговор даже там, где кодеки FR/EFR не смогли бы работать вовсе.

Все сети 3G работают только с использованием кодека AMR или последующих его реализаций, например AMR-WB. Но поскольку в сети остается большое количество абонентов использующих телефоны поддерживающие только работу с кодеками EFR/HR, сеть 2G продолжает работать со всеми кодеками (FR/EFR/HR/AMR FR/AMR HR) сразу, обеспечивая голосовой связью любой телефон.

В настоящее время требования к качеству голоса в мобильных сетях продолжают расти, и настало время для использования технологии AMR-WB. Все кодеки, описанные выше, используют для сжатия диапазон частот до 200Гц-3.4кГц, в то время как AMR-WB для кодирования использует полосу голосового сообщения на уровне 50Гц-7кГц. т.е. AMR-WB позволяет передавать в два раза большую полосу частот, что и дает увеличение качества и насыщенности высокими и низкими частотами передаваемого голоса.

Некоторые характеристики кодеков приведены в таблице: