Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Особенности представления звуковых сообщений в цифровой форме




Цифровые методы обработки и передачи звуковых сообщений

При реализации современных систем телекоммуникаций предпочтение отдают цифровым методам обработки и передачи сигналов. Цифровые системы по сравнению с аналоговыми имеют ряд существенных преимуществ при обработке, запоминании и передаче сигналов. Представление сообщений в цифровой форме обеспечивает высокую помехоустойчивость, возможность более полного использования пропускной способности каналов, стабильность параметров передачи и гибкость при построении телекоммуникационных сетей. Особое значение приобретает применение цифровых методов при передаче звуковых сообщений. В данном разделе рассмотрены методы кодирования источника звуковых сообщений. Устройство, осуществляющее преобразование первичного речевого сигнала в цифровую форму, называют речевым кодером.

Особенности представления звуковых сообщений в цифровой форме

Человеческий голос порождает первичный аналоговый сигнал, который занимает полосу частот примерно от 50 до 10000 Гц. Представление этого сигнала в цифровой форме осуществляется путем дискретизации во времени и квантования по уровням (рис. 2.1) и сопровождается неустранимой ошибкой, называемой шумом квантования. Шум квантования – один из факторов, определяющих верность передачи непрерывных сообщений по дискретному каналу (вторым фактором являются помехи в канале передачи, накладывающиеся на полезный сигнал и приводящие к ошибочному приему).

При квантовании возникает ошибка квантования ε(n), равная разнице между квантованным sq(n) и истинным значениями сигнала:

ε(n)= sq(n) - s(n), (2.1)

где n- порядковый номер отсчета (рис.1.1, г).

Искажения, вносимые квантователем, оценивают значением среднеквадратичной ошибки (СКО):

. (2.2)

Если значение квантуемого сигнала не выходит за пределы рабочего диапазона квантователя, то ошибка

, (2.3)

где Δ – шаг квантования (рис.1.1).

Как следует из выражения (2.3) для снижения ошибки (шума) квантования необходимо снижать шаг квантования и соответственно увеличивать число уровней квантования. Если полный размах непрерывного сигнала равен 2smax, то число уровней квантования

Lкв=2smax/Δ+1. (2.4)

Наиболее очевидный подход заключается в использовании квантователя с постоянным шагом квантования Δ. В этом случае для высококачественной передачи звуковых сообщений с малой ошибкой квантования, как показывает практика, требуется, чтобы Lкв 4000. При цифровом кодировании такого сигнала с помощью двоичных символов на каждый дискретный отсчет потребуется не менее n =12 разрядов, поскольку Lкв= 2 n.

Оценим скорость цифрового потока в телекоммуникационном канале при передаче звуковых сообщений.

Для передачи речи в аналоговой телефонии в 60-х годах 20 столетия была выбрана полоса частот 0,3-3,4 кГц. Решающими в выборе такой полосы были экономические соображения и нехватка телефонных каналов. Несмотря на определенное ухудшение восприятие ряда звуков (например, шипящих, существенная часть энергии которых сосредоточена в верхней части речевого спектра), такое ограничение незначительно повлияло на разборчивость речи.

При представлении речевых сигналов в цифровой форме верхнюю частоту в спектре дискретизируемого сигнала с выбирают равной 4 кГц. Согласно теореме Котельникова при Fmax =4 кГц, период дискретизации составляет Тд =1/(2 Fmax)=125 мкс. При этом частота дискретизации Fд=1/Тд =8000 Гц. Скорость цифрового потока соответственно равна

W = Fд n. (2.5)

При передаче речевых сообщений, использующей 12-разрядное кодирование отсчетов, скорость цифрового потока, поступающего на вход телекоммуникационного канала, составит 96 кбит/сек. Еще более высокие требования будут предъявляться к пропускной способности канала при передаче высококачественных звуковых сообщений, например, музыки. Известно, что для высококачественного воспроизведения музыки на компакт-дисках частота дискретизации составляет Fд =44,1 кГц при 16-разрядном кодировании отсчетов. Подставляя эти значения в (2.5), определим скорость цифрового потока, которая составит:

W =44100 отсчетов/сек · 16 бит/отсчет = 705,6 кбит/сек.

При использовании 2-х стереофонических каналов скорость цифрового потока превысит 1400 кбит/сек.

Необходимость эффективного использования телекоммуникационных каналов явилась причиной разработки специальных технических решений, позволяющих уменьшить скорость цифрового потока при передаче речевых сообщений. Процедуру преобразования речевых сигналов, при которой уменьшается скорость цифрового потока, назвали компрессией (сжатием). Практический эффект такого уменьшения скорости очевиден – появляется возможность обслужить большее количество абонентов на телекоммуникационном канале с заданной пропускной способностью или осуществлять передачу речевых сообщений по низкоскоростным каналам, по которым передача сигналов в некомпрессированном виде была бы невозможна.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...