Классификация методов и показатели качества компрессии сигналов при передаче звука
Речевые кодеры можно разделить на 3 основные группы: кодеры формы, вокодеры и гибридные кодеры. В кодерах формы обработке подвергается каждый отсчет дискретизированной последовательности. Кодеры данного типа обеспечивают сохранение и передачу формы исходного аналогового сигнала. При этом, как правило, достигается достаточно высокое качество восстановленного сигнала, поскольку основным источником искажений формы выходного сигнала является квантование. Однако скорость цифрового потока на выходе кодера формы остается все-таки достаточно высокой. Так при передаче речевых сообщений кодеры формы формируют цифровой поток со скоростью от 24 до 64 кбит/с. Работа вокодеров (от английских слов vОice – голос и coder – кодировщик) основана на моделировании речевых сигналов с учетом их характерных особенностей. Это позволяет снизить скорость передачи до 0.5 - 16 кбит/с. Однако до середины 80-х годов 20-го столетия качество сигналов при вокодерном кодировании было плохим, и это ограничивало их практическое использование. Современные вокодеры обеспечивают качество, ненамного уступающее принятому в телефонной сети общего пользования, и их широко применяют, в частности, в системах подвижной радиосвязи. В гибридных кодерах используется метод, объединяющий преимущества кодеров формы и вокодеров. Качество кодирования и восстановления речевых сигналов измеряется часто по пятибалльной шкале MOS (mean opinion score - средняя субъективная оценка). Поскольку человек как получатель информации является ключевым элементом любой телекоммуникационной системы, качество сигнала оценивается по его субъективному восприятию речи. Оценка по шкале MOS определяется путем обработки оценок, даваемых группами слушателей нескольким речевым сигналам, воспроизводимым различными громкоговорителями. Каждый слушатель выносит оценку каждого сигнала: 1 - плохо, 2 - слабо, 3 - разборчиво, 4 - хорошо, 5 - отлично. Затем результаты усредняются.
Соотношение качества и скорости для рассматриваемых методов приведено на рис.2.2. [2]. Кодеры формы 2.3.1. Нелинейное кодирование
Для уменьшения сравнительно большого количества уровней квантования, которое вытекает из соотношений, полученных в разделе 2.1 в предположении об использовании квантователя с равномерным шагом квантования, следует учесть особенности работы слухового аппарата человека. Человеческое ухо воспринимает звук нелинейно: наиболее заметными оказываются искажения при слабом уровне звука, в то время как при большом уровне звука чувствительность к искажениям звукового сигнала снижается. Принимая во внимание указанные особенности, можно уменьшить количество уровней квантования и, соответственно, скорость цифрового потока в телекоммуникационном канале, применив квантование с неравномерным шагом. Суть такого подхода состоит в изменении шага квантования пропорционально уровню входного сигнала. При этом малые уровни сигнала квантуются с меньшей ошибкой, чем большие. Закон изменения шага квантования определяют из условия, чтобы отношение сигнал-шум сохранялось постоянным при изменении уровня сигнала. Условно неравномерное квантование можно представить как последовательное соединение устройства компрессии входного сигнала и равномерного квантователя (рис. 2.3.). При приеме нелинейные искажения сигнала, вносимые компрессором, устраняют экспандером, нелинейным устройством с амплитудной характеристикой, обратной характеристике компрессора.
Для обозначения процессов КОМпрессии и эксПАНДИРОВАНИЯ для краткости пользуются одним термином – КОМПАНДИРОВАНИЕ, а совокупность 2-х устройств- компрессора и экспандера называют компандером.
При передаче речи используют два типа компандирования: по µ-закону и по A-закону. Первый метод используют в США и Японии. При µ-законе сигнал в компрессоре преобразуется следующим образом:
, (2.6) где x - сигнал на входе компрессора, xmax - его максимальное значение, µ - константа (обычно µ=255). A-закон используется в Европе. В этом случае компрессор преобразует сигнал следующим образом: (2.7) Наиболее часто используют значение параметра A=87.6. Применение рассмотренных методов компадирования позволяет в одном и том же заданном диапазоне изменения речевого сигнала вместо 12-разрядных двоичных чисел использовать восьмиразрядные двоичные числа. Таким образом, скорость цифрового потока при передаче речевого сигнала уменьшится с 96 до 64 кбит/сек. Указанный способ компрессии речи закреплен в международной рекомендации G.711. Учитывая, что сжатие и последующее восстановление к первоначальному виду непрерывных по величине отсчетов звуковых сигналов может сопровождается появлением погрешности из-за отклонений характеристик компрессора и экспандера от расчетных значений, вместо рассмотренного выше на практике обычно применяется другой способ нелинейного кодирования (рис.2.4). После равномерного квантования при числе уровней L=212 и предварительного кодирования производится цифровая компрессия, в результате чего длина кодовой комбинации уменьшается до n =8 разрядов. Результатом преобразования является двоичная последовательность со скоростью 64 кбит/с.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|