Главная | Обратная связь | Поможем написать вашу работу!

Аудиосистема компьютера. Оцифровка, компрессия звука

Цифровой звук – это способ представления электрического сигнала посредством дискретных численных значений его амплитуды.

Звуковая волна – это некая сложная функция, зависимость амплитуды звуковой волны от времени. Для описания такой зависимости есть один путь – сохранение её дискретных значений в отдельных точках.

Если преобразовать звук в электрический сигнал (например, с помощью микрофона), получится плавно изменяющееся с течением времени напряжение. Для компьютерной обработки такой аналоговый сигнал нужно каким-то образом преобразовать в последовательность двоичных чисел. Следует поступить таким образом: измерять напряжение через равные промежутки времени и записывать полученные значения в память компьютера. Они называются выборками. Этот процесс называется дискретизацией или сэмплингом, а устройство, выполняющее его – аналого-цифровым преобразователем (АЦП).

Для того чтобы воспроизвести закодированный таким образом звук, нужно выполнить обратное преобразование (для него служит цифро-аналоговый преобразователь – ЦАП), а затем сгладить получившийся ступенчатый сигнал.

Звуковая информация представляется в цифровом виде в двух принципиально разных формах – WAVE и MIDI. WAVE-форма используется для цифровых аудиодисков, а MIDI – в электронных музыкальных инструментах.

WAVE-форма цифрового звука характеризуется пятью параметрами:

· частотой дискретизации;

· разрядностью выборок;

· числом каналов или звуковых дорожек;

· алгоритмом компрессии/декомпрессии – кодеком;

· форматом хранения.

Количество выборок в секунду называется частотой дискретизации и измеряется в герцах и килогерцах (1 кГц=1000 выборок в сек.).

Оцифровка сигнала включает в себя два процесса – процесс дискретизации (осуществление выборки) и процесс квантования. Процесс дискретизации – это процесс получения значений величин преобразуемого сигнала в определенные промежутки времени. Квантование – процесс замены реальных значений сигнала приближенными с определенной точностью. Измеренная амплитуда (выборка) преобразуется в целое число с некоторой погрешностью, определяемой разрядностью этого числа. Погрешность при квантовании вносит шум тем больший, чем меньше разрядность. При 16-разрядной оцифровке слышимый диапазон равен 96 дБ и практически покрывает весь нормально слышимый диапазон. Кроме того, для получения качественного цифрового звука могут использоваться аналоговые и цифровые фильтры для подавления помех.

Таким образом, оцифровка – это фиксация амплитуды сигнала через определенные промежутки времени и регистрация полученных значений амплитуды в виде округленных цифровых значений (так как значения амплитуды являются величиной непрерывной, нет возможности конечным числом записать точное значение амплитуды сигнала, именно поэтому прибегают к округлению). Записанные значения амплитуды сигнала также называются отсчетами. Очевидно, что чем чаще делать замеры амплитуды (чем выше частота дискретизации) и чем меньше округлять полученные значения (чем больше уровней квантования), тем более точное представление сигнала в цифровой форме будет получено. Оцифрованный сигнал в виде набора последовательных значений амплитуды можно сохранить.

Если обозначить:

· W – объем памяти в байтах для хранения 1 секунды звука в WAVE-форме;

· w – скорость потока звуковых данных в WAVE-форме в бит/сек;

· H – частота дискретизации (число выборок в секунду);

· B – разрядность квантования (число разрядов на выборку);

· C – число каналов,

тогда очевидно, что w = H·B·C и, если B кратно 8, W = w/8.

Следовательно, скорость потока данных CD-качества (H=44100, B=16, C=2) составляет 1 411 200 бит/сек или 1378,125 Кбит/сек.

Нетрудно сосчитать, что на дискету 1,44 Мбайт можно уместить около 5 мин. речи с низким качеством. А 1 мин. стереомузыки с качеством CD занимает около 10 Мбайт (на CD вмещается до 74 мин.), так что есть повод задуматься о компрессии. Современные аудиокодеки производят компрессию аудиопотока. При этом снижается качество звука. Но, например, схема Dolby обеспечивает сжатие в два раза без потерь.

Наиболее известными являются следующие типы кодировки, используемые в мультимедиа под Windows:

· PCM (Pulse Code Modulation) – импульсно-кодовая модуляция (ИКМ) – сжатие может достигаться только за счет выбора меньших значений величин H, B и C (фактически, это несжатый звук); квантование происходит по равномерной шкале из 2B значений;

· DPCM (Differential PCM) – дифференциальная ИКМ; сжимает в несколько раз;

· RealAudio – метод, разработанный фирмой RealNetworks, сжимает в несколько десятков раз, но с невысоким качеством; используется в Интернете для проигрывания звуковых файлов в реальном времени.

Для цифровой телефонии используются, как правило, другие кодеки.

· MPEG (Motion Picture Experts Group) – стандарты группы экспертов в области кино. Для сжатия звуковой информации используются стандарты MP2 и MP3, применяется психоакустическая компрессия, при которой удаляются звуки, не воспринимаемые человеческим ухом; сжимает звуковую информацию в несколько десятков раз при довольно высоком качестве. С точки зрения степени сжатия/качество – это наиболее интересный вариант сжатия звуковых файлов. Подобные техники называются адаптивным кодированием и позволяют экономить на наименее значимых с точки зрения восприятия человеком деталях звучания. При кодировании пользователь указывает параметр, называемый «битрейт» в общем случае обозначает общую величину потока, количество передаваемой за единицу времени информации.

MIDI-форма звука была разработана для электронных музыкальных инструментов еще в 1982 г. и предназначалась для передачи цифровых сигналов – так называемых MIDI-последовательностей. По существу, MIDI-последовательность состоит из цифровых команд, посылаемых музыкальным инструментом. Они сообщают о произошедших событиях – нажатии или отпускании клавиши или педали, переключении регистра или инструмента и т. п. Устройство, которое по этим командам может воспроизвести звук, называется MIDI-синтезатором.

Аппаратные синтезаторы различаются по методу синтеза. В настоящее время используются методы FM- и WT-синтезы. FM-синтез (от англ. Frequency Modulation – частотная модуляция) основан на использовании нескольких генераторов сигнала (операторов), обычно синусоидального, со взаимной модуляцией. Тембр звука получается искусственный. WT-синтез (от англ. Wave Table – таблица волн) основан на воспроизведении сэмплов – заранее записанных в WAVE-форме образцов звучания реальных инструментов (обычно одной ноты), которые перед воспроизведением должным образом преобразуются. Этим достигается большая реалистичность звучания классических инструментов, но нужна память для хранения сэмплов. Кроме того, компьютер может по MIDI-последовательности синтезировать аналоговый аудиосигнал программой-синтезатором (но для его воспроизведения все равно нужна звуковая плата).

В современном компьютере звук воспроизводится и записывается с помощью звуковой карты, подключаемой либо встроенной в материнскую плату компьютера. Задача звуковой карты в компьютере – ввод и вывод аудио. Практически это означает, что звуковая карта является тем преобразователем, который переводит аналоговый звук в цифровой и обратно.

Типовая звуковая карта имеет в своем составе цифровой звуковой канал записи-воспроизведения, микшер, синтезатор и MIDI-порт. Цифровой аудиоканал, он же аудиокодек, обеспечивает возможность моно- и стереофонической записи и воспроизведения аудиофайлов с уровнем качества, начиная от уровня кассетного магнитофона и заканчивая уровнем аудио-СD и даже выше. Запись производится оцифровкой (аналогово-цифровым преобразованием) выборок мгновенного значения сигнала; современные карты позволяют принимать и цифровые аудиоданные.

Микшер с программным управлением обеспечивает регулировку входных и выходных сигналов, позволяя смешивать входные сигналы от нескольких источников (микрофона, CD, внешнего входа и синтезатора).

Существуют звуковые устройства для шин USB и FireWire – колонки, микрофоны и другие приемники и источники сигналов. Они передают аудиопоток в цифровом виде (изохронная передача) и к обычным звуковым картам непосредственно не подключаются. Доставка аудиоданных к ним и от них осуществляется программно через контроллер соответствующей шины, имеющийся на современных системных платах. При наличии достаточно мощного процессора такие устройства позволяют обходиться и без звуковой карты, реализуя все перечисленные функции программными средствами. Однако применение звуковой карты расширяет возможности аудиосистемы и снижает загрузку процессора.

Принципиальная схема звуковой карты:

⇐ Предыдущая 1 2 3 4 567 8 9 Следующая ⇒

Воспользуйтесь поиском по сайту: