Главная | Обратная связь
МегаЛекции

Импульсно-кодовая модуляция




Представление звука в компьютере. Форматы звуковых файлов.

Мир наполнен самыми разнообразными звуками: тиканье часов и гул моторов, завывание ветра и шелест листьев, пение птиц и голоса людей. О том, как рождаются звуки и что они собой представляют люди начали догадываться очень давно. Еще древнегреческий философ и ученый - энциклопедист Аристотель, исходя из наблюдений, объяснял природу звука, полагая, что звучащее тело создает попеременное сжатие и разрежение воздуха. Так, колеблющаяся струна то разряжает, то уплотняет воздух, а из-за упругости воздуха эти чередующиеся воздействия передаются дальше в пространство - от слоя к слою, возникают упругие волны. Достигая нашего уха, они воздействуют на барабанные перепонки и вызывают ощущение звука.

Звук –это волновые колебания в упругой среде (в воздухе, воде, металле и т.п.) Дляобозначения звука часто используется термин звуковая волна.

Основными параметрами любой волны и звуковой в частности, является частота и амплитуда колебаний. Частота звука измеряется в герцах (Гц, количество колебаний в секунду). На слух человек воспринимает упругие волны, имеющие частоту где-то в пределах от 16 Гц до 20 кГц.

Нас окружает много звуков, но к счастью, только крошечную их долю мы способны услышать.

Таблица звукового восприятия

Инфразвук может иметь длину волны больше десяти секунд. Им звучат большие станки, тяжёлый транспорт, тоннели и высотные здания. Возможно, именно эти инфразвуки так утомляют и расстраивают психику людей большого города, невольно находящихся под влиянием постоянного грохота транспортных тоннелей и тяжёлых роторов. В природе инфразвук встречается во время таких природных катаклизмов, как бури и землетрясения. Именно эти звуки слышат животные и сейсмологи, которые начинают паниковать задолго до их начала.

Длина волны ультразвука не превышает нескольких сантиметров. Человек с трудом воспринимает ультразвук, а вот животные и насекомые слышат его, а некоторые даже генерируют. Вообще ультразвука в природе достаточно много. Он и в перекатывании морской гальки и в шелесте ветра. Хотя мы его не можем слышать, наше тело его вполне воспринимает, поскольку ультразвук влияет на больные ткани, регенерирует их.

Гиперзвукс длиной волны от десятых миллиметра до сантиметра не распространяется в воздухе, а в основном в жидких и твёрдых сферах. Гиперзвук (или знакомое всем СВЧ – сверхвысокие частоты) может буквально поджарить.


Для измерения амплитуды звука обычно используется адаптированная для человека шкала децибелов.

Приведем некоторые значения уровней звука:

Порог слышимости 0 дБ
Шорох листьев, шум слабого ветра 10–20 дБ
Шепот (например, на задней парте) 20–30 дБ
Разговор средней громкости 50–60 дБ
Автомагистраль с интенсивным движением 80–90 дБ
Авиадвигатели 120–130 дБ
Болевой порог 140 дБ

 

Понятие звукозаписи

Люди давно научились записывать различные звуки и потом воспроизводить их. Сам процесс сохранения информации о параметрах звуковых волн называется звукозаписью. Сначала люди освоили аналоговые способы записи и хранения звуковой информации. При аналоговой записи на носителе размещается непрерывный «слепок» звуковой волны. Например, на музыкальные пластинки наносится непрерывная канавка, изгибы которой повторяют амплитуду и частоту звука, на магнитофонной ленте параметры звука сохраняются в виде намагниченности рабочей поверхности, намагниченность поверхности непрерывно изменяется, повторяя параметры звука.

С появлением компьютеров люди захотели хранить звук в компьютере и воспроизводить его с помощью ЭВМ. Однако аналоговая запись не подошла для такого хранения. В компьютере используется только цифровая форма записи звука. При цифровой записи звук необходимо подвергнуть подготовительным процедурам, а именно временной дискретизации и квантованию. Дискредитация выполняется для того, чтобы от бесконечного количества информации, которое содержит звук, перейти к конечному количеству информации.

При цифровой звукозаписи значения амплитуды звукового сигнала измеряются не непрерывно, а через равные небольшие промежутки времени (временная дискретизация) и записываются с некоторой точностью, то есть округляются до некоторого значения – уровня, на которые предварительно разбивается диапазон всех возможных значений (квантование). Из-за этих процедур цифровая запись, в отличие от аналоговой, несет двойное искажение. Во-первых, теряется информация о реальном значении амплитуд в моменты времени между замерами, а во-вторых, сами измеренные значения записываются с некоторой точностью.

В компьютер приходит не сам звук, а электрический сигнал, снимаемый с какого-либо устройства: микрофона, преобразующего звуковое давление в электрические колебания, магнитофона, радио, эхолота или любого другого устройства, вырабатывающего электрические сигналы. Электрические сигналы переводятся в цифровую запись способом импульсно-кодовой модуляции.

 

Импульсно-кодовая модуляция

Импульсно-кодовая модуляция (англ. Pulse Code Modulation, PCM) заключается в том, что звуковая информация хранится в виде значений амплитуды, взятых в определенные моменты времени ( измерения проводятся «импульсами»).

 

Процесс получения цифровой формы звука называют оцифровкой. Преобразование аналоговой информации, получаемой от различных источников, производится в специальных устройствах –аналого-цифровых преобразователях. Сигнал, полученный от микрофона или другого устройства, можно образно представить в виде графика кривой. Для преобразования кривая разбивается на несколько равных участков, и значение сигнала на границе каждого участка (в опорных точках) заносится в память компьютера.

При обратном преобразовании, которое реализуется в цифроаналоговом преобразователе (ЦАП), сигнал «восстанавливается» по тем значениям, которые зафиксированы в памяти компьютера. Качество восстановленного сигнала во многом зависит от способа разбиения. Чем чаще расположены опорные точки, тем меньше будет искажен восстановленный сигнал, но при этом выше затраты ресурсов памяти. Количество интервалов разбиения, размещенных на промежутке длительностью в одну секунду, характеризуется частотой дискретизации.

Второй причиной серьезного искажения сигнала может быть количество битов, отведенных для записи значения сигнала. Если для записи отведено только 4 бита, то можно записать только 16 уровней, для высококачественной записи необходимо использовать 1 байт (256 уровней) или 2 байта и выше. Этот параметр преобразования характеризуется разрядностью преобразования. Количество бит, которые используются для записи номеров подуровней, называется глубиной кодирования звука.

Импульсное кодирование по сути можно сравнить с растровым представлением изображения:

  • структура звука при таком способе кодирования не анализируется, так же как и структура изображения при растровом представлении;
  • время (в графических изображениях – пространство) изначально разбивается на небольшие области, и в пределах каждой области параметры звука (изображения) считаются постоянными.

 

Растровое представление изображений не требует хранения координат каждого пикселя. Аналогично при сохранении импульсного представления звука один раз сохраняются параметры оцифровки (глубина кодирования, частота дискретизации и длительность звукового фрагмента), а затем требуется сохранять только номера подуровней единым потоком.

Очевидно, что если увеличивать частоту дискретизации и глубину кодирования, то впоследствии можно будет более точно восстановить форму звукового сигнала. Однако, при повышении таким образом качества записи ее объем будет увеличиваться. Поэтому возникает вопрос, какими должны быть частота дискретизации и глубина кодирования, чтобы получить оптимальное соотношение объема файла и качества воспроизводимого звука.

В 1928 году американский инженер и ученый Гарри Найквист высказал утверждение, что частота дискретизации должна в два или более раз превышать максимальную частоту измеряемого сигнала. В 1933 году советский ученый В. А. Котельников и независимо от него Клод Шеннон сформулировали и доказали теорему о том, при каких условиях и как по дискретным значениям можно восстановить форму непрерывного сигнала. Эта теорема носит название всех трех ученых, или нейтрально называется Теоремой об отсчетах. Результат применения этой теоремы – частота дискретизации должна быть как минимум вдвое выше частоты сигнала. Теорема доказана для сигналов с непрерывными частотными характеристиками и бесконечной длительностью. Поэтому для оцифровки реальных звуковых сигналов (конечных по времени) частоту дискретизации выбирают с небольшим запасом.

 

Формат MIDI

В 80-х годах прошлого века появились электронные музыкальные инструменты – синтезаторы, способные воспроизводить не только звуки многих существующих музыкальных инструментов, но и абсолютно новые звуки. Было разработано соглашение о системе команд универсального синтезатора, получившее название стандарта MIDI (от англ. Musical Instrument Digital Interface). Запись музыкального произведения в формате MIDI – последовательность закодированных сообщений синтезатору. Сообщение может быть командой (нажать или отпустить определенную клавишу, изменить высоту или тембр звучания), описанием параметров воспроизведения (например, силы давления на клавиатуру) или управляющим сообщением (включение полифонического режима).

MIDI-команды делают запись музыкальной информации более компактной, чем импульсное кодирование. Если сравнить способы представления графической и звуковой информации, то запись звука в виде MIDI-команд соответствует векторному представлению изображения.

Записанные звуковые файлы можно редактировать, то есть вырезать, копировать и вставлять фрагменты из других файлов. Кроме того, можно увеличивать или уменьшать громкость, применять различные звуковые эффекты (эхо, уменьшение или увеличение скорости воспроизведения, воспроизведение в обратном направлении и другое), а также накладывать файлы друг на друга (микшировать).

 





©2015- 2017 megalektsii.ru Права всех материалов защищены законодательством РФ.