Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Кодирование звуковой информации





С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией.

Звук представляет собой непрерывный сигнал – распространяющуюся в воздухе, воде или другой среде волну с непрерывно меняющейся амплитудой и частотой.

Чем больше амплитуда звука, тем он громче для человека, чем больше частота сигнала, тем выше тон. Частота звуковой волны выражается числом колебаний в секунду и из меряется в герцах (Гц). Человеческое ухо способно воспринимать звуки в диапазоне от 20 Гц до 20 кГц. Для измерения громкости звука применяется специальная единица "децибел" (дБ) (табл. 5.1). Уменьшение или увеличение громкости звука на 10 дБ соответствует уменьшению или увеличению интенсивности звука в 10 раз.

Таблица 5.1.

Громкость звука

Звук Громкость в децибелах
Нижний предел чувствительности человеческого уха
Шорох листьев
Разговор
Гудок автомобиля
Реактивный двигатель
Болевой порог

В основе кодирования звука с использованием ПК лежит процесс преобразования колебаний воздуха в колебания электрического тока и последующая дискретизация аналогового электрического сигнала. Кодирование и воспроизведение звуковой информации осуществляется с помощью специальных программ (редактор звукозаписи). Процесс преобразования звуковых волн в двоичный код в памяти компьютера:

Процесс воспроизведения звуковой информации, сохраненной в памяти компьютера:

Аудиоадаптер (звуковая плата) – специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.

В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины.

Затем полученный код из регистра переписывается в оперативную память компьютера.



Качество компьютерного звука определяется характеристиками аудиоадаптера: частотой дискретизации и разрядностью.

В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

Таким образом, непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность “ступенек”. Каждой “ступеньке” присваивается значение уровня громкости звука, его код (1, 2, 3 и так далее). Уровни громкости звука можно рассматривать как набор возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание.

 

Рис. 1.2. Временная дискретизация звука

Таким образом, непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости.

Процесс разбиения сигнала на отдельные составляющие, взятые в определенные тактовые моменты времени t0, t1, t2, … , tn через четко определенные тактовые интервалы времени, называется дискретизацией.

Квантование – замена отдельных составляющих исходного дискретного значения сигнала ближайшим уровнем квантования:

A(t0) = 2; A9t1) = 5; A(t2) = 6; …

Кодирование – перевод значения уровня квантования в конкретный двоичный код, например:

2 – 0010; 5 – 0101; 6 – 0110 …

Качество воспроизведения закодированного звука зависит от частоты дискретизации и глубины кодирования звука.

Частота дискретизации – количества измерений уровня громкости звука в единицу времени. Частоту дискретизации принято измерять в кГц (килогерцах): 1 кГц – это 1000 измерений в секунду. Чем большее количество измерений производится за I секунду (чем больше частота дискретизации), тем точнее "лесенка" цифрового звукового сигнала повторяет кривую диалогового сигнала. Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду.

Глубина кодирования звука - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Вышеописанный процесс оцифровки звука выполняется аналогово-цифровыми преобразователями (АЦП).

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2I. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука, тогда количество уровней громкости звука равно:

N = 2I = 216 = 65 536

Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код.

Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим "моно"). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим "стерео").

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду й умножить на 2 (стереозвук):

16 бит 24 000 2 = 1 536 000 бит = 192 000 байт = 187,5 Кб

Обратное преобразование для воспроизведения звука, закодированного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП) (рис.

Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых можно выделить два основных направления: метод FM и метод Wave-Table.

Метод FM (Frequency Modulation) основан на том. что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых представляет собой правильную синусоиду и, следовательно, может быть описан кодом. При таких преобразованиях неизбежны потери информации, поэтому качество звукозаписи обычно получается не вполне удовлетворительным. В то же время данный метод кодирования обеспечивает весьма компактный код, и поэтому он нашел применение еще в те годы, когда ресурсы средств вычислительной техники были явно недостаточны.

Таблично-волновогй метод (Wave-Table) основан на том. что в заранее подготовленных таблицах хранятся образцы звуков для множества различных музыкальных инструментов. Такие образцы называются сэмплами. Числовые коды выражают высоту тона, продолжительность и интенсивность звука, динамику его изменения, некоторые параметры среды. В которой происходит звучание и прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.

Звуковые файлы имеют несколько форматов. Наиболее популярны из них .MIDI, .WAV, .MP3.

Формат .MIDI изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области компьютерных модулей синтеза.

Формат аудиофайла .WAV представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение .WAV.

Формат .MP3 – один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.





Рекомендуемые страницы:

Воспользуйтесь поиском по сайту:



©2015- 2021 megalektsii.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.