Главная | Обратная связь | Поможем написать вашу работу!

Основы генерации компьютерного звука

Природа звука

Звук - волнообразные колебания твердых, жидких и газообразных тел воспринимаются органом слуха, ухом, в форме особого ощущения, звука. Звуковые волны распространяются от получившего удар и приведенного в дрожательное колебание тела во все стороны окружающей тела среды. Все тела по отношению к звуку делятся на проводящие и на неупругие (например - воск) и потому не проводящие звук. Обычным проводником звука является воздух. Звук распространяется со скоростью, различной для разных тел, в воздухе при 0° в 1 сек.332,5 м. Скорость распространения звука наблюдается при громе и молнии. Гром, несмотря на то, что возникает одновременно с разрядом электричества, молнией, слышен через некоторый промежуток времени, в зависимости от отдаленности места электрического разряда. Звук характеризуется высотой, силой и оттенком. Высота звука зависит от числа колебаний звучащего тела; сила звука - в данном месте есть количество звуковой энергии, проходящей в единицу времени через единицу площади, перпендикулярной к направлению распространения звука. Оттенок звука или тембр зависит от высших или гармонических тонов, сопровождающих во всяком звуке основной тон.

Энергетической характеристикой звуковых колебаний является интенсивность звука - энергия, переносимая звуковой волной через единицу поверхности, перпендикулярную направлению распространения волны, в единицу времени. Интенсивность звука зависит от амплитуды звукового давления, а также от свойств самой среды и от формы волны. Субъективной характеристикой звука, связанной с его интенсивностью, является громкость звука, зависящая от частоты. Наибольшей чувствительностью человеческое ухо обладает в области частот 1-5 кГц.

При распространении звуковой волны в заданном направлении происходит постепенное её затухание, т.е. уменьшение интенсивности и амплитуды. Знание законов затухания практически важно для определения предельной дальности распространения звукового сигнала. Затухание обусловливается рядом факторов, которые проявляются в той или иной степени в зависимости от характеристик самого звука и от свойств среды. Все эти факторы можно подразделить на две большие группы. В первую входят факторы, связанные с законами волнового распространения в среде. Так, при распространении в неограниченной среде звука от источника конечных размеров интенсивность его убывает обратно пропорционально квадрату расстояния. Неоднородность свойств среды вызывает рассеяние звуковой волны по различным направлениям, приводящее к ослаблению её в первоначальном направлении, например рассеяние звука на пузырьках в воде, на взволнованной поверхности моря, в турбулентной атмосфере, рассеяние высокочастотного ультразвука в поликристаллических металлах, на дислокациях в кристаллах. На распространение звука в атмосфере и в море влияет распределение температуры и давления, силы и скорости ветра. Эти факторы вызывают искривление звуковых лучей, т.е. рефракцию звука, которая объясняет, в частности, тот факт, что по ветру звук слышен дальше, чем против ветра. Распределение скорости звука с глубиной в океане объясняет наличие т. н. подводного звукового канала, в котором наблюдается сверхдальнее распространение звука, например звук взрыва распространяется в таком канале на расстояние более 5000 км.

Вторая группа факторов, определяющих затухание звука, связана с физическими процессами в веществе - необратимым переходом звуковой энергии в другие формы, т.е. с поглощением звука, обусловленным вязкостью и теплопроводностью среды, а также переходом звуковой энергии в энергию внутримолекулярных процессов. Поглощение звука. заметно возрастает с частотой.

Распространение звуковых волн характеризуется в первую очередь скоростью звука. В газообразных и жидких средах распространяются продольные волны (направление колебательного движения частиц совпадает с направлением распространения волны), скорость которых определяется сжимаемостью среды и её плотностью. Скорость звука в сухом воздухе при температуре 0°С составляет 330 м/сек, в пресной воде при 17°С - 1430 м/сек. В твёрдых телах, кроме продольных, могут распространяться поперечные волны, с направлением колебаний, перпендикулярным распространению волны, а также поверхностные волны. Для большинства металлов скорость продольных волн лежит в пределах от 4000 м/сек до 7000 м/сек, а поперечных - от 2000 м/сек до 3500 м/сек.

Источники звука

Источниками звука могут стать любые явления, вызывающие местное изменение давления или механическое напряжение. Широко распространены источники звука в виде колеблющихся твёрдых тел (например, диффузоры громкоговорителей и мембраны телефонов, струны и деки музыкальных инструментов; в ультразвуковом диапазоне частот - пластинки и стержни из пьезоэлектрических материалов или магнитострикционных материалов). Источниками звука могут служить и колебания ограниченных объёмов самой среды (например, в органных трубах, духовых музыкальных инструментах, свистках и т.п.). Сложной колебательной системой является голосовой аппарат человека и животных. Возбуждение колебаний источников звука может производиться ударом или щипком (колокола, струны); в них может поддерживаться режим автоколебаний за счёт, например, потока воздуха (духовые инструменты). Обширный класс источников звука - электроакустические преобразователи, в которых механические колебания создаются путём преобразования колебаний электрического тока той же частоты. В природе звук возбуждается при обтекании твёрдых тел потоком воздуха за счёт образования и отрыва вихрей, например при обдувании ветром проводов, труб, гребней морских волн. Звук низких и инфранизких - частот возникает при взрывах, обвалах. Многообразны источники акустических шумов, к которым относятся применяемые в технике машины и механизмы, газовые и водяные струи.

Приёмники звука - служат для восприятия звуковой энергии и преобразования её в другие формы. К приёмникам звука относится, в частности, слуховой аппарат человека и животных. В технике для приёма звука применяются главным образом электроакустические преобразователи: в воздухе - микрофоны, в воде - гидрофоны и в земной коре - геофоны.

Основы генерации компьютерного звука

Чистый звуковой тон представляет собой звуковую волну, подчиняющуюся синусоидальному закону:

у =am* sin (wt) = аm*sin (2пft),

где am - максимальная амплитуда синусоиды;

w - частота (w=2пf);

f - количество колебаний упругой среды в секунду (f=1\T);

Т-период;

t - время (параметрическая переменная).

Звук характеризуется частотой (f), обычно измеряемой в герцах, т.е. количеством колебаний в секунду, и амплитудой (у). Амплитуда звуковых колебаний определяет громкость звука.

Для монотонного звука (меандр.) характерно постоянство амплитуды во времени.

Затухающие звуковые колебания характеризуются уменьшением амплитуды с течением времени.

Человек воспринимает механические колебания частотой 20 Гц - 20 КГц (дети - до 30 КГц) как звуковые. Колебания с частотой менее 20 Гц называются инфразвуком, колебания с частотой более 20 КГц - ультразвуком. Для передачи разборчивой речи достаточен диапазон частот от 300 до 3000 Гц.

Если несколько чистых синусоидальных колебаний смешать, то вид колебания изменится - колебания станут несинусоидальными.

Особый случай, когда смешиваются не любые синусоидальные колебания, а строго определенные, частота которых отличается в два раза (гармоники).

Основная гармоника имеет частоту, и амплитуду а1; вторая гармоника - частоту f2 и амплитуду а2; третья гармоника соответственно f3 и a3.

Причем f1<f2<f3, а1>а2>а3,При бесконечном количестве таких гармоник образуется периодический сигнал, состоящий из прямоугольных импульсов.

На слух всякое отклонение от синусоиды приводит к изменению звучания. В IBM PC источником звуковых колебаний является динамик (PC Speaker), воспроизводящий частоты приблизительно от 2 до 8 КГц. Для генерации звука в PC Speaker используются прямоугольные импульсы.

Синусоидальные сигналы в ЭВМ можно получить только с помощью специальных устройств - аудиоплат.

Без таких устройств хорошего качества звучания добиться не удается. Для улучшения качества звучания необходимо к ЭВМ подключить внешнюю аппаратуру. При этом следует преобразовать дискретные сигналы ЭВМ в аналоговые сигналы аудиоаппаратуры. Такое преобразование можно выполнить с помощью схемы цифро-аналогового преобразования (ЦАП), например, реализованной на аналоговом сумматоре, подключаемом к параллельному интерфейсу Centronics (LPT1 или LPT2).

Поскольку ЭВМ работает с дискретными сигналами - импульсами, а звук представляет собой аналоговый (т.е. непрерывно изменяющийся) сигнал, для ввода звуковых сигналов необходимо их оцифровывать.

Способов оцифровки аналогового сигнала существует много. Рассмотрим три из них.

1. Аналого-цифровой преобразователь (АЦП), работающий по принципу измерения напряжения.

2. Время-импульсное кодирование аналогового сигнала (клиппирование).

3. Спектральный анализатор.

Измерительные АЦП имеют следующий принцип действия. Амплитуда аналогового сигнала измеряется через определенные промежутки времени - кванты. Полученные числовые значения являются цифровыми величинами, характеризующими аудиосигнал. Величина промежутков времени, через которые производится измерение амплитуды аудиосигнала называется шагом квантования, а сам процесс называется оцифровкой звука.

Клиппирование аналоговых сигналов заключается в фиксации моментов времени, когда акустический сигнал, увеличиваясь, достигает верхней критической (заранее определенной) амплитуды (BKA) и, уменьшаясь, - нижней критической амплитуды (НКА).

Значения верхней и нижней критических амплитуд подбираются экспериментально. Весь остальной процесс клиппирования выполняется по строгому алгоритму:

при достижении увеличивающимся аналоговым сигналом уровня верхней критической амплитуды фиксируется время, и цифровой выход включается в 1;

при достижении уменьшающимся аналоговым сигналом НКА фиксируется время, а цифровой выход переключается в 0.

По накопленным значениям t и соответствующим им значениям цифрового выхода определяются временные параметры аналогового сигнала: длительность импульсов и длительность пауз, которые и являются цифровыми значениями аналогового сигнала.

Аналого-цифровое преобразование на основе спектрального анализа заключается в том, что звуковые колебания сложной формы раскладываются на ряд гармоник. Частоты и амплитуды, характеризующие гармонические составляющие аудиосигнала, и являются оцифрованным звуком.

Для преобразования звукового сигнала в цифровой код используются специальные устройства ввода.

Для улучшения качества звука применяется дополнительное устройство ПЭВМ - звуковая плата (аудиоплата).

Обычно звуковая плата состоит из трех модулей:

модуля оцифрованного звука;

многоголосого частотного синтезатора (Freguency Modulation Synthesizer);

модуля интерфейсов внешних устройств.

Модуль оцифрованного звука предназначен для цифровой записи, воспроизведения и обработки оцифрованного звука.

В его состав входят аналого-цифровой и цифро-аналоговый преобразователи и усилитель. Модуль позволяет преобразовывать вводимый аналоговый сигнал в цифровую форму, записывать его в оперативную память ЭВМ, проводить обратное преобразование оцифрованного звука из памяти ЭВМ в аналоговую форму, усиливать его по мощности для последующего вывода на внешний динамик или головные телефоны. В состав модуля часто входит микшер для смешивания сигналов с линейного входа и с микрофона.

Многоголосый частотный синтезатор предназначен для генерации звуковых сигналов сложной формы. Существуют два принципиально различных способа синтеза звуковых сигналов:

частотныйсинтез (FM - Fregueney Modulation);

волновой синтез (WS - Ware Synthesys).

Частотные синтезаторы генерируют звуковые колебания синусоидальной формы заданной частоты и амплитуды, благодаря чему значительно улучшается качество звука (по сравнению с попытками генерировать звук с помощью прямоугольных колебаний). Наличие нескольких генераторов позволяет использовать эти устройства для синтеза сложных звуковых сигналов, в том числе речи.

Волновой синтезатор имеет запоминающее устройство, в которое записаны образцы звучания различных музыкальных инструментов в виде волновых таблиц или алгоритмов. Генерация звука заключается в воспроизведении оцифрованной записи звука, полученной при игре на соответствующем инструменте. Волновые таблицы позволяют учесть особенности звучания различных инструментов, но набор их не является исчерпывающе полным. При работе под Windows результат волнового синтеза оформляется в файлы с расширением "Wav".

Сопряжение ЭВМ с электромузыкальными инструментами осуществляется с помощью интерфейса электромузыкальных инструментов (MIDI - Musical Instruments Digital mterface).

В состав стандарта MIDI входят: стандарт электрический, стандарт на протоколы обмена данными, драйверы устройств и звуковые файлы.

В соответствии со стандартом МШ1 ЭВМ передает в звуковую плату номер музыкального инструмента, номер ноты, характеристику игры музыканта (длительность, сила и способ нажатия клавиши). Эти же данные хранятся и в MTOI-файлах. MTDI-файлы не содержат звуков, в связи с чем по размеру они значительно меньше звуковых файлов. Звуки находятся в звуковых библиотеках. При использовании MIDI-музыки необходимо иметь таблицу музыкальных инструментов (состав таблицы не стандартизован), в которой указываются номера инструментов (используемые затем в MTDI-файлах) и их название.

Основные характеристики звуковой карты - разрядность, частота дискретизации, количество каналов (моно, стерео), функциональные возможности синтезатора, совместимость.

Под разрядностью звуковой карты понимается количество бит, используемых для кодирования цифрового звука.

Частота дискретизации определяет, сколько раз в секунду производится измерение амплитуды аналогового сигнала. Чем больше частота дискретизации, тем точнее оцифрованный звук будет соответствовать исходному. Но при каждом измерении формируется 8 - или 16-битовый код измеренного значения (1 или 2 байта), в связи с чем этот параметр оказывает сильное влияние на требуемый для хранения оцифрованного звука объем памяти. Для записи/воспроизведения речи достаточно иметь частоту дискретизации 6-8 КГц, для музыки среднего качества - 20-25 КГц, для высококачественного звука - не менее 44 КГц.

Звуковые карты, обеспечивающие работу со стереофоническим звуком, имеют два одинаковых канала, тогда как для работы с монозвуком требуется более простая карта. Стереозвук, кроме того, требует вдвое большего объема памяти.

Функциональные возможности карты характеризуют наличие на ней специальных комплектов микросхем: РМ-синтезатора, обеспечивающего частотный синтез звука; WT-синтезатора, обеспечивающего волновой синтез звука (при котором образцы звучания инструментов могут быть записаны в файле вместе с волновыми таблицами (например, формат WAV) или могут находиться в ПЗУ звуковой карты (например, формат MID)). Кроме того, большое значение имеют возможности синтезаторов по обработке звуков (количество голосов, модуляция, фильтрование и др.), наличие аппаратных ускорителей (спецпроцессоров) и аппаратурных средств сжатия - восстановления, возможность загрузки новых образцов звучания инструментов и др.

Совместимость обычно оценивается по отношению к моделям Sound Biaster фирмы Creativ Labs: SB Pro и SB 16. SB Pro - это 8-битовая карта, обеспечивающая запись/воспроизведение одного канала с частотой дискретизации 44.1 КГц либо двух каналов с частотой дискретизации 22.05 КГц, имеет FM - и WT-синтезаторы. SB 16 - 16-битовая карта допускает запись/воспроизведение стереозвука с частотой дискретизации от 8 до 44/1 КГц; имеет автоматическую регулировку уровня записи с микрофона и программную регулировку тембра; в ее состав входят FM - и WT-синтезаторы.

Для сравнения приведем характеристики двух звуковых карт. Карта AMD InterWave имеет 32 голоса, частоту дискретизации до 48 кГц, встроенное ПЗУ емкостью 1 Мбайт с инструментами стандарта General MIDI (GM) и шестью наборами ударных стандарта Roland General Standart (GS). Имеет возможность расширения за счет установки модулей ОЗУ емкостью до 8 Мбайт и эффект - процессора. При наличии ОЗУ обеспечивается аппаратурная совместимость со звуковыми картами GUS (Gravis Ultrasound Standart).

Звуковая карта AWE32 производства Creative Labs предназначена для записи и воспроизведения высококачественного стереозвука, обеспечивает 8 - и 16-битовое кодирование оцифрованного звука, частоту дискретизации от 5 до 44 КГц, имеет программируемый сигнальный процессор, позволяющий работать со звуком в реальном масштабе времени, осуществляющий в этом режиме сжатие и восстановление звуковых файлов, 20-голосый FM-стереосинтезатор, WT-синтезатор, работающий в соответствии со стандартами GM, GS и МТ-32 (Sound Canvas Multi-Timbral-32) ПЗУ, емкостью 1 Мбайт, в котором содержится 128 GM-совместимых инструментов и 10 GS-совместимых наборов ударных инструментов. Карта обеспечивает одновременное воспроизведение 32 голосов, имеет цифровой десятиканальный стереомикшер, оперативное ЗУ емкостью 512 Кбайт для дополнительных пользовательских библиотек звуков (память может быть расширена до 28 Мбайт). Предусмотрена возможность расширения дополнительным табличным синтезатором Wave Biaster II для получения 64-голосовой полифонии и еще 10 наборов ударных. Имеются интерфейс для подключения CDROM, встроенный усилитель мощности (4 Вт на канал), разъем для подключения голосового модема, обеспечивается работа в стандарте PlugSPlay.

Воспользуйтесь поиском по сайту: