Главная | Обратная связь | Поможем написать вашу работу!

Аналого-цифровой преобразователь

Стр 1 из 2Следующая ⇒

ДИПЛОМНАЯ РАБОТА

на тему:

«Оцифровка и реставрация аудиоматериала»

Студент ______________________(Клочков А.О.)

(подпись) (фамилия, инициалы)

Направление специальности 1-17 01 04-03

Режиссура кино и телевидения

(звукорежиссура)

Руководитель старший преподаватель

_____________________ Гаврилова О.Р.

(подпись) (фамилия, инициалы)

Рецензент _________________________________________________________________________________________

_________________________________________________________________________________________

_______________ ___________________

(подпись) (фамилия, инициалы)

Минск, 2014

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ……………………………………………………….3

ГЛАВА 1 РЕСТАВРАЦИЯ ЗВУКА……………………………. 7

ГЛАВА 2 ТЕОРИТИЧЕСКАЯ ЧАСТЬ ОЦИФРОВКИ

АУДИОМАТЕРИАЛА……………………………...8

ГЛАВА 3 СРЕДСТВА РЕСТАВРАЦИИ И ОБРАБОТКИ……25

ГЛАВА 4 ПРАКТИЧЕСКАЯ ЧАСТЬ РАБОТЫ………………27

ЗАКЛЮЧЕНИЕ………………………………………………… 37

СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ………………...38

ВВЕДЕНИЕ

Во все времена люди пытались записывать информацию различными способами. И всяческими способами пытались как можно дольше сохранить звук на различных видах носителей.

Виниловая пластинка

Она же Граммпластинка - (жарг. винил, или просто пластинка) — аналоговый аудионоситель, представляющий собой двусторонний, реже односторонний, диск, изготовленный из синтетических материалов (первоначально из шеллака), на поверхности или поверхностях которого отштампована непрерывная извилистая канавка или дорожка, представляющая собой отображение звуковых волн. Слова «грампластинка» и «грамзапись» являются сокращениями от «граммофонная пластинка» и «граммофонная запись», но, поскольку граммофоны давно уже никто не использует, то эти сокращённые термины стали существовать независимо друг от друга. В конце XIX и на протяжении XX века грампластинка была важнейшим аудионосителем, недорогим и доступным. Главным достоинством грампластинки было удобство массового тиражирования путём горячей штамповки; кроме того, грампластинки не подвержены действию электрических и магнитных полей. Недостатками грампластинки являются подверженность температурным изменениям и влажности, а также свойство пластинок при постоянном использовании терять свои аудиохарактеристики.

Этот вид носителя имеет определенные преимущества по сравнению с магнитной пленкой и современными цифровыми носителями. Это, так называемое аналоговое звучание и теплый диапазон звуковых гармоник.

Но если рассматривать этот вид носителя на предмет долговечности, он проигрывает самым первым, потому что имеет небольшой запас механической прочности, который исчерпывается по мере эксплуатации и при воздействии природных явлений.

Магнитная аудио лента

Носитель информации в виде гибкой ленты, покрытой тонким магнитным слоем. Информация на магнитной ленте фиксируется посредством магнитной записи. Устройства для записи звука на магнитную ленту называются соответственно магнитофон.

Магнитная лента произвела революцию в вещании и записи. Вместо прямых эфиров в телевизионном и радиовещании стало возможным производить предварительную запись программ для последующего воспроизведения. Первые многодорожечные магнитофоны позволяли производить запись на несколько раздельных дорожек от различных источников, а затем впоследствии сводить их в конечную запись с наложением необходимых эффектов. Также развитию компьютерной техники послужила возможность сохранения данных на длительный период с возможностью быстрого доступа к ним.

Этот аудионоситель по надежности и звуковому преимуществу стоит посредине между виниловыми и цифровыми носителями. Что касается прочности магнитной записи, она немного превосходит винил, но значительно уступает цифровым видам хранения. Звучание магнитной ленты можно рассматривать как более совершенное, ввиду того, что в ней отсутствуют механические щелчки как на пластинках, но, все же, частотный и гармонический диапазоны значительно уже, чем у "цифры".

Цифровые аудио носители

Звуковой компакт-диск (CDDA, англ. Compact Disc Digital Audio, также называемый англ. Audio CD и Red Book) — международный стандарт хранения оцифрованного звука на компакт-дисках, представленный фирмами Philips и Sony.

Звуковая информация представлена в импульсно-кодовой модуляции с частотой дискретизации 44,1 кГц и битрейтом 1411,2 кбит/с, 16 бит стерео.

Минидиск (MiniDisc или сокращённо MD) — цифровой магнитооптический носитель информации. Был разработан и впервые представлен компанией Sony 12 января 1992 года. MD позиционировался как замена компакт-кассетам, к тому времени уже полностью изжившим себя, и — как конкурент уже получившим распространение (но неперезаписываемым) компакт-дискам. Его можно использовать для хранения любого вида цифровых данных. Использует систему кодировки MD ATRAC. Наиболее широко минидиски используются для хранения аудиоинформации.

Цифровые носители преобладают по всем параметрам над двумя предыдущими видами звукопередачи, но, к сожалению, при механическом повреждении не подлежат реставрации, в отличие от двух предыдущих.

Аналого-цифровой преобразователь

АЦП, англ. Analog-to-digital converter, ADC — устройство, преобразующее входной аналоговый сигнал в дискретный код (цифровой сигнал). Обратное преобразование осуществляется при помощи ЦАП (цифро-аналогового преобразователя, DAC).

Как правило, АЦП — электронное устройство, преобразующее напряжение в двоичный цифровой код.

Аналоговый сигнал является непрерывной функцией времени, в АЦП он преобразуется в последовательность цифровых значений. Следовательно, необходимо определить частоту выборки цифровых значений из аналогового сигнала. Частота, с которой производятся цифровые значения, получила название частота дискретизации АЦП.

Непрерывно меняющийся сигнал с ограниченной спектральной полосой подвергается оцифровке (то есть значения сигнала измеряются через интервал времени T — период дискретизации) и исходный сигнал может быть точно восстановлен из дискретных во времени значений путём интерполяции. Точность восстановления ограничена ошибкой квантования. Однако в соответствии с теоремой Котельникова — Шеннона точное восстановление возможно только если частота дискретизации выше, чем удвоенная максимальная частота в спектре сигнала.

ГЛАВА 1 РЕСТАВРАЦИЯ ЗВУКА Старые аудиокассеты и виниловые пластинки у многих из нас хранятся десятками лет, они дороги нам, мы их бережем, но они бывают уже непригодны к прослушиванию. Ведь магнитная пленка, как и виниловая пластинка, с годами теряет свои свойства, что главным образом сказывается на качестве записи. Это приведет к тому, что запись может оказаться безвозвратно утраченной. В наше время это проблем решается элементарно – оцифровка позволит не только сохранить, но и оживить старый звук, например песню или музыку. В некоторых случаях простой оцифровки может оказаться недостаточно, и потребуется реставрация звука. После реставрации все дефекты звука (музыки, голоса) станут практически незаметны, а в некоторых случаях их удается убрать полностью. Лучше всего оцифровать звук, а полученные файлы сохранить на жестком диске компьютера и записать на CD или DVD-диск. Кроме того, старые записи можно так обработать, что после сведения и мастеринга они станут звучать намного лучше, чем в оригинале. Реставрация звука заключается в снижении заметности помех, то есть – убираются посторонние шумы, треск, щелчки и прочие дефекты записи, увеличивается громкость записи, расширяется частотный диапазон. Восстановления качественного звучания старых аналоговых записей – это сложный процесс, который требует профессиональных навыков, музыкального слуха и специального оборудования. Для качественной реставрации звука нужна музыкальная студия, которая оборудована необходимой аппаратурой, которая наверняка потребуется для этого. Конечно, если вы хотите восстановить запись для собственного прослушивая у себя дома, то можно попытаться отреставрировать ее своими силами, используя обычный компьютер и стандартное программное обеспечение. Но если запись предназначена для публичного воспроизведения, например трансляции в радиоэфире или по телевидению, то лучше обратиться к профессионалу, который располагает специализированным оборудованием и имеет опыт восстановления старых записей. Оцифровка звука, выполненная на студийном оборудовании, подарит старой записи новую жизнь. ГЛАВА 2 ТЕОРИТИЧЕСКАЯ ЧАСТЬ ОЦИФРОВКИ АУДИОМАТЕРИАЛА Основных характеристик "цифрового звука" три: частота сэмплирования (или квантования, ее еще называют sample rate), разрядность (глубина) бит (или попросту битность, или sample width), и количество каналов. AudioCD по этой схеме имеет параметры 44100/16/2. Можно грубо сказать, что для получения этого формата 44100 раз в секунду замерялась громкость звука по линейке высотой 2^16=65536 условных "звуковых миллиметров", иначе - шагов квантования. По этим же делениям она была жестко "округлена" (в кавычках - потому что шаги квантования отнюдь не обязаны быть целочисленными). Изобразим условно аналоговый звук так:

Есть циничное мнение, что источников аналогового звука в природе вообще не существует - просто его разрешающая способность куда серьезнее. А среда распространения звука - воздух, например - является естественным фильтром очень высокого порядка. С другой стороны, любую форму сигнала, какой бы сложной или ломаной она ни была, можно "собрать" из вот таких простых синусоид. Ухо человека представляет собой очень сложную систему, в центре которой - коническая резонансная трубка-мембрана. Она имеет около 25 тысяч окончаний нервных клеток-"микрофонов", каждая из которых "настроена" на свой диапазон частот (это просто и гениально обусловлено ее расположением на конической, напомню, мембране). Человеческий мозг воссоздает картину звука, получив сигнал, сведенный из этого безумного 25-тысячеканального микшерного пульта. Понятно, что технически создать такую модель, мягко говоря, сложно, да и, по счастью, не является необходимостью. В электронном же мире звук превращается в аналоговый электросигнал вслед за колебаниями тоненькой круглой (плоской или слегка выпуклой) мембраны микрофона, порождаемыми мгновенной суммой амплитуд волн всех частот, ударяющих в нее. В том числе частот и гармоник, человеческим ухом не улавливаемых. Посмотрим, что происходит с этим электрическим, но все еще аналоговым сигналом при оцифровке с низкой и высокой частотой сэмплирования и разрядностью:

Как видим, "мелкоячеистая" сетка с высокими частотой (вертикальные линии) и разрядностью (горизонтальные линии) передает сигнал намного достоверней. Но не надо путать частоту сэмплирования с реальной верхней границей полезного сигнала - она всегда в два раза меньше частоты сэмплирования, т.е., квантование в 44100 Гц дает нам возможность более-менее достоверно воспроизводить звук до 22000 герц (20000 устарело, считается верхней слышимой границей, а в оставшиеся 2 килогерца, при помощи специальных приемов, часто "уводят" побочные шумы, в. т.ч. и полученные при собственно квантизации). И, кстати, не пытайтесь "загнать" в оцифровщик частоты выше половины его частоты сэмплирования - если это Вам все же удастся, вместо ожидаемого расширенного диапазона частот Вы получите целый спектр паразитных гармоник в слышимой области, стартующий тем ниже, чем более высокая частота "проскочит" в оцифровку (подробно и глубоконаучно обо всем этом по словам "частота Найквиста", "теорема Котельникова-Шеннона", "oversampling", "noise shaping"). Разрядность 16 бит в формат бытового аудио тоже заложена буквально по минимуму, и для профессиональной работы со звуком используются разрядности в 18, 20, 24 и 32 бита (хотя на первый взгляд разница невелика, высоты таких линеек резко взлетают с 65535 в 1048576 (20бит) и 16777216 (24бит) "звуковых миллиметров". Размах же 32-битной шкалы даже произнести непросто: 4.294.967.296). С точки же зрения файловой системы занимаемый треками объем при переходе от 16 к 24 битам возрастет всего в 1,5 раза, а к 32 битам - ровно в 2. Количество каналов. Объяснять разницу между отжившими моно и квадро, вездесущим стерео и современными 5.1 и 7.1 сегодня не нужно. Еще одна характеристика - громкость, более правильно - амплитуда, или размах сигнала. Хотя по определению амплитуда может быть только положительной, часто так называют и мгновенное значение напряжения сигнала (а оно вполне может быть отрицательным). Амплитуду часто измеряют в децибелах (дБ или dB), и эта единица так же непроста, как и разрядность. Дело в том, что децибелы измеряют не абсолютные, а относительные величины. Скажем, между амплитудами в 0.5 и 1 вольт разница всего в полвольта, в dB эта разница равна 6. А между амплитудами 110 и 220 вольт разница - уже 110 вольт. Тем не менее, в децибелах разница снова равна 6. Дело в том, что 6dB означает соотношение амплитуд как 1:2, независимо от того, какие именно значения принимают в данный момент амплитуды. Более того, шкала, по которой измеряются децибелы - логарифмическая. К чему все эти сложности? Наши уши воспринимают звук по логарифмической шкале, и от этого никуда не деться. Вот краткая справочная таблица для перевода отношений амплитуд в децибелы:

dB	Отношение
	1.00
	1.12
	1.26
	1.41
	1.78
	2.00
	2.51
	3.16
	10.0
	100.0
	1 000.00
	10 000.00
	100 000.00

Кроме того, у дорожки в целом есть и такая характеристика, как динамический диапазон (разница между самым тихим и самым громким звуком). Чем шире диапазон - тем естественней звучат голоса, спецэффекты и живьём записанные музыкальные инструменты.

Сжатие динамического диапазона позволяет усилить тихие звуки, не давая при этом громким "вырваться" за очерченные пределы. Такой процесс называют компрессией звука. Звук становиться более плотным, иногда, более ярким, но при излишнем усердии живые инструменты станут звучать неестественно, а голоса станут похожими на пропущенные через (достаточно качественный, правда) радиотракт; спецэффекты же потеряют часть эффективности, основанную на резком изменении громкости. Например, накладываемый в фильмах любительский дубляж часто подвергается довольно жесткой компрессии, порой совершенно излишней. Понятно, что динамический диапазон косвенно ограничен разрядностью сигнала.

Особое внимание стоит уделить потерям, которые связанны с описанными характеристиками и их преобразованиями.

Частотные. "Стандартные" компьютерные частоты сэмплирования, по счастью, кратны друг другу: 44100, 22050, 11025 и т.д. Это помогает избежать ряда проблем с искажениями при преобразованиях и, в частности, появления низкочастотных огибающих, которые мы можем получить при преобразовании "некратных" частот - к примеру, 48000 кинопроизводственных и 44100 компьютерных могут дать нам, помимо прочего, искажения в районе 48000-44100=3900 герц - прямо в центре слышимого диапазона (все, кто хоть немного сталкивался со струнными инструментами, отлично знают на практике, что такое "биение частот" при подтягивании струн в унисон). Но это еще не все подарки мирового кинематографа: "благодаря" формату NTSC мы имеем т.н. "пониженные" частоты - 44056 и 47952 Гц.

Вкратце, это связано с "рваной" частотой NTSC в 29.97 кадров в секунду, в то время как синхрокод SMPTE, согласующий работу устройств в студии, "отрабатывает" ровно 30. Цифровая спутниковая телесвязь, и за ними DAT-магнитофоны тоже не остались в стороне, присовокупив от себя частоту сэмплирования 32000 Гц, что, впрочем, на фоне проделок NTSC выглядит детской шалостью.

Далее, при передаче цифрового сигнала от одного устройства к другому мы не застрахованы от искажений в низких частотах, связанных с несовершенством цифровых интерфейсов. Обо всем этом написано столько, что мы просто обозначим для себя: насколько возможно, следует избегать преобразования частот (особенно некратного) и передачи сигнала даже по, казалось бы, чисто цифровым интерфейсам. Всем этим условиям отвечает обработка звука полностью внутри компьютера - мы теряем только на входе. (С другой стороны, если у Вас вдруг окажется профессиональный внешний, специально предназначенный для преобразования частоты сэмплирования прибор, лучше воспользоваться им. Правда, это дорогостоящая техника, да и качества программной обработки вполне достаточно для дорожек к мультикам или самодельным концертным записям).

Есть искажения, на которые мы повлиять не можем - например, зависящие от собственной частоты звука. По совести, для полноценного восстановления синусоиды частотой 20КГц частота сэмплирования должна бы быть далеко не 44КГц (44100/20000=2.205 замера явно мало для восстановления двух полуокружностей! Вместо них мы получим две "ступеньки" - см. графики в начале статьи), в идеале - несколько сот (!) килогерц. К счастью, этот тип искажений худо-бедно компенсируют современные фильтры высоких порядков, "отбрасывающие" большинство образующихся гармоник-искажений. По этой же причине микросхемы современных усилителей для качественной передачи звука работают с частотами от десятых долей мегагерц и выше.

Еще одна очень неприятная потеря - т.н. детонация частоты ("wow", "flutter"). Возникает она на аналоговых носителях в случае, если лента по каким-то причинам ("бьющий" прижимной резиновый ролик или тонвал, и т.д.) движется "рывками" или с плавным ускорением-замедлением, либо сама лента уже деформирована лентопротяжным механизмом. Это приводит к изменению высоты тона и, при более явном проявлении, к нарушению ритмического рисунка. Я однажды с ужасом наткнулся на грампластинку с записью Тони Йомми, дорожки на второй стороне которой были... отпечатаны не по центру диска. “Качание” звука было то еще, да и визуальное гуляние тонарма и самих дорожек переплюнуло целый ряд "мультяшных" граммофонов. Почему я отдельно упоминаю о пластинках? Дело в том, что автоматического способа исправления таких искажений нет, и в ближайшее время он вряд ли появится. Если фонограмма имеет неоспоримую ценность, то имеет смысл помучаться с ней вручную, "подгадав" в несколько дублей период качания по паре десятков колебаний и наложив "противофазные" искажения, но и это справедливо только для ленточных детонаций, т.к. пластинка по мере продвижения ее спиральной дорожки к центру диска... вот-вот. Угловая-то скорость неизменна, а линейная - увы.

Амплитудные. Следующий тип искажений связан с любыми преобразованиями, даже в виртуальных устройствах - это погрешности при необходимости снова "привязывать" полученные нами громкости сигнала к "высоте" разрядной линейки. Компьютер как таковой от них, конечно, уже не спасает, и в нашей воле - только выбор компромиссной разрядности при обработке (и хранении) сигнала. С действительно качественным звуком имеет смысл работать не ниже 24-32 бит (хотя многие даже не заметят разницы в звучании). Используемые программы при таком принципиальном подходе желательно проверять на честность обработки - так как порой она не соответствует заявленной производителями (во время обработки звук может быть пересчитан в 16 бит). Для проверки можно воспользоваться, например, BitPolicy.

Отдельный и важный разговор - об оптимальной амплитуде обрабатываемого сигнала. Работа с тихим сигналом - в небольшой "нижней" части амплитудной линейки - понижает его разрядность, так как всякий раз после любой обработки мы округляем полученный размах к нескольким, пропорционально "укрупнившимся" ее ступенькам. Так можно Случайно понизить разрядность до 14 бит и даже ниже. Фактически, 16-битный сигнал в -24dB (около 6% макс. амплитуды) имеет разрядность в 12 бит - "высота" соответствующей ему части линейки - всего 4096 делений! Для достижения 12-битным звуком качества 44100/16 частоту сэмплирования пришлось бы поднять до 705.6КГц

Чем ниже амплитуда, тем большим искажениям при обработке она подвергается.

Слишком же большая амплитуда, в свою очередь, может приводить к тому, что сигнал окажется выше самого "высокого" деления амплитудной "линейки". Это так называемый "клип" (clip) - "отрезанная", навсегда потерянная часть сигнала. "Звучат" клипы по-разному: полученные при обработке - как резкие сухие щелчки, при оцифровке - как глуховатый треск, и малозаметный "теплый" перегруз на более дорогих, профессиональных приборах оцифровки, которые стараются по мере сил мягко лимитировать их до допустимого максимума. Подобные мягкие искажения близки к "живым" аналогам - скажем, к катушке динамика в акустической системе, которая дошла до максимума своего движения в магнитном поле, или магнитной пленке, попавшей в такое поле, при котором "дополнительное" намагничивание уже невозможно.

Разумным компромиссом при обработке будет выбор амплитуды, над которой останется небольшое пространство от -3dB или чуть больше (в редакторах - до 30% свободного пространства от полной высоты аудиотрека). При записи сигнала (или в самом звуковом тракте) нет уверенности, верхний порог следует отрегулировать уровнями записи ближе к -6dB - это наверняка защитит Вас как от перегрузок платы во время неожиданного "всплеска" в звуке, так и от "запирания" в микшерном пульте или промежуточном усилителе (NB: метку "0 VU" аналоговых выходов студийного оборудования подстраивают и под -12, и даже под -15dB уровня цифровых рекордеров). Альтернатива - использовать лимитер, если он, конечно, есть. Это позволит Вам не только сгладить ошибки с уровнем при оцифровке, но и снивелировать действительно ненужные пики; кроме того, при умелом подходе, можно немного "накачать" общую амплитуду, не испортив сигнал для дальнейшей обработки. Конечно, при вдумчивом и уважительном обращении.

По окончании работы со звуком можно нормализовать дорожку вплоть до -0.2dB - визуально примерно на 97% от максимального развёртывания синусоиды. По другим рекомендациям, самый мощный сигнал при финальной нормализации не должен превышать -0.5дБ. Выравнивать пики под 0dB в любом случае не стоит. Заметного изменения громкости не произойдет, а вот к проблемам такой уровень приведет запросто. Здесь неплохо поставить точку еще на одном часто возникающем вопросе - чувствительность человеческого уха: вблизи порога слышимости она составляет 2-3dB, а на средних уровнях - около 0,4dB.

Разрядность и шум. На первый взгляд связь между ними уловить трудно, на деле же - это еще один подвох квантизованного звука. И еще один довод не работать без нужды с тихим сигналом. Для идеального теоретического преобразователя всегда существует максимальное соотношение сигнал/шум, которое он может обеспечить, и оно в первую очередь зависит именно от амплитуды. Даже при нулевом шуме соотношение сигнал/шум не может быть больше, чем весь динамический диапазон, предоставляемый разрядностью. Существуют две формулы, более точная и упрощенная (1 и 2 соответственно):

(1) 1.76 + (число бит * 6.2) = отношение сигнал/шум

(2) 2 + (число бит * 6) = отношение сигнал/шум

Таким образом, 12-битная глубина физически не сможет обеспечить сигнал/шум больше, чем 74dB (звучание магнитофонной деки или FM-радиостанции). Для сравнения: 8-битный звук дает 50dB (радиовещание "старых", средневолновых станций), а 16-битный - 98dB (полный динамический диапазон симфонического оркестра). С реальными же, а не теоретическими приборами оцифровки эти цифры, конечно, еще ниже - в эту копилку подкидывают свои монетки погрешности параметров электронных компонентов, недостатки экранировки аналоговой части, помехи соседних цифровых устройств, и т.д.

увеличение частоты сэмплирования и разрядности сигнала хорошо отражается на его достоверности;)

лишние преобразования (и особенно передача сигнала между устройствами), пусть даже в цифровой форме, искажают сигнал; как следствие - частоту сэмплирования выходного трека следует выбирать сразу при оцифровке и, если целью является просмотр на компьютере, лучше сразу установить ее в 44100, чем в 48000 с последующим (да к тому же "некратным") преобразованием.

максимальный пик сигнала желательно "подгадывать" при записи сигнала с непредсказуемой динамикой (либо на непредсказуемой аппаратуре) под -12dB - -6dB; в процессе обработки - в -6dB - -3dB, чтобы максимально уменьшить искажения при обработке и оставить при этом безопасное пространство для будущего изменения формы сигнала. (NB: при многоканальном сведении также неплохо удерживать уровни треков в диапазоне -12dB - -6dB). Финальную нормализацию микса или обработанного трека правильно делать ниже 0dB, в диапазоне -0.5dB - -0.2dB.

P.S.: на самом деле еще многие "мелочи" и подвохи цифрового мира остались за кадром. К примеру, записывая тот же сигнал в 20КГц, вы всякий раз чудом попадаете в кнопку "Rec" именно при прохождении синусоидой нуля? Нет? Значит, каждый ваш дубль "даст" на осциллограмме (а значит, и в звуке) каждый раз совершенно различные результаты! И не только на этой частоте, но и, естественно, на всех остальных. Остался за кадром и такой момент, как инерционность человеческого уха (а ведь оно, как и глаз, принимает свои слишком быстро сменяющиеся "слуховые кадрики" за плавное непрерывное "движение" звука).

AVI -файл. Файл с расширением avi (аббревиатура " A udio- V ideo I nterleaved" - перемежающиеся видео и аудио потоки), представляет собой некий "контейнер", содержащий в себе один или более аудио и\или видео потоков. В формате заложена даже прозрачность видеослоев по маске, но эта возможность осталась невостребованной, как и вообще множественные видеопотоки в одном avi-файле. Зато аудиопотоков вполне может быть два и более (для формата MPEG-4 - до восьми!). Преимущество такой "контейнерной" структуры в том, что каждый поток может храниться в собственном формате, отличающемся от остальных. Конечно, каждый поток имеет свой заголовок, в котором и сообщает о себе все необходимое для правильного воспроизведения.

mp3 -файл. Один из способов сжать звук с потерями. Такое сжатие позволяет лучше "упаковать" файл, но взамен безвозвратно портит запаковываемую дорожку. Чем сильнее степень сжатия - тем сильнее слышны искажения. Но в любом случае исходный сигнал восстановить не удастся уже никогда. Из-за расширения "mp3" популярно суеверие в существование формата MPEG-3 На самом деле, звук в этих файлах имеет формат еще MPEG-1 layerIII.

Работа с любыми сжатыми форматами крайне не рекомендуется, так как каждая операция сжатия вносит достаточно заметные, и невосстановимые потери.

WAV -файл. Файл с расширением wav (от слова "wave" - волна), аналогичный avi-файлу контейнер, но: только для аудио, и только для одного потока. Поток может быть практически любого поддерживаемого операционной системой формата, но наиболее часто встречаются на сегодня PCM (P ulse- C ode M odulation - несжатое аудио) и MPEG1 layerIII (если "вытащить" поток layer3 из оболочки WAV-файла, то получится обычный mp3. Эту функцию отлично выполняет mp3DirectCut, например).

Постоянная составляющая (DC offset). Как известно, напряжение может быть постоянным и переменным. Соответственно, любой сигнал может нести в себе обе составляющие, в том числе и звуковой. Но, если переменная составляющая - это, по сути, и есть звук, то постоянная составляющая приносит одни неприятности, и в правильном звуковом сигнале ее не должно быть.

Фейдинг - от слова "fade" (затухание). Под этим действием понимается плавное увеличение или уменьшение громкости, необязательно, но чаще всего - до нуля или полной амплитуды. По этой же причине фэйдерами принято называть знакомые каждому "движковые" регуляторы громкости на микшерных пультах.

Кроссфейдинг (cross-fading). Просто "встык" соединять отдельные фрагменты опасно, даже если Вы именно их перед этим и разрезали на этом самом месте. В числе возможных неприятностей - щелчки, по звуку и природе аналогичные началу и концу звучания трека с неотфильтрованной постоянной составляющей (DC offset). Для этого дорожки "накладываются" друг на друга, некоторое время звуча вместе. При этом громкость первой дорожки уменьшается до нуля (fade out), а второй - растет до полного размаха (fade in). Хорошая длина для наложения фрагментов - 10-30мс.. При кроссфейдинге избегайте попадания склейки на удары барабанов или другие четкие звуки. Хорошее место - совсем рядом с "ударным" звуком, который поможет дополнительно замаскировать склейку.

Компрессор, лимитер, гейт (гейтер), экспандер - четыре функционально разных прибора, имеющие одно общее свойство: все они представляют из себя некую функцию (читай, кривую), определяющую уровень выходного сигнала в зависимости от входного. Есть и физические устройства, и программы, так или иначе объединяющие в себе эти приборы. Рассмотрим их на примере Waves C1 gate-comp:

Кажется несколько сложным, но на самом деле все предельно просто - по горизонтальной шкале - входная амплитуда, по вертикальной - выходная. Прямая линия из левого нижнего (начало координат) в правый верхний угол будет означать, что звук проходит без изменений. Теперь смотрим на рисунок: бирюзовая полоска слева внизу (помечено цифрой "1") начинается несколько правее начала координат, примерно от отметки -80dB. Значит, что при амплитуде входного сигнала ниже -80dB выходная будет равна нулю, то есть все шумы (и полезный сигнал, конечно) ниже этой громкости будут отсечены шлюзом (gate) - эта часть графика работает как гейт. Поднимаемся до цифры "2". Угол наклона полоски явно круче, чем 45 градусов, выходной сигнал растет (от -100 до -60) в два раза быстрее входного (от -80 до -60), расширяя таким образом в два раза динамический диапазон на этом отрезке. Так работает экспандер. Следующий участок - прямая линия в 45 градусов, эта линия нам больше не интересна, а вот желтая линия возле цифры "3" плавно склоняется к горизонтали - начинается компрессия: динамический диапазон сжимается, в противовес экспандеру. Обратите внимание: возле цифры "4" линия стала практически горизонтальной, с этого момента сколько бы ни усиливался дальше входной сигнал, на выходе он будет лимитирован в -10dB. Этот участок работает как лимитер. Краем коснемся еще нескольких мелких, но важных моментов: чаще всего звук нарастает быстрее, чем спадает и, как следствие, эффективно отключение гейта на уровне более низком, чем его включение. Разлет между включением и выключением гейта, к примеру. на нашем рисунке, показывают две голубых стрелки-треугольничка сразу под графиком. Кроме того, на графике не отображаются, но достаточно важны еще два параметра: скорость открытия гейта после получения на входе нужного сигнала, и скорость его закрытия после пропадания сигнала. Второй параметр даже важнее, слишком быстрое закрытие гейта сделает "хвост" сигнала неестесственным. Эта ошибка характерна для начинающего "чистильщика шума" не только при настройке гейта, но и при "ручном" неумеренном вырезании пауз. Для удаления пограничных звуков (при записи в несколько микрофонов) лучше гейта справится экспандер, который можно считать "мягким аналогом" гейта - он ослабляет сигнал по заданной нами кривой, приглушая его тем сильнее, чем ниже его уровень. Таким образом, можно аккуратно и "естесственно" снять или в значительной мере ослабить звучание "лишних" инструментов при многодорожечной записи ударной установки, или в других подобных ситуациях.

NB: многодорожечные "аппаратные" студии часто используют пару "запись с завышением амплитуды сжатого сигнала над будущим шумом ленты+обратное расширение динамического диапазона с вытеснением шума вниз на выходе" (напр., dbx). За красивым названием Dolby A тоже "спрятаны" такие механизмы ухода от шума, но поделенные по частотам на четыре самостоятельных гейта (80Гц - гул, грохот; 80Гц-3КГц - взаимопроникновение звука из соседних каналов; от этого диапазона и в оставшихся двух - 3КГц, 9КГц - шипение и модуляционный шум). Конечно, "выдавливание" шума при выходном разжатии работает только в случае, если сигнал соответствующим образом был сжат на входе, что существенно снижает эффективность метода в "универсальных" условиях. В отличие от профессиональной "сестры", бытовая система Dolby B просто... обрезает верхние частоты (от 5КГц и выше), когда амплитуда спадает до определенного уровня, и открывает их, когда уровень вырастет до порога открытия. Просто и достаточно эффективно, и вполне может применяться как мягкий гейт даже для "неподготовленных" (в отличие от Dolby A) записей. Конечно, Dolby-системы (как и любые гейты) несколько "омертвляют" звук - бесплатный сыр бывает только в мышеловках. Но любая система требует точной настройки, а во-вторых, существуют приемы, позволяющие скрасить эти побочные эффекты, а часто и вовсе сделать их незаметными.

Де-эссер (DeEsser) - как подсказывает название, уничтожает излишки шипящих и свистящих согласных (и подобных им звуков) в обрабатываемом сигнале. Упрощенно можно рассматривать его как компрессор-лимитер, настроенный на узкую (перестраиваемую Вами) область высоких частот. Это название целого класса устройств; по аналогии с ними Steinberg назвал свой программный модуль удаления щелчков Declicker ("де-кликер"). Кроме того, появление в русском языке "дэссеров", "энхансеров-эксайтеров" и т.д., привело к появлению жаргонного обобщения психоакустических и мастеринговых устройств задорным словом "улучшайзеры", а сам процесс обработки ими - "улучшайзингом".

Звук: глухой, гулкий, звенящий, назойливый, невыразительный, артикулированный, грязный, размытый, слащавый, рыхлый, агрессивный, задавленный, пластмассовый, фанерный, теплый, мягкий, тусклый, ленивый, режущий, закрытый, перегруженный, жирный, прозрачный, плотный, воздушный - востину велик и могуч русский язык; все эти термины относятся к описанию звучания инструментов, миксов и "немузыкальных" дорожек. При полной порой "иррациональности" смысла они дают четкую характеристику звучанию. Не стесняйте себя в выражениях - и Вы сможете гораздо легче объяснить (или понять), чего не хватает, а чего в избытке в звучании обрабатываемой дорожки.

Нормализация (Normalize) - способ максимально увеличить сигнал, не перегружая и не меняя его динамический диапазон (в отличие от компрессии). Для этого при первом проходе по дорожке программа нормализации находит самый громкий пик сигнала (как правило), или вычисляет средний уровень RMS (среднее значение напряжения для одного колебания) для дорожки (такой м

12 Следующая ⇒

Воспользуйтесь поиском по сайту: