Акустическое измерение статики речи 12 глава
играми играли. игроки играми цг^ащ игроки и игра пи игроки Рис. 11. Запись динамики произнесения отдельных слов и тех же слов, объединенных во фразу ческая мощность каждого из звуков речи, синтезируемая вне данного слова в рядах а, и, о, п, к и т. д. На основе этого внутри данного слова на второй.ступени анализа и синтеза выделяются сильные и слабые слоговые позиции, которые квантуются по разным шкалам первой ступени, но оцениваются внутри слова как его устойчивая динамическая структура. Когда слова сочетаются во фразу, то слоговой синтез развертывается в еще более сложной системе. Слогоделение приобретает сигнальное значение, так как становится средством выделения значащих слов по их весу в составе сообщения. На рисунке 11 представлены динамические записи слов играм играли; игроки, кроме того, эти слова объединены в фразовом произнесении в двух вариантах: а) с выделением слова играми и б) с выделением слова играли 1. Сравнение записей показывает,, какие слоговые перестройки произошли при объединении слов в фразовое единство. Прежде всего все три слова, произнесенные по отдельности, достигают довольно высокого', но одинакового уровня. Попав во фразу, общее соотношение уров'ней слов изменилось. Во втором варианте произнесения первое слово значительно поднялось по уровню над третьим словом, но не достигло уровня второго слова. Выделенное слово, кроме того, приобрело большую долготу, а ослабленные сократились во времени. В первом варианте произнесения два слова по краям записи равномерно снизились по уровню, а среднее слово образовало командную вершину. Усиление позиции и здесь выражено не только громкостью, но и длительностью. Хотя все слоги одинаково хорошо отмечены как в отдельно произносимых словах, так и в фразе, но соотношение слоговых раздельностей различно. Существенно также и то обстоятельство, что в фразовом произнесении, подобно тому, как это бывает в отдельно произносимом слове, ниспадающие дуги громкости не опускаются до нуля, а все время подхватываются звуковым давлением последующего слога, чем создается общее синтетическое единство всего фразового объединения. «
1 Для акустического анализа в данном случае не имеет значения синтаксическая искусственность получившейся фразы. Этот материал показывает наличие третьей ступени анализа и синтеза в системе слоговых перестроек. Хотя звуки слов во всей фразе следуют без перерыва в общем звуковом давлении, они как постоянные различители продолжают различать слова и разделять их друг от друга, так как эта система словоразличения не смешивается с системой слогового квантования. Больше того, из графиков видно, что слоговая структура каждого из трех слов перестроилась во фразе по сравнению со структурой ^гех же слов в их отдельном произнесении, однако слова по-прежнему хорошо узнаются. Это значит, что квантование слогов во фразе отделяется в анализе от слоговой конструкции, обеспечивающей узнавание слова. Такое отделение происходит потому, что функция узнавания слова имеет одно сигнальное значение, а функция выделения слова во фразе — другое сигнальное значение, хотя и то и другое осуществляется средствами слогового квантования. Различие этих квантований и составляет различие слоговых перестроек. В фразовых слоговых перестройках, если их наблюдать на записях живой разговорной речи, происходят весьма тонкие и своеобразные явления, которые кажутся на первый взгляд парадоксальными. Обычное' представление состоит в том, что группа звуков, если они произнесены, всегда будет при наличии слогового гласного образовывать слог. Слог — это произносительная единица, и вне ее, казалось бы, невозможно произнесение звуков. Однако ряд наблюдений заставляет признать, что одним из средств слоговых перестроек является потеря или «пропажа» слогов. Выпадение слога в словах живой разговорной речи, или нуль слогоделения, является не чем иным, как средством относительного усиления других, особо выделяемых слогов. Это явление сходно с известным в языкознании случаем нулевой морфемы-, когда наличие или отсутствие группы звуков, выполняющих функцию морфемы, одинаково является знаком для различения форм слова.
Так как поставленный вопрос является сложным и новым, его не- до обходимо исследовать по возможности разносторонне. В этом параграфе будет рассмотрена только та часть проблемы, которая может быть решена при помощи акустических измерений. В дальнейшем тот же результат будет подтвержден наблюдениями из области речедви-жений. колокола колокола
Рис. 12. Запись динамики произнесения слова колокола На рисунке 12 представлены две записи слова колокола. Мы видим, что один раз при произнесении четырехсложного слова зарегистрировалось 4 слога, другой раз 3 слога. В обоих случаях игла самописца остается все время вверху, не опускаясь далеко вниз, т. е. показывает очень сжатый динамический диапазон внутри произносимого слова. Все слово произносится в течение секунды. Таким образом, на каждый слог падает не менее 0,25 секунды — время, достаточное для того, чтобы инерция аппарата не сказалась на пропаже одного из слогов. Времени было также достаточно для того, чтобы игла самописца опустилась ниже, чем это оказалось, на графике. Можно, следовательно, думать, что пропажа слога и сильное сжатие динамического диапазона'"произошли не по вине аппарата, а в процессе произнесения. Для проверки этою явления были проведены новые записи на другой аппаратуре. На рисунке 13 показано произнесение слова коло-кола слогорааделыю с редукцией безударных слогов, а в записи та ри-
сунке 14 — слитное произнесение с естественной редукцией. Нижняя кривая является отметчиком времени, регистрирующим колебания с постоянной частотой 400 кол/сек-, средняя кривая — запись осцилляции звуковой частоты на электромагнитном звуковом рекордере; верхняя кривая над прямой дает запись интенсивности звука в линейных (нелогарифми-ческих) единицах. Приводятся только две записи, так как другие, контрольные, произведенные в тех же условиях, совершенно аналогичны этим двум и не добавляют ничего нового. Кривая интенсивности слогоразделыюго произнесения (рис. 13), как и следовало ожидать, дает четыре значительно отставленные друг от друга вершины 1. Запись же интенсивности слитного произнесения (рис. 14) показывает только две вершины. Это значит, что в данном произнесении пропал не один, а два слога. Наиболее же интересным является то обстоятельство, что при пропаже двух слогов все речевые A^A^^^ №Vv%^ Д^^ММ^ 13. Запись на осциллографе слогораздельного произнесения слова ко-ло-ко-ла Рис. 14. Запись на осциллографе слитного произнесения слова колокола звуки, входящие в состав слогов, были действительно произнесены, что видно по изменениям кривой частоты (средняя строчка). Частотные колебания этих звуков расшифрованы подписями. Форма периодов колебаний одинакова в обеих записях и читается легко, в особенности в подлиннике, при большем масштабе. Таким образом, можно утверждать, что некоторые речевые звуки, хотя и были произнесены, но не образовали слогов. 1 В представленных здесь фото промежутки между слогами срезаны для экономии места. Из этого наблюдения вытекают два вывода. Во-первых, следует допустить, что существует специальный орган слогообразования и сло-•годеледая, не совпадающий с органами, артикулирующими отдельные звуки речи. Во-вторых, слоговые модуляции могут иметь как разную положительную силу, так и переходить в нулевую величину. Последнее явление следует рассматривать как одно из средств динамической выразительности речи. При сглаживании слоговых различий в одной части фразы слоговые выделения в другой ее части, даже незначительные по абсолютной величине, приобретают в соотношении с нулем значительный вес. Это явление, возникающее, надо думать, вследствие специфической инерции слогоделительного прибора, значительно большей, чем инерция языковой артикуляции, санкционируется как нормализованное.средство выделения и ослабления значимых элементов сообщения.
Сглаживание слоговых модуляций вплоть до нуля следует рассматривать как сжатие динамического диапазона речи. Это положение подтверждается анализом только что приведенных записей (рис. 13 и 14)..Для записи интенсивности в данном случае был выбран прибор, кото-•рый учитывает динамические колебания не в логарифмических единицах, •а в линейном масштабе. Это значит, ч!то при значительных колебаниях динамического уровня игла прибора дойдет до своего «потолка» и вместо подъема будет чертить горизонтальную прямую. Динамические колебания в громкой речи могут доходить до 30—40 дб, что соответствует в линейном измерении увеличению больше чем в 200 раз. Если минимальный подъем иглы нашего рекордера был 2—3 мм, то максимальный достигнет больше полуметра. На такой большой подъем игла этого аппарата не рассчитана, да и на ленте сферического кимографа такая кривая вышла бы за пределы окружности. Имея это в виду и обращаясь к записям (рис. 13), мы видим, что при слогораздельном произнесении записывающая игла действительно дошла до «потолка», так как после крутого подъема она идет горизонтально на пределе своего подъема, Иная 'картина обнаруживается ' на другой записи (рис. 14). Здесь игла не дошла до «потолка», продолжая колебания. Это значит, что, при одинаковой разборчивости обоих произнесений, в слогораздельном варианте было значительно меньшее сжатие динамического диапазона, чем в слитном произнесении. Очевидно, что в последнем случае сжатие динамического диапазона произошло не в записывающем приборе, а в самом произносительном аппарате. Таким образом, речевой прибор работает лишь в определенных сжатых пределах.динамического диапазона. Следует признать, что при регулировке громкости речи действует механизм экстремального управления, т. е. управления по минимуму и максимуму. Громкость речи не спускается.ниже определенного динамического уровня и не поднимается выше максимального уровня. В дальнейшем будет показано, в чем конкретно состоит оборудование этого механизма в речевых эффекторах. Вполне понятно, что и/акустическая разномощность звуков речи зависит от особенностей оборудования этого механизма.
На основании приведенного в этой главе материала может быть сформулировано общее положение о соотношении акустического сигнала и несомого им сигнального значения. Речевой звук есть величина переменная. Изменяясь в системе слога по двум осям х — у в двух фазах, он в первой фазе приобретает постоянное акустическое значение форманты, во второй фазе — постоянное сигнальное значение фонемы. Переход от одной фазы к другой,т.е. от одной аналитико-синтетической системы к другой, осуществляется путем переменной сигнализации. Это положение может быть разъяснено так. Если по оси у отложить звуки речи данного языка, а по оси х — ступени квантования их мощности, то всегда может быть найдено постоянное акустическое значение каждого из звуков при заданной мощности.Так как каждый звук речи работает то на полную, то на ослабленную в разной степени мощность, то всякий раз меняется и спектр звука. Практически определение постоянного значения заключается в том, что должен учитываться не только спектр, но и ступень, или номер, квантования. В результате такой операции находится серия формант данного звука речи. Однако для того, чтобы эти акустические сигналы приобрели фонемные и словесные значения, необходима вторая фаза процесса, в которой происходит отбор звуков и слоговое квантование. Если, как в приведенных выше кривых, по оси у отложить только те звуки, которые по норме входят в состав данного слова, а по оси х отложить ступени слогового квантования, т. е. сильные и слабые слоговые позиции, заданные также по норме, то будут найдены два постоянных сигнальных значения — сло-воразличающие фонемы и звуковая структура слова, несущая предметное сигнальное значение. Отбор звуков будет различать слова по звуковому спектру, а слоговые по!зиции явятся признаками узнавания слова. Необходимость двухфазного развития этого процесса обусловлена тем, что в нем происходит двойной переход в анализе и синтезе: от элементов к целому и снова от этого целого, ставшего элементом, k новому целому. Такой переход возможен лишь через переменную сигнализацию. Речевой звук в составе множества его элементов, как только он определяется в точке (пересечения осей х<—у, становится целым, t. e. определенной формантой. Но он еще не имеет предметного сигнального значения до тех пор, пока во второй фазе не войдет в состав определенного слова с его определенным предметным сигнальным значением. В этот момент перехода речевой звук перестает быть целым, и сам становится только элементом слова. Вследствие этого прежний состав элементов звука может в процессе квантования быть заменен другим составом элементов, если целое (самый звук) продолжает выполнять прежнюю сигнальную функцию фонемы, т. е. как элемент находится на определенном месте слова, например в его корне, приставке, суффиксе или в окончании. Так второй звук а в слове вода выполняет ту же функцию, что и второй звук о в слове воды. Можно сказать даже Вот так, в-а-а-а-а-а-да, и все равно этот чрезвычайно изменный звук а-а-а-а будет выполнять для различения этого слова от других такую же функцию, как и о. Полная перестройка звука в его элементах и замена целого ряда этих элементов не играют роли для различения этого слова, например в слове гада (года), но необходимы для нормативных • слоговых перестроек слова. Слово является грамматически и фонетически оформленным. А это значит, что постоянные (фонемные) значения его переменных к — у определяются в процессе анализа и синтеза всех меняющихся форм слова, включая сюда как морфемные, так и произносительные интонационные формы. Если предметное значение слова вообще сохраняется, то как бы ни изменялись звуки в процессе их квантования, постоянная функция словоразличения, свойственная этим звукам, также сохраняется. Одно идет в счет различения слов, другое — в счет узнавания и понимания выразительных перестроек. Особый интерес представляет то обстоятельство, что выразительные перестройки слова могут изменить всю его звуковую структуру, и все-таки слова продолжают различаться и узнаваться. Возможность этого обусловлена тем, что новые фразовые перестройки звуков речи и слов подкрепляются новыми сигнальными значениями. Материал по этому вопросу будет представлен в следующем параграфе. § 23. СЛОГОВЫЕ ПЕРЕСТРОЙКИ В ФРАЗЕ Приведенные в предшествующем параграфе записи слоговой динамики отражали, так сказа'ть, лабораторную, искусственную речь. По специальному отбору произносились отдельные слова разными дикто- -оами. Но отдельно произнесенное слово вне всякого контекста и вне ситуации не составляет сообщения и не является речью. Приведенный в том же параграфе пример фразового произнесения был также искусственным. Слова этого примера объединялись лишь внешними акустическими средствами и также произносились вне ситуации. Все это было необходимо для того, чтобы заметить наиболее элементарные слоговые перестройки в отдельных нормативно произносимых словах. Представленный материал показал, что любой звук речи квантуется. Но так как шкалы квантования их различны, то только некоторые из звуков речи (гласные), обладающие способностью максимально и равномерно нарастать в дуге громкости и/падать, становятся слогообразующими. После установления элементарных положений появляется возможность расшифровать весьма сложную структуру динамических записей живой разговорной речи. Проведение аналитических записей динамики живой речи встречает методические затруднения и поэтому обычно не осуществляется. Так как живая речь разнообразна по отбору слов, то даже при удаче записи сравнение слоговых перестроек на разном лексическом материале не показательно. Произнесение же специально найденных или составленных и заученных диктором фраз или чтение по тексту резко отличаются от живой речи, так тесно связанной с ситуацией разговора. В этих условиях может возникнуть только чтецкая, а не разговорная интонация. Кроме того, возможны смысловые интонационные разночтения, которые трудно предусмотреть, если читаемый отрывок или фраза взяты в ограниченном контексте. Анализ же читаемого произведения в целом вносит еще более значительные сложности в толкование отдельно произносимой фразы, даже если диктор и экспериментатор постараются об этом договориться. Поставленная задача аналитической записи живой -речи должна быть решена достаточно надежным и относительно простым способом в 'такой мере, чтобы ценность конечного результата была гарантирована практикой жизни. Таким способом является запись сценической речи. Если заданная актеру ситуация совершенно проста, элементарная задача не осложняется сверхзадачей (т. е. созданием -сквозного действия и образа), а текст ограничен несколькими словами, то осуществление всего этого вполне доступно профессиональному актеру. В своей ежедневной работе он выполняет задачи значительно более трудные и сложные. Вместе с тем конечный результат, т. е. образец типичной разговорной речи, различной в разных ситуациях общения, гарантирован практикой театрального искусства. Театральный зритель принимает речь со сцены как живой разговор действующих лиц. Для наш!их записей были привлечены высоко-квалифицированные, опытные айтеры по два из трех московских театров (Художественного театра им. А. М. Горького, театра им. Евг. Вахтангова и Театра кукол, руководимого С. В. Образцовым). Сравнение произнесений актеров из разных театров позволяло элиминировать некоторые различия направлений, естественно присущие каждому из этих театров. Для записи было составлено 9 сценарных эпизодов. Постоянная экспериментальная фраза Сколько это стоит была окружена меняющимся текстом, соответственно изменяющейся ситуации разговора. Сущность ситуации находится из переменной лексики и всего контекста. Задача записей заключалась только в том, чтобы определить особенности слогового квантования в фразовых перестройках живой разговорной речи; специальные вопросы сценической речи в этом параграфе не обсуждаются. Приведенные ниже графики, отражающие динамику произнесения, расположены по порядку номеров сценарных ситуаций. Полный текст каждой ситуации следующий. 1. — Я возьму эту книгу. Сколько она стоит? — Сто рублей. — Как?! Сколько это стоит? Так дорого?. 2. — Я возьму эту книгу. Сколько она стоит? — Пятнадцать копеек. — Как! Сколько это стоит? Так дешево? 3. — Ну, как ваш экзамен? Сдали? — Да, сдал (ла). Но (иногда А) сколько это стоит, если б выг знали! Сколько труда и бессонных ночей! 4. — Ну, как ваш экзамен? Сдали? — Сдал (ла). А (иногда Ну) сколько это стоит — пустяки! 4 5. — Я возьму эту книгу. Сколько она стоит? — Сто пятьдесят рублей. — Как!? Вы с ума сошли! Сколько это стоит? 6. — Я возьму эту книгу. Сколько она стоит? — Пятнадцать копеек. — Как! Я вас спрашиваю серьезно, сколько это стоит? (В подтексте ситуации № 6 предполагается, что продающий посмеивается над покупателем и называет ему явно ничтожную цену за покупку). 7. — Почему Вы ко мне не приходили? Я вас ждал (ла). — У меня был экзамен. — Э, пустое! — А сколько это стоит, если б вы знали, сколько труда и бессон* ных ночей! 8. — Я очень хочу пойти на спектакль. — Охотно верю, но я беспокоюсь о вас. Ведь у вас скоро экзамен, вам нужно готовиться. — Какие пустяки! Ну сколько это стоит — сда'ть экзамен! 9. Нейтральное, бесситуативное произнесение слов «Сколько это стоит». (Ситуации 3 и 4 отличаются от ситуаций 7 и 8 тем, что в последних двух случаях оценка дается как возражение на противоположную оценку первого партнера, тогда как в ситуациях 3 и 4 первый партнер не высказывает оценки). В каждом из представленных ниже графиков (рис. 15—23) совмещены все три шкалы квантования: а) по динамическому уровню в децибелах (на графиках — сплошная линия); б), по времени в секундах (на горизонтали); в) по движению основного тона в центах (только для экопериментальной фразы; на графике это обозначено пунктиром). Пересчет частоты звуковых колебаний сделан с точностью до первого знака после запятой. Отнесение в график делалось по ближайшему интервалу темперированного строя, например соотношение в 315,6 цента приравнивалось к малой терции, т. е. 300 центам. Начальный тон отмечался по абсолютной величине в герцах, приравнивался к нулю центов и обозначался на уровне нулевой линии. Таким образом, подъем звуковыеотной кривой (пунктир) на определенное число центов обозначает, повышение основного тона от уровня начального, а опускание кривой ниже нуля (обозначается со знаком минус) указывает на падение тона от того же уровня. Кроме того, видны и внутренние интервалы. Такого рода графическое изображение делает сравнимым весь материал, произнесенный разными мужскими и женскими голосами на разных абсолютных высотах начального тона отсчета. Нередко графики, составляемые в фонетических исследованиях при изучении интонации, в которых шкала строится по абсолютному числу колебаний в герцах, сильно затрудняют сравнение материала, произнесенного разными голосами на разных начальных уровнях. Обратимся к рассмотрению графиков. Буквы К.; Б.; Гер.; Горн.; М.; Гр. являются начальными буквами фамилий актеров. Прежде всего T"~ присмотримся к колебаниям динамического диапазона. Число децибел дано не от порога слышимости, поэтому можно устанавливать лишь сравнительные соотношения графиков, имея в виду приросты интенсивности, что и входило в задачу записи. Видно, что ни в одном из граои-??Вг ВоЖНТ/°ЛебаШЙ динамического диапазона не превышают 17,5-20 d& В большинстве случаев одна вершина превосходит другую на 10-12 об. В некоторых графиках диапазон сужен до 5 дб Таким образом общий диапазон «больших волн» интенсивности сжат в среднем до 15 дб. На этих «несущих больших волнах» часто возникают вторичные, дополнительные подъемы и опускания интенсивности Так дб 1сек 2сек Зсек гноям/ /тешил К 1C 7,5 5
1сек. Зсек, Гер. Центы 1400 1200 1000 800 600 400 200 285?рц.О 1сек 2сек Зсек 4 сен 7,5 сколько зто cmoun оит Горн. - Рис. 15. Запись интонации шести актеров ' СИТУАЦИЯ 1 например, на графике актера Гер. (сит. 3) появилось три подъема, соответствующих двум словам, состоящим из четырех слогов Сколько это. Слово стоит образовало в первой части самостоятельную большую вершину, без слогового деления; в конце же это слово слилось с началом следующей синтагмы если б (вы знали]. На графике К. (сит. 3) слова А сколько это стоит образовали только две большие «внутренние», т. е. связанные друг с другом, вершины. На графике Б. (сит. 3) а образовало отдельную вершину на подъеме общей дуги интенсивности; слова это стоит отделились и вместе со словами если б вы знали образовали ниспадающую дугу для всей синтагмы. На графике Гр. (сит. 5) во второй самостоятельной большой вершине звук с в слове сколько образовал особую малую дугу. Это значит, что относительно маломощный согласный с был в этот момент значительно усилен и подошел к грани слогообразования. Каждое из слов сколько и это. разделилось на два
1200 1000 800 500 400 200 466грц.О до 7,5 5х '2,5 1сек 2сек Зсек Сколько стоит < К Гер Центы то 1000 500 600 400 200 дб. M №2 "*________¥ Л_______. 2сек Зсек 4сек 10 7,5 •5 2,5 M ~1сек 2 сен Зсек это стоит Го Центы то 1600 1400 1200 1000 800 Ш 4ОЗ 200 Горн №2 117грц.О Рис. 16. Запись интонации шести актеров СИТУАЦИЯ 2 слога, тогда 'как в ряде других случаев в этих условиях не только пропадают слоги, но и оба слова сливаются в общую дугу- (Так, в графике Б. (сит. 5) выделилось с, но слово это расположено по малой ниспадающей дуге первой'вершины и сливается со словом сколько). В графике М. (сит. 5) звук с также выделился, но слово сколько образовало одну всфшину, а слово это дало две вершины, слово стоит значительно снк- т зилось по интенсивности. Это явление вполне понятно: о и и не отделяются согласными, при этом о более мощно, чем и, в результате слог иг, как маломощный, не образовал особой вершины. Однако в графике Гр. (сит. 6) слово стоит дало все же две малые вершинки. Первая из них относится за счет усиления с и перерыва на г, звуки же о и и, находящиеся в разных слогах, слились в одну вершину. В дальнейшем мы увидим, что глоточный резонатор при произнесении и действительно дает очень малую слоговую модуляцию по сравнению с другими гласными. В том же графике Гр. (сит. 6) фраза Я спрашиваю серьезно записалась как одна общая раздельность с тремя разными малыми вершинами, на которых в свою очередь появились мелкие слоговые вер- KN*3 Центы Гер№3
Центы 800 600. 400.Л
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|