Сенсорно- перцептивные пюцессы 1 глава
г Структура главы: 3.1 Пространство и время восприятия 3.1.1 Зрительная пространственная локализация 3.1.2 Восприятие движения и времени 3.1.3 Перцептивные взаимодействия и маскировка 3.2 Взлет и падение «иконы» 3.2.1 Иконическая память 3.2.2 Эхоическая память 3.2.3 Микрогенез как альтернатива 3.3 Распознавание конфигураций 3.3.1 Традиционные психологические подходы 3.3.2 Влияние нейронаук и информатики 3.3.3 Роль предметности и семантический контекст 3.4. Восприятие и действие 3.4.1 Сенсомоторные основы восприятия 3.4.2 Уровни восприятия 3.4.3 Развитие и специализация восприятия 164 Изучение восприятия началось с описания перцептивных иллюзий и явлений константности, то есть относительной независимости воспринимаемых параметров объектов — положения, ориентации, размера, цвета и т.д. — от физических условий стимуляции. Это позволило в 19-м веке выделить данную область как отличную от сферы интересов оптики и акустики. Гештальтпсихологи Вертхаймер, Кёлер и Коффка описали затем эффекты перцептивной организации, подчеркнув, что восприятие имеет собственные закономерности и не сводится к памяти и мышлению. К началу когнитивной эпохи в области восприятия сосуществовало два основных подхода. Для первого — непрямого или конструк тивистского — исходной осталась задача интерпретации ощущений. Поскольку ощущения как проксимальные отображения объектов явно аконстантны, исследователи вынуждены были постулировать процессы их внутренней коррекции с помощью памяти или мышления, например, гельмгольцевских «бессознательных умозаключений». Точку зрения прямого восприятия сформулировал в середине 20-го века ученик Коффки Джеймс Джером Гибсон. Он описывал восприятие как процесс сбора информации о дистальных объектах, осуществляемый с помощью локомоций и предметных действий. Получаемая при этом Информация адекватна объектам и не требует коррекции.
Первые модели переработки информации человеком в когнитивной психологии имели конструктивистский характер. Их неизменным компонентом были блоки «иконической» и «эхоической» памяти, содержание которых выполняло роль зрительных и слуховых ощущений. Не случайно один из авторов, много сделавший для объяснения восприятия, писал в эти годы: «Безусловно, Гельмгольц почувствовал бы себя на знакомой почве, посети он нас после 80-летнего отсутствия» (Epstein, 1977, IX). Когнитивное сообщество вначале игнорировало последователей Гибсона с их лозунгом «Не спрашивай, что внутри твоей головы, а спрашивай, внутри чего твоя голова». Затем ситуация изменилась. Для решения практических задач пришлось перейти к изучению восприятия в естественной среде и в условиях подвижности наблюдателя. Эта среда стала интенсивно изучаться и моделироваться, в результате чего возникла технология виртуальной реальности. Были выявлены группы нейрофизиологических механизмов, в различной степени зависящие от ситуации и от наших представлений о ней. Складывается впечатление, что сторонники альтернативных подходов пытались описать процессы, разворачивающиеся на разных эволюционных уровнях восприятия. 3.1 Пространство и время восприятия 3.1.1 Зрительная пространственная локализация Среди других перцептивных процессов восприятие пространства выделяется множественностью (избыточностью) своих операций, а также тем, что оно специально настроено на функционирование в нормальных условиях жизнедеятельности: стабильности большинства предметов, независимости их размеров от расстояния до наблюдателя, продолжения существования предмета, частично или полностью вышедшего из поля зрения, и т.д. Легкость, с которой воспринимаемые пространственные отношения определяются искусственными, но экологически правдоподобными стимульными ситуациями, неоднократно давала повод для сравнения механизмов восприятия пространства с изученными этологами врожденными механизмами, запускающими видоспецифи-ческие формы поведения. С этой точки зрения, восприятие пространства могло бы служить примером модулярной системы (Fodor, 1983), если бы не его высокая пластичность и интермодальность, которые явно противоречат некоторым из критериев модулярности (см. 2.3.2 и 3.4.3).
Наиболее известным примером восприятия пространства является бинокулярное восприятие глубины. Джордж Беркли, а затем Герман Гельмгольц дали классическое объяснение этому процессу, основанное на допущении возможности субъективного отображения и интерпретации проксимальной стимуляции. Согласно этой конструктивистской трактовке, восприятие глубины начинается с того, что мы отмечаем различия — диспаратностъ — монокулярных ретинальных изображений, обусловленные несовпадением положений левого и правого глаза в пространстве. Затем на основании этих видимых различий, положений отображений на сетчатке и знаемого расстояния между глазами вычисляется (этап «бессознательных умозаключений») относительная удаленность различных участков сцены. Важным вкладом в психологию восприятия стали работы американо-венгерского исследователя Белы Юлеза (например, Julesz, 1995), доказавшего возможность бинокулярного восприятия глубины в ситуации, когда это классическое объяснение не работает1. Идея его методики возникла из практики аэрофотосъемки и стереоскопического анализа участков земной поверхности, используемых для определения рельефа местности и при поиске замаскированных объектов. На рис. 3.1 показан пример созданных Юлезом случайно-точечных стереограмм. Для создания стереограмм использовалась матрица размером 100x100, ячейки которой случайно заполнялись с вероятностью 50%. Обе стереограм-мы идентичны за исключением небольшого центрального участка квад- 1 Самые первые демонстрации этого рода были проведены советским исследователем
Рис. З.1. Пример случайно-точечных стереограмм из работ Юлеза и схематическое пояснение способа их построения. ратной формы, который несколько смещен в сторону в одной из них. Из-за бесконтурности изображений и совпадения статистических характеристик текстур увидеть этот диспаратный участок при обычном рассматривании стереограмм практически невозможно. Однако если они предъявляются с помощью стереоскопа, независимо левому и правому глазу, мы сразу видим участок квадратной формы, выступающий из окружающего фона2. Если поменять правое и левое изображения, то, в соответствии с заменой знака диспаратности, объект воспринимается как находящийся за поверхностью фона, дальше от наблюдателя. Восприятие глубины, следовательно, оказывается возможным, несмотря на отсутствие объектов или контуров, которые можно было бы увидеть в монокулярных полях зрения. С традиционной, конструктивистской точки зрения, восприятие объектов или, по крайней мере, контуров в монокулярных полях зрения является предпосылкой бинокулярного восприятия пространства. В случайно-точечных стереограммах порядок событий оказывается прямо противоположным — пространственная локализация служит 166 2 Здесь, правда, возможны индивидуальные различия. Примерно у 7% людей наблюдаются те или иные врожденные дефекты стереопсиса, причем, как и в случае нарушений цветовосприятия, они затрагивают в основном мужскую часть населения. предпосылкой идентификации объектов. Кроме того, восприятие глубины в подобных стереограммах требует значительно менее выраженных перепадов яркости (меньшего контраста), чем восприятие формы. Поэтому типичными оказываются ситуации, при которых пространственная удаленность объекта оценивается правильно, но его форма еще не может быть определена: он воспринимается как аморфное «нечто».
Каждая поверхность в зависимости от ее материала отражает специфический рисунок распределения света. Поэтому для зрительного выделения объекта в пространстве необходимо наличие зернистости — текстуры — в видимом окружении. Если внутри некоторой области нет обладающих определенной зернистостью рельефов яркости, то она воспринимается как пустое отверстие, не мешающее проникновению за его границы3. Значение текстур для восприятия в особенности подчеркивал в своих работах Джеймс Дж. Гибсон. Результаты Юлеза показывают, что восприятие пространственного положения основано не на интерпретации ощущений, а на автоматических процессах параллельной обработки (кросскорреляции) текстур. Как можно описать подобные процессы? Для чисто формального описания можно воспользоваться, например, подходом американского психофизика У. Юттала (Uttal, 1975), который разработал автокорреляционную модель обнаружения присутствия точечных конфигураций на фоне динамического шума. Автокорреляционная функция определяется степенью перекрытия копии текстуры с исходным ее вариантом при сдвигах копии относительно вертикальной и горизонтальной осей. При высокой степени перекрытия, вызванной регулярностью конфигурации, на графике автокорреляции появляются пики. Успешность обнаружения конфигураций, согласно данным У. Юттала, хорошо описывается следующим показателем: F = [ii(AxA)/dj]n (И), 1=1 j=l
где At — амплитуда 1-го пика, А — амплитуда у-го пика, d — евклидово расстояние между двумя пиками, а и — общее число пиков. Для описания процессов параллельной обработки случайно-точечных стереограмм юлезовского типа автокорреляционный процесс может быть заменен 3 Речь идет в основном о перепадах яркости, а не цвета. Ученица Коффки Сузанна
точно такой же кросскорреляцией текстур в левом и правом монокулярных полях зрения при их взаимных сдвигах относительно горизонтальной оси. Результатом будет обнаружение и определение степени сдвига повторяющегося диспаратного участка. Для оценки нейрофизиологической реальности таких процессов следует упомянуть еще одну важную линию исследований. В 1970-е годы, в исследованиях восприятия получили распространение теории, основанные на предположении, что зрительная система проводит Фурье-анализ ретинального изображения, то есть выделяет в его составе синусоидальные компоненты разной пространственной частоты и амплитуды. Фурье-анализ изображений основан на использовании теоремы, доказанной в 1822 году французским математиком и физиком Жаном Батистом Фурье. Согласно этой теореме, любая аналитическая функция может быть приблизительно описана как сумма некоторого числа синусоидальных компонентов, отличающихся частотой, амплитудой (контрастом) и фазой. В случае двумерных распределений яркости (к ним может быть отнесено ретинальное изображение) к этим трем параметрам добавляется ориентация соответствующих синусоидальных решеток. Эти идеи, как и представления о корреляционном анализе частот, первоначально возникли в области анализа механизмов слухового восприятия. Несмотря на ряд трудностей (например, таких, как проблема сохранения информации о фазе), в рамках этих моделей удается описать процессы детекции акустических и зрительных стимулов типа синусоидальных и производных от них решеток. Наличие в зрительной системе нейронов, селективно чувствительных к различным пространственным частотам изображения, подтверждается большим числом данных (Brace, Green & Georgeson, 2003). Эти данные свидетельствуют о том, что кросскорреляционная обработка текстур, лежащая в основе бинокулярного восприятия глубины, по-видимому, осуществляется только в перекрывающихся по пространственной частоте участках спектра. Иными словами, используя для областей фигуры и фона каждой из предъявляемых одновременно стерео-грамм текстуры различной степени зернистости (то есть материал с разной пространственной частотой), можно создать ситуацию, обратную опытам Юлеза — диспаратные объекты сами по себе будут отчетливо видны в каждой из отдельно взятых стереограмм, но при их предъявлении независимо левому и правому глазу впечатление глубины будет полностью отсутствовать. Следовательно, постулируемая классическим, конструктивистским подходом возможность феноменального восприятия объектов или, по крайней мере, контуров в монокулярных полях зрения не является ни необходимым, ни достаточным условием бинокулярного восприятия глубины. Стереопсис (или бинокулярный параллакс) — лишь один из множества механизмов перцептивной оценки глубины и удаленности. Среди них есть и другие, столь же базовые механизмы, как бинокулярный параллакс, причем они явно присутствуют и у многих животных, не обладающих бинокулярным зрением из-за отсутствия фронтального расположе-168 ния глаз. К таким механизмам относится детекция параллакса движения
Рис. 3.2. Два примера градиентов величины и плотности: А. Уходящая вдаль поверхность; Б. Поверхность, глобальное расстояние от участков которой до наблюдателя не меняется. (различия угловой скорости объектов в зависимости от их удаленности при движениях самого наблюдателя), перекрытия объектов (при этом фактически используется факт продолжения существования предметов, частично вышедших из поля зрения), воздушной перспективы (низкий контраст и голубоватая окраска далеких объектов), распределения света и тени (здесь для оценки знака рельефа поверхностей используется информация об актуальном или типичном положении источника света), а также градиентов величины и плотности элементов текстуры (см. рис. 3.2). Наконец, к этой же группе базовых биопсихологических механизмов, по-видимому, относятся аккомодация и вергентные движения глаз (см. 3.4.1). Учет вергентных движений существенен для калибровки оценок удаленности, так как в зависимости от степени конвергенции одной и той же диспаратности будут соответствовать различные значения глубины (это последнее утверждение время от времени ставится под сомнение — см. Logvinenko, Epelboim & Steinman, 2001). Перечисленные выше механизмы восприятия глубины и удаленности имеют различное значение внутри разных «срезов» эгоцентрического окружения наблюдателя. В одной из классификаций (Cutting, 2003) предлагается рассматривать три вложенные друг в друга и довольно приблизительно очерченные сферы: персональное пространство (personal space), пространство действия {action space) и воспринимаемое пространство {vista space). Механизмы перцептивной обработки конвергенции и аккомодации работают практически только внутри персонального 169 пространства (1—2 м), тогда как признаки перекрытия, гибсонианских фадиентов и воздушной перспективы эффективны во всем диапазоне еще воспринимаемого человеком окружения, то есть при идеальных условиях наблюдения (подходящий угол и интенсивность солнечного освещения, соответствующие по размерам объекты и чистый горный воздух) примерно до десяти километров и, если очень повезет, даже несколько больше. Наряду со всеми этими механизмами имеются признаки глубины и, соответственно, процессы их перцептивной детекции и обработки, носящие выраженный культурно-исторический характер. Все они, без какого-либо исключения, используются для решения задачи передачи и интерпретации глубины в двумерных изображениях. Следует отметить, что различные культурные традиции интерпретации глубины опираются на отдельные аспекты более базовых нейрофизиологических механизмов. Эта ситуация в известной степени аналогична соотношению процессов цветонаименования и физиологических механизмов восприятия цвета, где историческое развитие соответствующей области лексикона постепенно выявляет более фундаментальные механизмы нейрофизиологического кодирования информации о цвете, основанные, например, на контрастировании оппонентных цветов (см. 8.1.2). Наиболее известным из числа таких «вторичных признаков глубины» является линейная перспектива, использующая работу механизма выделения градиентов величины и плотности. Теория линейной перспективы была разработана и почти канонизирована европейским Возрождением. Тем не менее большие художники никогда не следовали ее предписаниям буквально, учитывая константность величины и формы, то есть относительную независимость воспринимаемых размеров и очертаний предмета от его удаленности и ориентации в пространстве. Кроме того, даже следуя законам линейной перспективы, художники вводили в построение картины несколько систем перспектив, соответствующих различным точкам зрения (этот прием начал применять Джотто, 1266—1337). В традиционной китайской и японской живописи, не знающей линейной перспективы, основными приемами передачи удаленности являются имитация воздушной перспективы (передача удаленных объектов более блеклыми и голубоватыми цветами) и так называемой параллельной перспективы (варьирование положения на вертикальной оси: чем выше расположено изображение объекта на плоскости, тем больше его подразумеваемая удаленность). Размеры изображенных предметов при этом могут не меняться, как и должно было бы быть при 100% константности. В византийских и древнерусских иконах общим случаем является даже обратная перспек тива, при которой размеры изображений объектов увеличиваются с предполагаемой удаленностью4. 4 Причины подобной «сверхконстантности» как раз в случае иконописи остаются не вполне понятными (Раушенбах, 1980). Возможно, разгадку обратной перспективы следует искать скорее в особенностях зрительной памяти и воображения, чем собственно восприятия. При возникновении последовательных образов, а также в случае так называемой эйде тической памяти (см. 5.3.1) размеры представляемых объектов увеличиваются при увели-170 чении их предполагаемой удаленности. Такая зависимость называется «законом Эммерта». Таблица 3.1. Основные признаки глубины и удаленности, эффективные в процессах зрительного восприятия
Перечисление основных признаков восприятия глубины и удаленности, используемых при зрительном восприятии пространства, дано в табл. 3.1. Как видно из таблицы, значительное большинство этих признаков может использоваться в монокулярных условиях. При этом вне зоны ближайшего пространственного окружения (пространство действия с включенным в него персональным пространством), где возможно непосредственное сенсомоторное взаимодействие с предметами, зрение выделяет скорее относительную информацию о взаимной удаленности объектов. За пределами этой зоны (все еще воспринимаемое пространство, vista space) абсолютные оценки удаленности объекта помогает выносить опора на память, то есть на знаемые размеры предметов и известную (привычную) удаленность ориентиров. Нако-1 нец, выделяемая стереозрением информация носит как порядковый (например, в случае очень мощного признака перекрытия поверхностей), так и количественный, метрический характер (бинокулярный параллакс). 171 Второй классической проблемой восприятия пространства является стабильность видимого мира. Дело в том, что оценка видимого направления не меняется при движениях глаз (и даже несколько улучшается при их наличии). Под движениями глаз в данном случае имеются в виду саккады — чрезвычайно быстрые, до 800°/с, скачки, переводящие глаза в новое положение для фиксации, то есть относительно неподвижное состояние, во время которого и осуществляется сбор сенсорной информации (см. 3.4.1). В среднем глаза совершают от 3 до 5 саккадических скачков каждую секунду, свыше 160 000 раз в течение каждого дня нашей жизни (мы не принимаем при этих подсчетах во внимание движения глаз во время так называемой REM -фазы сна). Возникающие во время саккад перемещения проекции объектов по сетчатке не воспринимаются нами и не ведут к ошибочным оценкам положения этих объектов в физическом окружении. Подобная стабильность видимых направлений представляет собой один из первых описанных в литературе феноменов восприятия, известный уже Аристотелю. В 19-м веке были сформулированы два основных объяснения, с небольшими вариациями встречающиеся в нейро-и психофизиологии до сих пор. Эрнст Мах предположил, что коррекция зрительного восприятия осуществляется на базе проприоцептив-ной информации, поступающей от рецепторов глазных мышц. Гельм-гольц выдвинул несколько более сложную гипотезу, согласно которой каждое произвольное движение глаз сопровождается прогнозом изменений зрительной стимуляции. Сравнение этого прогноза, связанного с эфферентной командой (или, в современной терминологии, «эфферентной копии»), с сенсорной ситуацией после осуществления движения («реафферентацией») позволяет судить о том, произошли ли в окружении за время саккадического скачка глаза какие-либо фактические изменения. Возможность проверки этих предположений связана с обездвижением глаз. С точки зрения теории эфферентного прогноза, но не про-приоцептивной коррекции, в такой ситуации можно ожидать иллюзорных скачков видимого мира при каждой попытке посмотреть в сторону. В последние десятилетия несколько исследователей попытались проверить эти классические гипотезы путем внутривенного введения себе яда кураре. Это вещество селективно блокирует нервно-мышечную передачу импульсов, временно вызывая паралич мышц тела. Система мышц, вращающая глазное яблоко в орбите, отключается при этом в последнюю очередь, поэтому такие опыты можно проводить лишь в клинических условиях, с использованием аппарата искусственного легкого. Полученные результаты свидетельствуют об отсутствии иллюзорного движения и скачков объектов в зависимости от интенции двигать глаза, и, следовательно, они не подтверждают гипотезу об активном прогнозе обратной афферентации как основе видимой стабильности (Matin, 1986). Одно-172 временно в независимых экспериментах было показано, что проприоцеп-ция от мышц недостаточно точна, а главное, слишком медленна, чтобы ее можно было полноценно использовать для корректировки восприятия при саккадических движениях глаз. Поэтому в целом не подтверждается и альтернативная гипотеза проприоцептивной коррекции. Не все авторы считают оправданным столь интенсивный интерес к стабильности видимого мира. Для Гибсона и его последователей (а ранее, конечно, и для гештальтпсихологов) — это всего лишь псевдопроблема. Зрительное восприятие, с их точки зрения, направлено на поиск инвариантных характеристик оптического потока. Воспринимаемое направление определяется при этом относительным положением объекта в окружении, которое не меняется при движениях глаз. Несколько иное объяснение предложил в начале 1970-х годов Дональд М. Маккай. По его мнению, в относительно стабильном мире стабильность положения большинства объектов автоматически принимается организмом в качестве «нулевой гипотезы», которая сохраняется до тех пор, пока не будет получено убедительных доказательств обратного5. Но стабильность видимого мира не удается списать со счета просто так, как нечто само собой разумеющееся. Прежде всего она не сохраняется при нарушении в работе вестибулярных функций и, например, при алкогольном отравлении. Кроме того, с конца 1980-х годов стали широко проводиться эксперименты, в которых предъявление информации зависело от одновременно регистрируемых движений глаз. Эти эксперименты показали, что примерно в течение первых 50—100 мс после начала зрительной фиксации однозначная и устойчивая локализация быстро предъявляемых тест-объектов отсутствует. Далее было установлено, что если во время саккадического скачка осуществляются сдвиги, перестановки и даже подмена объектов, то испытуемые часто этого просто не замечают (о феномене «слепоты к изменению» см. подробнее 3.1.3 и 4.4.1). Данный факт противоречит традиционным теориям стабильности видимого мира, поскольку они предполагают существование детальной «транссаккадической памяти» — либо в форме прогноза вероятных изменений зрительной стимуляции (Гельмгольц и многие последующие авторы), либо в форме образа ситуации, который может требовать (Мах), а может и не требовать (Маккай) дополнительной интермодальной коррекции. 5 Независимость восприятия пространства от наших собственных движений под Эти данные заставляют пересмотреть взаимоотношения восприятия, памяти и сознания. Если ранняя экспериментальная психология абсолютизировала роль сознания, то когнитивная психология первоначально явно преувеличила роль памяти, заменив анализ процессов восприятия на представление о сохранении сенсорной информации в периферических регистрах — иконической и эхоической памяти. Как будет показано в следующем разделе, это представление создает больше проблем, чем решает (см. 3.2.1 и 3.2.2). Возможно, восприятие стабильного окружения вообще не связано с существованием сколько-нибудь детального, удерживаемого в памяти образа. Дело в том, что запоминание и сравнение таких массивов данных потребовало бы от зрительной системы гигантского объема собственно когнитивных ресурсов, которыми зрительная система не располагает. Вместо этого есть очень быстрые, требующие, как правило, менее 100 мс процессы пространственной локализации самих объектов. Эти процессы инициируются вновь и вновь после каждого саккадического движения глаз и, во-видимому, после каждого моргания (Bridgeman, Van der Heijden & Velichkovsky, 1994; Velichkovsky et al., 2002a).
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|