Сенсорно- перцептивные пюцессы 5 глава
На вопрос о том, достаточно ли этого разделения для описания микрогенеза, следует ответить отрицательно. Во-первых, не совсем ясны взаимоотношения между этими группами каналов. Обычно предполагается, что фазические каналы тормозят активность тонических21. В одном из обзоров процессов маскировки Бруно Брейтмейер (Breitmeyer, 1980), однако, приходит к выводу, что такое торможение является взаимным. Иконические репрезентации этот автор идентифицирует с положительными последовательными образами, причем, по его мнению, в процессах восприятия (в частности, при чтении) такие «иконы» могут лишь мешать восприятию деталей, а следовательно, должны активно 21 Взаимодействие фазических и тонических каналов служит основой распространен
подавляться22. По-видимому, зрение действительно занимается «иконоборчеством» — вывод, который предвидел уже Вундт. К тому же, разделение двух групп каналов связано, главным образом, с анализом сенсорной переработки в сетчатке и в первичных, затылочных отделах коры. Как мы увидим в дальнейшем (см. 3.4.2), восприятие вовлекает и другие структуры мозга, включающие различные субкортикальные области, а также ассоциативные зоны теменных и височных долей. 3.3 Распознавание конфигураций 3.3.1 Традиционные психологические подходы Важнейшей функцией восприятия является распознавание зрительных и акустических конфигураций, ведущее, в частности, к узнаванию предметов и их категоризации, то есть отнесению к той или иной семантической категории. Проблема механизмов распознавания, или «распознавания образов», является одной из центральных для целого комплекса когнитивных наук: психологии, нейрофизиологии, искусственного интеллекта и нейроинформатики. В когнитивной психологии ей прямо или косвенно посвящены десятки монографий и сотни статей. В дальнейшем мы будем многократно возвращаться к ее рассмотрению из перспективы исследований памяти и организации семантической информации (см., например, 5.1.1 и 6.1.2). Данный раздел посвящен сенсорно-перцептивным механизмам распознавания. Элементарной предпосылкой того, что некоторый объект вообще будет опознан, является его выделение в качестве фигуры из окружающего фона. Кроме того, при распознавании акцент лежит на индивидуальных признаках, таких как цвет поверхности и форма. Пространственно-ситуативные признаки (положение в пространстве, ориентация, движение, освещенность) выполняют при распознавании скорее технические функции — чаще всего их параметры лишь учитываются нами для того, чтобы дать инвариантную (константную) оценку индивидуальным признакам. Таким образом, можно сказать, что распознавание связано с относительно поздними стадиями восприятия, как бы «надстраивающимися» над процессами динамической пространственной локализации (см. 3.1.3).
22 Инерционность восприятия увеличивается при утомлении, когда ослаблены центральные процессы контроля. Это проявляется в увеличении продолжительности последовательных образов, усилении маскировки и снижении критической частоты слияния 208 мелькании (Леонова, 1984) В последние годы были проведены систематические исследования законов перцептивной организации, направленные на выяснение природы влияющих на выделение фигуры из фона факторов и их взаимоотношений. При этом оказалось, что динамическая локализация в пространстве служит наиболее фундаментальной основой для такого выделения. Если разные законы перцептивной организации (см. 1.3.1) конфликтуют между собой, «навязывая» разные варианты группировки видимых компонентов сцены, то победителем обычно оказывается фактор близости, причем близости в трехмерном пространстве, а не на сетчатке. Закономерное движение стимулов в трехмерном пространстве также оказывается сильнейшим фактором перцептивной организации. Если пространственно-динамические факторы нейтральны (например, когда в статичной конфигурации расстояния между элементами равны между собой), то второй по силе группой факторов оказывается глобальное сходство, определяемое такими признаками, как окраска, общая ориентация (для элементов, имеющих выраженную ориентацию) или размеры (зернистость). Только тогда, когда все эти факторы нейтрализованы, группировка начинает учитывать особенности и сходство собственно формы элементов.
Очевидное объяснение этих зависимостей состоит в том, что восприятие формы предполагает анализ уже выделенных из фона объектов, тогда как группировка основана на глобальной оценке сходства без предварительного восприятия формы образующих текстуру элементов. Эти два процесса не просто различны, но часто противоположны по чувствительности к отдельным признакам объектов. Так, хотя буквы «L» и «Т» явно отличаются по форме, образованные из них текстуры лишь с трудом отличаются друг от друга (см. рис. 3.12 справа). Напротив, небольшие вариации в наклоне «Т» практически не замечаются нами при узнавании, однако они служат хорошей основой для дифференциации соответствующих текстур (рис. 3.12 слева). Особенно важную роль в распознавании играют именно процессы спецификации и распознавания формы. Как особая, требующая специального изучения проблема восприятие формы длительное время не осознавалась представителями «импрессионистической» (Эрнст Мах) ассоциативной психологии. Гештальтпсихологи считали восприятие формы первичным фактом восприятия, подчеркивая его «вещный», или предметный, характер. Если тезис о первичности восприятия формы вызывает сегодня — на основании представленных выше данных о микрогенезе — обоснованные сомнения, то предметность действительно представляется весьма важной характеристикой этого класса перцептивных процессов, к обсуждению которой мы еше вернемся в конце этого раздела (см. 3.3.3). В психологических подходах последних десятилетий центральное место занимают формальные теории описания структуры перцептивных конфигураций. Речь идет о синтаксическом подходе: сначала выделяются отдельные элементы (признаки), из которых по определенным правилам (грамматикам) строится перцептивное описание конфигурации. Фактически в основу этого подхода положена более ранняя идея Дональда М. Маккая (МасКау, 1950), согласно которой перцептивная сложность (информативность) конфигурации определяется числом операций, осуществляемых перцептивной системой для ее спецификации (см. 2.1.3). Но характер этих элементов и операций над ними по-прежнему остается не вполне ясен23. Одна из наиболее интересных теорий такого рода развивается голландским психологом Э. Ле-венбергом и его коллегами (Leeuwenberg, 1978). Модель постулирует повторения, зеркальные отображения и другие избыточные операции с разными элементами конфигураций, иногда осуществляемые в итера тивном (повторном) режиме, то есть в ходе нескольких последовательных обращений к продуктам процесса кодирования.
Оценка сложности различных перцептивных интерпретаций используется для объяснения множества эффектов. Так, можно задать вопрос, почему на рис. 3.1 ЗА мы всегда видим два пересекающихся квадрата, хотя теоретически возможны и альтернативные варианты, частично указанные в нижнем ряду. Ответ связан с относительной простотой процесса конструирования квадрата, для которого нужно повторное использование лишь двух элементов — отрезка фиксированной 21 Джулиан Хохберг следующим образом характеризует эти исследования1 «На физиологическом и психофизическом уровнях идет лихорадочный поиск элементов сенсорного анализа (которые учитель Гельмгольца Иоханнес Мюллер назвал "специфическими энергиями органов чувств") и есть упоминания ментальных структур, к которым эти элементы должны относиться... Но если Титченер когда-то заявил, что небольшой (по сегодняшним масштабам) финансовой поддержки и пары лет работы было бы достаточно, чтобы поставить все точки над / и черточки на t его варианта ассоцианистской теории,..мне что-то не приходилось слышать таких оптимистичных заявлений в последнее вре-210 мя» (Hochberg, 1979, ρ 138).
Потенциальные интерпретации
Прозрачность
Рис. 3.13. Примеры влияния фигуративной сложности на восприятие: А. Однозначность восприятия потенциально многозначной конфигурации; Б. Эффект глубины в плоском изображении; В. Феноменальная прозрачность. длины и угла 90°. При других интерпретациях число элементов и разнообразие операций с ними возрастает. Точно так же на рис. 3.1 ЗБ нами воспринимается, казалось бы, очень сложная трехмерная конструкция, а не плоский, нанесенный на поверхность узор. В действительности, с учетом высокой избыточности компонентов (они показаны справа), трехмерная интерпретация оказывается более простой, чем двумерная, требующая спецификации множества отличающихся по ряду параметров элементов. Наконец, на рис. 3.13В слева мы видим плоский двумерный паттерн, тогда как справа похожая с точки зрения физических при-
211 знаков конфигурация распадается на две, причем та из них, которая лежит «сверху», к тому же оказывается феноменально прозрачной, позволяющей видеть детали, лежащие «внизу». Мы предоставляем читателю возможность объяснить этот феномен по аналогии с объяснениями, данными выше24. Несколько иной подход будет рассмотрен нами в конце данной главы (см. 3.4.1). В когнитивной психологии существует несколько групп моделей, или теорий распознавания. Только что рассмотренные формальные теории восприятия формы служат хорошим введением в эту проблематику. Дело в том, что наиболее распространенными в настоящее время являются теории признаков и структурные теории распознавания. Фактически они дополняют друг друга: признаки понимаются как исходные элементы, а структурные теории — как правила их объединения. Возникающие «описания» сравниваются с хранящимися в памяти репрезентациями (эталонами), и в случае совпадения происходит ассоциативная активация соответствующих узлов или областей семантической памяти. Хотя мы часто ориентируемся на отдельные признаки, особенно при поиске хорошо знакомых объектов, узнавание может происходить и на основании их более целостных комбинаций, как это подчеркивали гештальтпсихологи. В силу их чрезвычайной значимости детальной классификации были подвергнуты речевые признаки, различающие отдельные буквы и, при акустическом предъявлении, фонемы (см. подробнее 7.1.1). Один из основных признаков, различающих фонемы, называется местом артику ляции, то есть местом перекрытия гортани при произнесении звука: подъемом задней части языка к нёбу, прикосновением языка к губам или соединением губ. Оказалось, что когда в психоакустических экспериментах на одно ухо подается звонкая согласная с так называемым передним местом артикуляции [Ь] и одновременно на другое — глухая согласная со средним положением артикуляции [t], то ошибки часто комбинируют эти признаки — [р] и [d] слышатся чаще, чем [q] и [к], возможно, потому, что глухость (звонкость) сочетаются здесь с передним (либо, наоборот, более задним) положением места артикуляции. Однако такого рода аргументация наталкивается на трудности. Прежде всего, физические признаки фонем не остаются постоянными и меняются в зависимости от контекста. Далее, восприятие речи вполне возможно в 24 Данный подход можно легко распространить на слуховое восприятия. Один из результатов изучения избирательного восприятия речи («проблема вечеринки» — см. 2.2.1) состоит в том, что понимание релевантного речевого сообщения на фоне шума определяется возможностью его дифференциального описания в терминах локализации, громкости, тональности и тембра голоса собеседника. Если при восприятии музыки предъявляются короткие и сильные сигналы, замещающие участки мелодии, то последняя воспринимается непрерывной с тем большей вероятностью, чем меньше сходство ее ритмического рисунка с ритмом последовательности шумов. Иными словами, различие перцептивных описаний шумовых сигналов и мелодии делает шум акустически «прозрачным» 212 (Bregman, 1990). условиях, исключающих использование традиционных фонематических признаков (например, Remez, Rubin, Pisoni & Carrell, 1981). Стивен Лупкер (Lupker, 1979) проверил гипотезу, согласно которой восприятие букв при чтении основано на выделении признаков. Ни одна из признаковых моделей при этом не подтвердилась. Напротив, данные хорошо описывались моделью микрогенетического типа — восприятие локальных особенностей букв начинало играть некоторую роль в их различении лишь после восприятия обобщенных очертаний. Эксперименты с маскировкой слов также показали, что она оказывается особенно сильной, если в качестве маски используются буквы, а не их фрагменты. Это говорит о том, что репрезентация букв может быть наиболее дробным слоем анализа. Существенную роль в распознавании букв играет контекст — распознавание резко улучшается, если этот контекст представляет собой осмысленное слово или, по крайней мере, произносимое псевдослово (см. ниже классический эффект превосходства слова — 7.2.1). Эта закономерность играет особенно большую роль в распознавании рукописного текста, когда один и тот же графический знак уверенно воспринимается как разные буквы (например, «А» или «Н») в зависимости от контекста. Вторую группу теорий распознавания образуют так называемые теории шаблонов. Они предполагают наличие в памяти целостных репрезентаций, с которыми сравниваются столь же целостные перцептивные описания предметов и событий. Идея целостного сравнения подтверждается многочисленными результатами, свидетельствующими об ускорении опознания в случае общего перцептивного сходства тестового и эталонного объектов, а также данными Р. Шепарда и его коллег (например, Shepard & Podgorny, 1978) по мысленному вращению и другим пространственным трансформациям зрительных образов объектов в процессах узнавания (см. подробно 5.3.1 и 6.3.1). Споры вызывает, впрочем, вопрос о степени абстрактности подобных целостных репрезентаций. Первоначально преобладало мнение, что их детальность, или конкретность, зависит от времени, прошедшего с момента восприятия. Считалось, что при очень коротких интервалах сравниваются детальные репрезентации, удерживаемые в иконической и эхоической памяти, так что распознавание зависит здесь от более или менее точного пространственного (зрение) и временного (слух) наложения конфигураций. Рассмотренные нами выше данные (см. 3.2.1 и 3.2.2), а также эксперименты на так называемую транссаккадическую память (Irwin, 1996) показывают, что уже через сотые доли секунды после исчезновения изображения или смены точки фиксации в рабочей памяти сохраняется лишь относительно абстрактное описание одного-двух воспринятых объектов. Несмотря на эту сравнительно обедненную постперцептивную информацию, наша память, несомненно, умудряется строить детальные и разнообразные долговременные репрезентации осмысленных предмет ных сцен. Эти репрезентации, например, оказываются достаточными для „. „ успешного узнавания тысяч видовых слайдов через недели после их однократного показа (Standing, 1973). Важным условием при этом являются целостность и предметная правдоподобность — полностью абстрактные изображения и предметные сцены, поставленные «на голову» или расчлененные на несколько переставленных кусков, не обнаруживают и доли успешности узнавания экологически естественного материала. Интересно, что узнавание предметных сцен оказывается весьма успешным при повороте изображений относительно вертикали, не нарушающем законы гравитации (Величковский, 19826). Это свидетельствует о целостности процессов сравнения, которые явно не сводятся к поэлементному совмещению тестовой сцены и репрезентаций памяти (см. 5.2.1). В конце этого раздела мы рассмотрим новые работы, выявляющие особенности восприятия интактных предметных сцен, которые, по-видимому, объясняют также и их последующее успешное узнавание (см. 3.3 3). К группе теорий, допускающих возможность целостного сравнения, примыкают теории прототипов, согласно которым при ознакомлении с элементами некоторого множества испытуемый постепенно выделяет одну или более центральных тенденций — прототипов. По отношению к ним и решается вопрос о принадлежности конкретного объекта к данному множеству. С существованием границ между классами объектов, тяготеющим к разным прототипам, связываются обычно эффекты категориального восприятия — два незначительно различающихся в отношении физических признаков объекта, которые попадают в разные классы (категории), кажутся более разными, чем объективно более различающиеся объекты, попадающие в одну и ту же категорию. Соответственно, во втором случае можно ожидать более быстрое узнавание различных объектов как одинаковых. Такие эффекты обнаружены при восприятии фонем, назывании оттенков цвета, идентификации сложных зрительных форм и т.д. (см. 7.1.1). Формирование прототипов не сводится к абстрагированию признаков, так как можно подобрать множество объектов, не обладающих признаками будущего прототипа — в отношении различительных признаков прототип будет находиться «между» конкретными образцами. Относительно слабо изученными остаются механизмы узнавания событий и сложных трансформаций биологических объектов. Более или менее правдоподобные объяснения разработаны здесь лишь для частных случаев, например, упоминавшейся выше походки (см. 3.1.2). Особенно большое внимание уделялось исследованию узнавания наиболее важного «стимула» в нашем окружении — человеческого лица и его эмоциональных выражений. Эти результаты выявляют асимметрическую зависимость: знакомость (например, в случае фотографий известных политических деятелей) улучшает узнавание эмоционального выражения, но варьирование выражения не оказывает какого-либо однознач-214 ного влияния на узнавание лиц. Рис. 3.14. Иллюзия Тэтчер." можно сначала сравнить оба изображения при данной ориентации, а затем в нормальном и снова в перевернутом положении Изучение признаков, обеспечивающих узнавание лиц, привело и в этой области к разделению целостных (конфигурационных, связанных со взаимным положением) и локальных признаков, определяемых спецификой деталей. В отличие от восприятия обычных предметов и объектов в нашем окружении (и в отличие от процессов чтения в культурах с алфавитной письменностью — см. 7.2.1), узнавание лица в большей степени определяется именно целостными характеристиками, так что даже если в действительности речь идет об изменении некоторого локального признака, испытуемые воспринимают его глобально. Например, изменение диаметра зрачка обычно не воспринимается как таковое, а интерпретируется глобально, скажем, как увеличение привлекательности. Целостное узнавание возможно только при нормальной пространственной ориентации, как это демонстрирует иллюзия Тэтчер (по имени главы британского правительства, сократившей в свое время финансирование научных исследований). Хотя мы легко можем установить, что изображения на рис. 3.14 не совпадают между собой в деталях, мы даже отдаленно не можем себе представить, в какой степени на самом деле различаются между собой выражения этих лиц. Зависимость восприятия «внутренней геометрии» лица от его ориентации в пространстве ведет к тому, что при необычной ориентации мы, в известном смысле, становимся функционально слепыми к целостным фигуративным признакам. Эта зависимость имеет общий характер, но в случае лиц она выражена особенно сильно. Особый статус восприятия лиц доказывается существованием прозопагнозии — нейропсихологичес-кого синдрома, который связан с селективным выпадением узнавания преимущественно именно этого класса объектов. Интересно, что воз- 215 можны варианты этого синдрома, когда пациенты не могут зрительно узнавать даже своих близких родственников и знакомых, но, тем не менее, вполне успешно определяют «по выражению лица» эмоциональное состояние. Как показывают данные клинических наблюдений и мозгового картирования, эти формы восприятия, по-видимому, преимущественно связаны с нижневисочными отделами правого полушария. В нижневисочных отделах коры тоже локализуются процессы, существенные для узнавания, а также, что интересно, даже для простой детекции (Grill-Spector, 2004) других категорий сложных зрительных стимулов (см 3 3 3 и 3 4 2) Продолжительные споры относительно того, до какой степени могут быть специализированы процессы восприятия формы объектов и как это связано с межполушарными различиями, привели в последнее время к возникновению представления о своеобразной полуспециализации полушарий. Правополушарные механизмы вентрального потока переработки зритетьной информации обеспечивают целостное восприятие лиц, а также участвуют в обработке формы и узнавании повседневных предметов Однако они не вовлечены сколько-нибудь существенно в процессы восприятия формы букв (в культурах алфавитной письменности) Левополушарные механизмы, напротив, работают скорее с отдельными признаками объектов Они обеспечивают процессы побуквенного чтения и частично участвуют в узнавании повседневных предметов, но не в узнавании лиц Это предварительное объяснение подтверждается, в частности, анализом основных синдромов дислексии — нарушения чтения при локальных поражениях мозга (см 7 2 2) 3.3.2 Влияние нейронаук и информатики Многие из числа известных современных теорий распознавания опираются, как мы только что видели, на данные и модели, заимствованные из становящейся все более обширной области нейронаук — нейрофизиологии, нейропсихологии и нейроинформатики. Начало переориентации психологических описаний восприятия на физиологическую терминологию и нейросетевые объяснительные модели было положено открытием нейронов-детекторов признаков стимуляции. Особую известность получила основанная на данных микроэлектродного отведения активности отдельных нейронов модель Нобелевских лауреатов 1981 года Д. Хьюбела и Т. Визела. Согласно этой модели, на разных уровнях зрительной системы последовательно выделяются пятна, линии, углы, а затем и более сложные комбинации элементов контура («вплоть до детектора моей бабушки», как иронически заметила однажды американская исследовательница восприятия Науми Уайсстейн) Эти данные, полученные при изучении зрительной системы кура- ризированных кошек, были использованы в дальнейшем для моделиро- 216 вания различных аспектов зрительного восприятия. Если нейроны вы- деляют соединения контуров, то почему разные соединения, например типов «Y», «X», «L» или «Т», выделяются с различной частотой? Математическое моделирование описаний трехмерных сцен показало, что такие соединения могут выполнять разные функции, связанные с отнесением участков, ограниченных контурами, к одним и тем же или к разным предметам Так, особенно часто выделяемое соединение типа «Y» с высокой степенью вероятности представляет собой вершину (впадину) единого объекта с тремя гранями. Напротив, соединение «Т» скорее свидетельствует о перекрытии одного предмета другим, причем верхняя «перекладина» принадлежит перекрывающему предмету, а центральная «ось» разделяет две поверхности перекрываемого предмета. Как в таком случае быть с участками объектов, не имеющими контуров, но, тем не менее, явно демонстрирующими «телесность», подобно изображенному на рис. 3.15А торсу? Возможно, что в этом случае используется некоторое сочетание детекции пространственных частот и ориентации Участки гладких поверхностей moi ут моделироваться путем выделения овальных теней и бликов различной величины и ориентации в пространстве (рис. 3.15Б). На развитие формальных моделей распознавания в последние годы оказывают особенно сильное влияние идеи, возникшие в рамках работ
Рис. 3.15. Гладкие изменения телесных поверхностей (А) можно аппроксимировать (Б) с помощью множества овальных участков, разной ориентации (по Koendennk & van Doom, 2003) 217 218 по машинному зрению, компьютерной графике и нейроинформатике. Пожалуй, наиболее известной в психологии и за ее пределами до сих пор остается возникшая свыше двух десятилетий назад в этом контексте вычислительная модель зрительного восприятия Дэвида Марра (Магг, 1982). Эта модель постулирует три этапа переработки зрительной информации. На первом этапе вычисляется грубое, но полное описание изменений яркости в локальных участках изображения (в вариантах модели используется также информация о движении и бинокулярной диспарат-ности). Описание строится в терминах алфавита типов изменения яркости: КРАЙ, ТЕНИ-КРАЙ, ЛИНИЯ, ПЯТНО и т.д., дополненных параметрами ПОЛОЖЕНИЕ, ОРИЕНТАЦИЯ, КОНТРАСТ, РАЗМЕР и РАЗМЫТОСТЬ. Марр назвал такое описание первичным наброском, поскольку оно выделяет контур и подчеркивает слабые изменения яркости, подобно тому как это мог бы сделать художник, делая набросок картины. По отношению к первичному наброску последовательно применяются операции группировки и различения, результатом чего является выделение фигуры (объектов) из фона. Описание формы выделенных из фона объектов осуществляется лишь на более поздних этапах восприятия. Эти этапы были пояснены в работах Марра значительно менее подробно, чем первичная сенсорная обработка. Первоначально строится так называемая «двух-с-половиной-мер- ная» (2'/2D) репрезентация предметов. Речь идет о том, что предметы отчасти приобретают телесность, третье измерение, но при этом восприятие остается ограниченным определенным углом зрения, под которым мы их наблюдаем. Собственно трехмерная (3D) репрезентация предметов, не зависящая от специфической точки зрения, строится в последнюю очередь и связана с эффективной «упаковкой» информации в памяти. Характер такой упаковки позволяет понять предложенная Марром и Ни-шихарой гипотеза обобщенных цилиндров. Согласно этой гипотезе, универсальными элементами «ментального конструктора» служат обобщенные цилиндры — цилиндрические элементы разных пропорций, размеров и ориентации. Спецификация формы предметов примерно соответствует микрогенетическому принципу перехода рт глобальных к локальным системам отсчета. Примером служит репрезентация формы человеческого тела, показанная на рис. 3.16. Незначительная модификация параметров составляющих тело цилиндров позволяет описать общие очертания других похожих биологических существ и их движений (см. 3.1.2).
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|