Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Поиск инвариантов. Усиление различий




Поиск инвариантов

 

КЛИТАНДР. Так ты умеешь читать?

ЛЮБЕН. Да, по печатному, а вот по писаному никак не могу научиться.

Жан‑ Батист Мольер, «Жорж Данден» [28]

 

Чтение ставит перед нами сложную перцептивную[29] задачу. Мы должны идентифицировать слова независимо от их длины и того, какими буквами они написаны – печатными или рукописными, строчными или заглавными. Психологи называют это проблемой инвариантности: прежде всего нам необходимо распознать, какой аспект слова не меняется (то есть саму последовательность букв) несмотря на множество возможных форм, которые могут принимать фактические символы.

Если перцептивная инвариантность представляет собой проблему, то это потому, что слова не всегда располагаются в одном и том же месте и не всегда напечатаны одним и тем же шрифтом одинакового размера. Будь оно так, для декодирования было бы достаточно лишь перечислить активные и неактивные клетки на сетчатке. Именно так поступает компьютер: любое черно‑ белое изображение определяется списком составляющих его пикселей. Однако в реальности одному и тому же слову могут соответствовать сотни различных изображений на сетчатке. Все зависит от того, как именно оно написано (рис. 1. 2). Следовательно, одна из первоочередных задач при чтении – компенсировать огромное разнообразие этих поверхностных форм.

 

Рис 1. 2. Зрительная инвариантность – одно из важнейших свойств человеческой системы чтения. Наше устройство распознавания слов удовлетворяет двум, казалось бы, противоречивым требованиям: оно пренебрегает несущественными вариациями в форме знаков, даже если они огромные, но усиливает релевантные различия, даже если они совсем крошечные. Без нашего ведома зрительная система автоматически компенсирует бесчисленные вариации в размере и шрифте. Вместе с тем она замечает малейшие изменения формы. Превращая букву «s» в букву «е» и, следовательно, «sight» («зрение») в «eight» («восемь»), один знак переориентирует цепочку обработки на абсолютно разное произношение и значение.

 

Сразу несколько признаков указывают на то, что наш мозг эффективно решает проблему перцептивной инвариантности. Держа газету на некотором расстоянии от глаз, мы можем прочесть и заголовки, и рекламные объявления. Хотя одни слова могут быть меньше других в 50 раз, это не оказывает особого влияния на скорость чтения. Эта задача не сильно отличается от задачи распознавания лица или объекта с расстояния одного метра или 30 – наша зрительная система терпимо относится к изменениям масштаба.

Вторая форма инвариантности позволяет нам игнорировать расположение слов на странице. Когда наш взгляд сканирует текст, центр сетчатки приходится не на середину слова, а чуть левее. Разумеется, наша меткость далека от совершенства, а потому глаза периодически останавливаются на первой или последней букве. Как ни странно, это вовсе не мешает нам распознавать слова. Мы даже можем читать их на периферии зрительного поля при условии, что крупный размер букв компенсирует снижение разрешающей способности сетчатки. Таким образом, стабильность размеров идет рука об руку с нормализацией пространственного расположения.

Наконец, распознавание слов практически не зависит от формы знаков. Сегодня программные средства обработки текстов присутствуют везде. Технология, которой раньше пользовались только лучшие типографы, стала общедоступной. Всем известно, что существует множество наборов знаков, называемых шрифтами (этот термин остался с тех времен, когда каждый знак приходилось отливать в свинце на шрифтолитейном заводе). Каждый шрифт содержит два типа знаков, или «регистров»: верхний и нижний (первоначально свинцовые отливки, или литеры, хранили в специальных ящиках с множеством отсеков – так называемых наборных кассах; в верхних ящиках обычно лежали литеры заглавных букв, а в нижних – все остальные). Наконец, мы можем выбрать «вес», или насыщенность, шрифта (обычный или жирный), наклон (курсив, первоначально изобретенный в Италии), подчеркивание, а также любую их комбинацию. Впрочем, эти выверенные опции ничтожны по сравнению с неимоверным разнообразием рукописных стилей. Рукописное письмо явно выводит нас на новый уровень изменчивости и неоднозначности.

В свете всех этих вариаций остается загадкой, как именно наша зрительная система учится классифицировать формы букв. Частично проблему инвариантности можно решить относительно простыми способами. Возьмем, например, букву «о». Благодаря уникальной замкнутой форме эта гласная легко распознается независимо от размера, регистра или шрифта. Иначе говоря, создать зрительный детектор «o» не так уж и трудно. С другими буквами ситуация обстоит сложнее. Рассмотрим букву «б». Хотя нам кажется очевидным, что знаки б, Б, б и б обозначают одну и ту же букву, тщательный анализ показывает, что эта ассоциация совершенно произвольна. С равным успехом строчной версией буквы «Б» мог стать, скажем, знак e. В результате ребенок, который только учится читать, должен запомнить, что буквы не только передают определенные звуки, но и могут принимать самые разные формы. Как мы увидим далее, умение читать, по всей вероятности, обусловлено существованием абстрактных буквенных детекторов – нейронов, способных распознавать букву в ее различных обличиях. Согласно результатам экспериментов, чтобы с нормальной скоростью ДеКоДиРоВаТь ЦеЛыЕ пРеДлОжЕнИя, БуКвЫ кОтОрЫх НаПеЧаТаНы ПоПеРеМеНнО в ВеРхНеМ и НиЖнЕм РеГиСтРе, достаточно минимальной тренировки[30]. В «дьявольски гениальном» компьютере Макконки и Рейнера регистр может меняться перед каждой саккадой, но человек этого даже не заметит[31]! Хотя в повседневной жизни мы практически никогда не видим слов, напечатанных с чередованием регистров, наши процессы нормализации настолько эффективны, что зрительная система с легкостью игнорирует подобные трансформации.

Экспериментальные исследования подтверждают: внешний облик слова не играет в процессе чтения никакой роли. Если мы можем мгновенно распознать, что «слово», «СЛОВО» и «СлОвО» означает одно и то же, то это потому, что наша зрительная система не обращает внимания ни на размер, ни на регистр, которым напечатаны слова. Ее интересуют только буквы, которые их составляют. Несомненно, наша способность определять слова не зависит от анализа их общей формы.

 

Усиление различий

 

Хотя наша зрительная система успешно отфильтровывает визуальные различия, незначительные для чтения (например, между «Б» и «б»), не стоит думать, будто она всегда отбрасывает информацию и упрощает формы. Во многих случаях она, наоборот, сохраняет и даже усиливает (амплифицирует) мельчайшие детали, позволяющие отличить два очень похожих слова друг от друга. Рассмотрим слова «зрение» и «трение»[32]. Хотя разница составляет всего несколько пикселей, мы мгновенно получаем доступ к их соответствующим значениям и произношениям. Наша зрительная система чрезвычайно чувствительна к крошечным различиям между «зрением» и «трением». Усилив их, она посылает сигнал в разные семантические зоны мозга. В то же время она уделяет очень мало внимания другим, гораздо более выраженным различиям – например, между словами «зрение» и «ЗРЕНИЕ».

Как и в случае с регистром, способность обращать пристальное внимание на значимые детали является результатом многолетней тренировки. Читатель, который мгновенно замечает разницу между буквами «е» и «о» и ее отсутствие между «а» и «а», может не заметить, что еврейские буквы «» и «» кардинально отличаются друг от друга, хотя для любого еврея это очевидно.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...