Ментальные словари. Собрание демонов
Ментальные словари
Пока мы говорили о поверхностном маршруте, преобразующем графемы в фонемы, у вас могло сложиться впечатление, будто мысленное чтение сводится к короткому перечню относительно простых действий. Казалось бы, достаточно сохранить карту нескольких сотен графем и их произношений. Однако если мы посмотрим на то, как работает глубинный маршрут, позволяющий распознавать тысячи знакомых слов, то убедимся, что требуется хранилище побольше. Специалисты по когнитивной психологии сравнивают его со словарем или «ментальным лексиконом». Без сомнения, о ментальных словарях следует говорить во множественном числе: в наших головах содержится самая разная информация о словах. У всех нас есть свой собственный ментальный орфографический словарь, в котором собраны письменные формы всех известных нам слов. Эти орфографические воспоминания, вероятно, хранятся в виде иерархических деревьев букв, графем, слогов и морфем. Например, слово «морковь» должно выглядеть как [мор] + [ковь]. Кроме того, у нас имеется отдельный «фонологический словарь». Он подсказывает нам, что «морковь» произносится как [маркофь]. Третий словарь – грамматический: в нем указано, что «морковь» – существительное женского рода единственного числа, относится к 3‑ му склонению и так далее. Наконец, каждое слово ассоциируется с десятками семантических признаков, определяющих его значение: морковь – это съедобный овощ удлиненной формы, характерного оранжевого цвета и прочее. Все эти ментальные словари открываются один за другим по мере того, как наш мозг извлекает соответствующую информацию. Образно говоря, в нашем сознании имеется целая библиотека справочников – от руководств по правописанию до энциклопедий.
Количество словарных статей в ментальных словарях огромно. Объем лексических знаний человека, как правило, сильно недооценивают. Я сам слышал, как весьма сведущие люди отстаивали общепринятое представление о том, будто в пьесах Расина и Корнеля использовано не больше 2000 слов. Говорят, что бейсик‑ инглиш[82] – сильно упрощенный вариант английского языка, включающий всего 850 слов – позволяет успешно выражать мысли и эмоции. Некоторые даже утверждают, будто словарный запас подростков, проживающих в бедных районах мегаполисов, сократился до 500 слов! Это не так. Согласно научным данным, лексикон среднестатистического человека составляет несколько десятков тысяч слов. Стандартный словарь содержит около 100 000 статей; как показывают исследования на основе выборочного метода, любой носитель английского языка знает около 40 000 или 50 000 из них – и это без учета составных слов. Если добавить к ним примерно такое же количество имен собственных, аббревиатур (CIA, FBI), товарных знаков (Nike, Coca‑ Cola) и иностранных слов, получится, что в общей сложности каждый из наших ментальных лексиконов содержит от 50 000 до 100 000 записей. Эти числа – еще одно доказательство невероятных возможностей нашего мозга. Читая слово, любой человек с легкостью извлекает нужное значение из 50 тысяч возможных за десятые доли секунды. А ведь все, что у него есть в качестве источника – это несколько крошечных полосок света на сетчатке.
Собрание демонов
Работу системы чтения в условиях, близких к продиктованным нашей нервной системой, имитируют несколько моделей лексического доступа. Почти все они основаны на идеях, впервые сформулированных Оливером Селфриджем в 1959 году. Селфридж предположил, что наш лексикон похож на огромное собрание «демонов», или «пандемониум»[83]. Согласно этой метафоре, ментальный лексикон можно представить в виде гигантского полукруга, в котором десятки тысяч демонов соперничают друг с другом. Каждый демон реагирует только на одно слово и сообщает об этом криком. Всякий раз, когда на сетчатке возникает цепочка букв, все демоны «разглядывают» ее одновременно. Те, кто «видит» свое слово, громко вопят. Таким образом, когда появляется слово «scream» («крик»), отвечающий за него демон начинает кричать. Вместе с ним голосит и его сосед, который кодирует слово «cream» («сливки»). Так «scream» или «cream»? После непродолжительного состязания защитник «сливок» вынужден уступить – ясно, что его противник получил более сильную поддержку от стимульной строки «s‑ c‑ r‑ e‑ a‑ m». В этот момент слово распознается, и соответствующая информация может быть передана остальной системе.
За кажущейся простотой этой метафоры скрывается несколько ключевых идей о том, как именно функционирует нервная система во время чтения: • МАССОВАЯ ПАРАЛЛЕЛЬНАЯ ОБРАБОТКА: все демоны работают одновременно. В результате нет никакой необходимости исследовать каждое из 50 000 слов в нашем ментальном словаре одно за другим. Следовательно, массовый параллелизм пандемониума приводит к существенной экономии времени. • ПРОСТОТА: каждый демон выполняет элементарную задачу – он проверяет, в какой степени стимульные буквы соответствуют его целевому слову. Таким образом, модель пандемониума успешно обходится без гомункула, или маленького человечка, который, согласно народной психологии, управляет нашим мозгом. (А кто управляет его мозгом? Второй, совсем крошечный гомункул? ) В этом отношении модель пандемониума можно сравнить с девизом философа Дэна Деннета: «Человек выбрасывает из схемы воображаемого гомункула и заменяет его армией идиотов, которые и выполняют всю работу»[84]. • КОНКУРЕНЦИЯ И НАДЕЖНОСТЬ: демоны борются за право представлять правильное слово. Конкуренция обеспечивает гибкость и надежность. Пандемониум автоматически приспосабливается к сложности поставленной задачи. Когда вокруг нет соперников, даже такое редкое, неправильно написанное слово, как «astrqlabe»[85], может быть распознано очень быстро – представляющий его демон, даже если изначально он кричит тихо, в конце концов одержит победу. Другое дело, если стимулом будет такое слово, как «lead». В этом случае активизируются многие демоны (например, «bead», «head», «read», «lean», «leaf», «lend» и прочие). Лишь после ожесточенных споров демон слова «lead» сумеет взять верх.
Все эти свойства (в упрощенном виде) согласуются с основными характеристиками нашей нервной системы. Человеческий мозг, состоящий почти из 100 миллиардов (1011) клеток, представляет собой архетип массово‑ параллельной системы, где все нейроны работают одновременно. Связи, которые их соединяют, так называемые синапсы, передают информацию о внешнем сенсорном стимуле. Некоторые из этих синапсов являются ингибирующими (тормозящими). Это означает, что при срабатывании исходного нейрона происходит подавление возбуждения других нервных клеток. Канадский нейрофизиолог Дональд Хебб уподобил результат сети «клеточных ансамблей» – коалиций нейронов, постоянно конкурирующих между собой. По этой причине неудивительно, что пандемониум Селфриджа послужил источником вдохновения для многих теоретических моделей нервной системы, включая первые нейросетевые модели чтения. На рис. 1. 5 показана одна из самых ранних моделей, предложенная Джеем Макклелландом и Дэвидом Румельхартом в 1981 году[86]. Она включает три иерархических уровня нейроноподобных модулей: • Нижние входные модули чувствительны к линейным сегментам, отображаемым на сетчатке глаза. • В середине находятся детекторы букв, которые срабатывают всякий раз, когда появляется определенная буква. • Верхние модули кодируют целые слова.
Рис. 1. 5. Процесс идентификации слов подобен обширному собранию, где тысячи буквенных и словесных модулей сообща пытаются обеспечить наилучшую интерпретацию входной буквенной цепочки. В модели Макклелланда и Румельхарта, фрагмент которой приведен на рисунке, базовые характеристики входной цепочки активируют детекторы букв, а те подключаются к детекторам соответствующих слов. Связи могут быть возбуждающими (стрелки) или тормозящими (линии с черными кружками на конце). Конкуренция между лексическими модулями в конечном счете позволяет идентифицировать доминирующее слово – наиболее подходящую гипотезу о поступающей буквенной цепочке, которую выбирает сеть.
Все они соединены многочисленными связями. Подобное взаимодействие (коннективность) превращает сетевую динамику в сложную политическую игру, в которой буквы и слова поддерживают, критикуют или исключают друг друга. Если вы внимательно посмотрите на рисунок, то увидите возбуждающие связи, обозначенные стрелочками, и ингибирующие связи, обозначенные кружочками. Их роль заключается в распространении голосов каждого из демонов. Входной детектор, кодирующий некий базовый элемент, например вертикальную черту, посылает сигнал всем буквам, содержащим этот специфический компонент. Иными словами, каждый зрительный нейрон «голосует» за ту или иную букву. На следующем уровне детекторы букв избирают целые слова, стимулируя соответствующие им модули. Наличие букв «А» и «N», например, поддерживает слова «RAIN» и «TANK», частично выступает в пользу слова «RAIL», но совсем не реагирует на слово «PEST». Не менее важную роль в отборе наилучшего кандидата играет и торможение. Благодаря тормозящим связям буквы могут «голосовать» против слов, которые их не содержат. Например, модуль, кодирующий букву «N», выступает против слова «RAIL» и оказывает на него сдерживающее влияние. Кроме того, конкурирующие слова подавляют друг друга. Таким образом, идентификация слова «RAIN» несовместима с присутствием слова «RAIL», и наоборот. Нисходящие связи ведут от слов к составляющим их буквам. Этот процесс можно сравнить с сенатом, где буквы представлены словами. Слова же активно поддерживают буквы, которые за них «проголосовали». Взаимные связи позволяют создавать устойчивые коалиции, способные компенсировать случайное отсутствие буквы. Например, если в слове «крокдил» отсутствует «o», то его соседи все равно «изберут» слово «крокодил», а последний «проголосует» за наличие средней буквы «о», которой физически нет. В целом для интеграции многочисленных статистических ограничений, объединяющих уровни слов, букв и базовых элементов, требуются миллионы связей. Другие тонкости позволяют всей сети работать бесперебойно. Например, словесным модулям могут быть присущи разные пороги активации. Слово, которое встречается часто, характеризуется более низким порогом, нежели редкое слово, и при равной восходящей поддержке имеет больше шансов на «победу». Самые последние модели также осуществляют подробное кодирование позиции буквы в слове. Такая сеть обладает столь сложной динамикой, что полностью описать ее математически невозможно. Приходится прибегать к компьютерным симуляциям – только так мы можем установить, сколько времени требуется системе, чтобы определить правильное слово и то, как часто она ошибается.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|