«Бабушкины» клетки
Только представьте: один нейрон реагирует только на одно изображение из тысячи. Это физиологическое наблюдение ошеломляет. Неужели наша кора в самом деле покрыта миллионами ультраспециализированных клеток? Физиолог Гораций Барлоу однажды в шутку заметил, что мозг содержит «бабушкины клетки» – нейроны, реагирующие только на вашу бабушку. Хотя утверждение Барлоу было не лишено иронии, он оказался прав или, по крайней мере, близок к истине. Мозг обезьяны, как и человека, содержит нейроны, которые настолько узкоспециализированы, что в буквальном смысле посвящены одному‑ единственному человеку, образу или понятию. Например, в переднем отделе височной доли пациента с эпилепсией однажды обнаружили нейрон, который реагировал исключительно на голливудскую суперзвезду Дженнифер Энистон[222]. Характер исходного изображения значения не имел: это могла быть цветная фотография, лицо крупным планом, карикатура или даже написанное имя – нейрон срабатывал только при виде или упоминании Дженнифер! Концепция «бабушкиного нейрона» вполне может оказаться истинной, но с рядом оговорок. Даже когда такая удивительная избирательность обнаруживается в одном нейроне, она должна быть результатом вычислений гораздо более крупной сети. Эксперименты, на которые я ссылаюсь, предполагали вживление электродов в участки зрительной системы, выбранные наугад. Если можно найти специализированный нейрон таким бессистемным способом, то, без сомнения, миллионы других ждут своего открытия. Кроме того, их специфичность неизбежно вытекает из коллективной работы многих клеток. В сущности, избирательная реакция одной клетки подобна верхушке айсберга: мы можем видеть ее только благодаря массе нейронов, создающих целую иерархию детекторов. Насколько нам известно, отдельный нейрон сам по себе может выполнять лишь относительно элементарные вычисления на входе. Кроме того, на выходе он не имеет большого влияния: только коалиция из нескольких сотен клеток способна влиять на другие группы клеток. Следовательно, каждое зрительное событие или лицо, которое мы распознаем, должно кодироваться несколькими кластерами избирательных нейронов (так называемое разреженное кодирование).
Представить себе всю цепочку – от миллионов фоторецепторов в сетчатке, которые реагируют на пятна света, до нейронов, что обнаруживают присутствие Дженнифер Энистон, – это неимоверно сложная задача. Мы только начинаем понимать детальную нейронную организацию зрительного распознавания. Мы знаем, что анатомически нижневисочная кора макаки похожа на пирамиду. Зрительный образ входит в ее основание, после чего множество последовательных связей передают его из первичной зрительной коры, расположенной в задней части головы, к переднему краю височного полюса (рис. 3. 5)[223]. По мере продвижения вперед сложность образов, возбуждающих нейроны, возрастает. На каждом этапе рекомбинация откликов нейронов предыдущего уровня позволяет клеткам следующего уровня реагировать на более крупные фрагменты изображений. Иначе говоря, наша зрительная система идеально приспособлена для повторной сборки гигантского пазла, который создает сетчатка, раскладывая входящие изображения на миллионы пикселей. [224]
Рис. 3. 5. Затылочная и нижневисочная области организованы в виде иерархии возрастающей инвариантности и последовательно соединены друг с другом в соответствии с «синаптической пирамидой». На каждой стадии размер рецептивного поля – области сетчатки, на которую реагируют нейроны, – увеличивается в два‑ три раза. Параллельно возрастает сложность и инвариантность их зрительных предпочтений (по материалам статьи Rolls, 2000). Использовано с разрешения Neuron.
Если бы мы могли подняться по нейронной пирамиде шаг за шагом, синапс за синапсом, и записать активность отдельных нейронов, попавшихся нам по пути от первичной зрительной коры до нижней височной доли, мы бы обнаружили три типа изменений: • Во‑ первых, предпочитаемые образы, на которые реагирует нейрон, должны постепенно усложняться. Чтобы вызвать активность в первичной зрительной коре, достаточно маленькой диагональной черты. Для срабатывания нейронов на более высоких уровнях требуются сложные кривые, фигуры, фрагменты объектов и даже целые объекты или лица. • Во‑ вторых, нейроны более высоких уровней реагируют на более обширные участки сетчатки. Каждая клетка определяется сквозь призму своего рецептивного поля – то есть места на сетчатке, которое вызывает ее активность. На каждом уровне рецептивные поля расширяются в два‑ три раза. Это означает, что диаметр ретинального участка, на который должен попасть предпочитаемый объект, чтобы нейрон сработал, тоже увеличивается вдвое или втрое. • В‑ третьих, чем выше уровень, тем выше степень инвариантности. Нейроны низших уровней чувствительны к изменениям местоположения, размера и освещения входящей картинки. В областях более высокого уровня нейроны допускают бо́ льшие сдвиги и искажения кодируемых объектов.
Функциональная визуализация мозга показывает, что иерархическая организация и возрастающая инвариантность присущи и нашей зрительной коре[225]. У человека, как и у других приматов, концепция нейронной иерархии обеспечивает простое, хотя и гипотетическое решение проблемы зрительной инвариантности. Чтобы опознать объект, наша кора должна усвоить, как он выглядит с разных сторон. Механизмы научения закрепляют за каждым видом отдельный набор нейронов, после чего соединяют «картинки» так, чтобы они сообща возбуждали те же самые нейроны на следующем уровне иерархической пирамиды. Результат – инвариантная нейронная цепь, допускающая значительные изменения угла обзора. Эта простая идея может быть легко воспроизведена на каждом этапе. Нейроны, отвечающие за распознавание профиля Дженнифер Энистон, собирают информацию от клеток более низких уровней, которые идентифицируют фрагменты ее лица. Эти нейроны способны распознать глаз или нос, потому что предыдущий уровень уже обнаружил паттерны света и тени, совместимые с присутствием этих элементов в конкретном месте на сетчатке.
Понятия иерархии и параллельного функционирования – вот главные ключи к зрительной системе приматов. Мысленный образ, разложенный сетчаткой на множество «пикселей», постепенно собирается заново пирамидой нейронов, работающих одновременно. На первый взгляд такой подход может показаться неэффективным: в таком случае каждому из возможных фрагментов, составляющих зрительную сцену, должны быть посвящены миллионы нейронов. Нагрузка на нервную систему, однако, относительно невелика: все, что мы видим, распределяется по гигантской сети простых параллельных процессоров. Подобно тому, как колония муравьев обладает более высоким интеллектом, нежели один муравей, коллективная работа миллионов нейронов позволяет выполнять операции гораздо более сложные, чем те, на которые способна одна клетка. В действительности огромное количество вычислительных блоков приводит к значительной экономии времени обработки. Одиночные нейроны работают медленно. Они получают и передают информацию примерно за 10 миллисекунд, что в миллион раз медленнее скорости электронного микропроцессора. Однако, объединяя активность миллионов нервных клеток, наша зрительная система становится самым эффективным компьютером в мире: ей требуется всего одна шестая доля секунды, чтобы заметить лицо независимо от его внешних особенностей и пространственного расположения[226]. Архитектура мозга вдохновила многих программистов. В настоящее время доступны несколько компьютерных моделей зрительной иерархии, которые я описал[227]. Лучшие из них близки к человеческой как по скорости, так и по степени искажения изображения, которую они допускают. Благодаря этим искусственным нейросетям автоматическое распознавание лиц больше не воспринимается как что‑ то из области научной фантастики. Это часть реальной жизни – самая простая цифровая камера сегодня может распознавать лица и улыбки.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|