Обучение «выбору по образцу»
«Выбор по образцу» — один из видов когнитивной деятельности, также основанный на формировании у животного внутренних представлений о среде. Однако в отличие от обучения в лабиринтах этот экспериментальный подход связан с обработкой информации не о пространственных признаках, а о соотношениях между стимулами — наличии сходства или отличия между ними. Метод «выбора по образцу» был введен в начале XX в. Н. Н. Ладыгиной-Коте и с тех пор широко используется в психологии и физиологии. Он состоит в том, что животному демонстрируют стимул-образец и два или несколько стимулов для сопоставления с ним, подкрепляя выбор того, который соответствует образцу. Существует несколько вариантов «выбора по образцу»: • выбор из двух стимулов — альтернативный; • выбор из нескольких стимулов — множественный, • отставленный выбор — подбор «пары» предъявленному стимулу животное производит в отсутствие образца, ориентируясь не на реальный стимул, а на его мысленный образ, на представление о нем. Когда животное выбирает нужный стимул, оно получает подкрепление. После упрочения реакции стимулы начинают варьировать, проверяя, насколько прочно животное усвоило правила выбора. Следует подчеркнуть, что речь идет не о простой выработке связи между определенным стимулом и реакцией, а о процессе формирования правила выбора, основанного на представлении о соотношении образца и одного из стимулов. Успешное решение задачи при отставленном выборе также заставляет рассматривать данный тест как способ оценки когнитивных функций мозга и использовать его для изучения свойств и механизмов памяти. Используются в основном две разновидности этого метода:
• выбор по признаку сходства (соответствия) с образцом (matching to sample); • выбор по признаку отличия (несоответствия) от образца (oddity problem, non-matching to sample). Отдельно надо отметить так называемый символьный, или знаковый, выбор по образцу (symbolic matching, arbitrary matching). В этом случае животное обучают выбирать стимул А при предъявлении стимула X и стимул В — при предъявлении Y в качестве образца. При этом стимулы А и X, В и Y не должны иметь ничего общего между собой. В обучении по этой методике на первых порах существенную роль играют чисто ассоциативные процессы — заучивание правила «если... то...». Первоначально опыт ставился так: экспериментатор показывал обезьяне какой-либо предмет (образец), а она должна была выбрать такой же из других предлагаемых ей двух или более предметов. Затем на смену прямому контакту с животным, когда экспериментатор держал в руках стимул-образец и забирал из рук обезьяны выбранный ею стимул, пришли современные экспериментальные установки, в том числе и автоматизированные, полностью разделившие животное и экспериментатора. В последние годы для этой цели используют компьютеры с монитором, чувствительным к прикосновению, а правильно выбранный стимул автоматически перемещается по экрану и останавливается рядом с образцом. Голубей и крыс обучают выбору по образцу в камере Скиннера. На диск, расположенный в центре, проецируется образец, на боковые диски — стимулы для сравнения. В качестве стимулов используется, как правило, подсвет дисков разными цветами. Животное осуществляет выбор путем клевания одного из боковых дисков (голубь) или нажатия на него мордой или лапой (крыса). Иногда ошибочно считают, что обучение выбору по образцу — это то же самое, что выработка дифференцировочных УР. Однако это не так: при дифференцировке происходит только образование реакции на присутствующие в момент обучения стимулы.
При «выборе по образцу» основную роль играет мысленное представление об отсутствующем в момент выбора образце и выявление на его основе соотношения между образцом и одним из стимулов. Метод обучения выбору по образцу наряду с выработкой дифференцировок используется для выявления способности животных к обобщению.
Заучивание последовательностей стимулов
Интерес к этой форме когнитивной деятельности животных возник в связи с обучением обезьян языкам-посредникам, при котором выяснилось, что шимпанзе могут составлять «фразы» из нескольких «слов» - жестов и понимать смысл обращенных к ним «высказываний». Г. Террес (Terrace et al, 1977), один из авторов этих ранних работ, проанализировал структуру таких фраз и высказал гипотезу, что в основе подобного поведения лежит не истинное понимание правильного порядка слов в английском предложении, а более простая и, вероятно, более универсальная для животных способность запоминать длинные ряды («списки») стимулов. Процесс запоминания цепей стимулов путем их разделения на подгруппы называется «делением на куски» («chunking»). Террес подробно исследовал этот процесс на голубях и показал, что в основе такого запоминания лежит не фиксация некоей последовательности стимулов и ответов, как это предполагалось бы с позиций бихевиоризма и теории условных рефлексов (цепи УР). Эксперименты показали, что здесь происходит формирование иерархически организованных внутренних представлений о структуре такой последовательности, т. е. проявляется способность мысленно проанализировать ряд стимулов и запомнить их, разбивая такой ряд на отрезки, подобно тому, как человек запоминает номера телефонов группами по 3 цифры (Terrace, 1991; Terrace, Chien, 1991a, b). Исследования Терреса позволяют понять, каким образом животные обрабатывают информацию о совокупностях, или цепях, воспринимаемых стимулов, чтобы выполнить в ответ серию действий. Предполагают, что внутренняя организация таких представлений осуществляется сходным образом у животных разного уровня организации. У голубей подобное обучение протекает так же, как у высших приматов, однако скорость обучения у них гораздо ниже, а последовательности, которые они в состоянии запомнить, менее сложные (D'Amato, Colombo, 1988).
Инсайт – обучение Термин «инсайт-обучение» (Thorpe, 1963) был введен в 60-е годы для описания ряда случаев сложных форм обучения, а также проявлений мышления, которые явно нельзя было отнести ни к одной из упомянутых выше простых категорий. Его использовали в случаях, когда решение задачи происходило слишком быстро для обычного обучения методом «проб и ошибок». К инсайт-обучению относили описанное В. Кёлером (1925; 1997) поведение шимпанзе, соединившего две палки, чтобы достать недоступное лакомство, а также опыты Я. Майера (Maier, 1929), в которых, как выражался автор, можно было тестировать способность крыс «к рассуждению». Однако согласно современным представлениям эти формы поведения относятся к проявлениям мышления, и они будут рассмотрены в следующих главах. В настоящее время термин «инсайт-обучение» употребляется все реже, уступая место конкретным определениям тех или иных форм обучения или рассудочной деятельности. Так, в 4-м и 5-м изданиях одного из самых известных учебников по поведению животных (Manning, Dawkins. An Introduction in Animal Behavior, 1992; 1998) появился раздел «Могут ли животные думать и осмысливать, планировать свои действия?». В нем авторы приводят ряд примеров разумных действий животных в природе (которые ранее они классифицировали как инсайт-обучение), а также описывают некоторые эксперименты, уделяя особое внимание необходимости строгого анализа и возможности использования «канона Ллойда-Моргана» (см. 2.3) при трактовке подобных данных. <...>
К. Прайор
НЕ РЫЧИТЕ НА СОБАКУ! О ДРЕССИРОВКЕ ЖИВОТНЫХ И ЛЮДЕЙ [25]
Эта книга о том, как обучать кого угодно: человека или животное, старого или молодого, самого себя или других — и чему угодно. Как добиться, чтобы кот спрыгнул с кухонного стола, а бабушка перестала ворчать; как управлять поведением домашних животных, детей, начальства и друзей; как улучшить свои достижения в теннисе, гольфе, математике, развить память? Всего этого можно достичь, используя принципы, обучения с подкреплением. Эти принципы являются такими же непреложными законами природы, как законы физики. Они лежат в основе всех ситуаций обучения, точно так же как падение яблока основано на законах гравитации. При попытке изменить чье-либо поведение, будь то собственное «ли чужое, мы используем эти законы, независимо от того, знаем мы их или нет. Чаще всего мы их применяем неправильно. Мы запугиваем, спорим, принуждаем, лишаем чего-либо. Мы ругаем окружающих, когда дела идут плохо, и забываем похвалить, когда все хорошо. Мы грубы и нетерпеливы с детьми, друг с другом, даже сами с собой, и потом сожалеем об этой грубости. Зная лучшие способы управления поведением, мы достигли бы своей цели быстрее, к тому же без нервотрепки, но мы не представляем, как это сделать. Мы попросту не можем привести в соответствие те приемы, которыми современные дрессировщики достигают успеха, с законами положительного подкрепления. Какой бы ни была наша задача — заставить ли четырехлетнего малыша вести себя тихо при посторонних, отучить ли щенка грызть дома все что попало, тренировать ли спортивную команду, выучить ли стихотворение — она решается быстрее, легче, веселее, если вы знаете, как пользоваться положительным подкреплением. Законы подкрепления просты: их можно за десять минут записать на школьной доске и за час выучить. Применение их в основном зависит от ситуации, обучение с подкреплением подобно игре, в которой надо быстро соображать.
Обучение с подкреплением — это вовсе не система наград и наказаний; современные тренеры даже не используют этих терминов. Награды и наказания приходят обычно после того, как действие совершено, часто спустя длительное время, как, например, в уголовном суде. Они могут повлиять, а могут и не повлиять на будущее поведение, но они, безусловно, не могут воздействовать на уже совершенное действие. Подкрепление — будь то «положительное», то, к чему надо стремиться, например улыбка или ласка, или «отрицательное» — то, чего надо избегать, подобно рывку поводка или нахмуренным бровям, — происходит именно во время поведения, на которое надо воздействовать. Подкрепление изменяет поведение только тогда, когда дается в правильно выбранный момент. Впервые я услышала об обучении с положительным подкреплением на Гавайях, куда в 1963 году я была приглашена старшим тренером дельфинария «Жизнь моря». Раньше rfдрессировала собак и лошадей, пользуясь традиционными методами, но дельфины — другое дело; на животное, которое просто уплывает от тебя, не воздействуешь поводком, уздечкой или даже кулаком. Положительное подкрепление — в основном ведро с рыбой — единственное, чем мы располагаем. Психологи в общих чертах познакомили меня с принципами обучения с подкреплением. Искусство применения этих принципов я постигла при работе с дельфинами.
То, чему я обучилась, работая с дельфинами, я стала применять и в дрессировке других животных. И я начала замечать, как эта система входит в мою повседневную жизнь. Например, я перестала кричать на своих детей, потому что заметила, что крик не помогает. Подмечать поведение, которое мне нужно, и сразу подкреплять его — это гораздо более действенно, да к тому же еще и сохраняет мирные отношения в семье. Тот опыт, который я извлекла из дрессировки дельфинов, имеет солидное теоретическое обоснование. В этой книге я постаралась держаться подальше от теоретизирования, так как, насколько мне известно, правила по применению этих теорий обычно не описываются наукой и, с моей точки зрения, ученые часто неправильно ими пользуются. Но основные законы уже твердо установлены и должны приниматься во внимание при обучении. Основа этой теории по разным источникам известна как модификация поведения, теория подкрепления, оперантное обусловливание, бихевиоризм, психология поведения и т. д.; это тот раздел психологии, который принес мировую известность Б. С. Скиннеру, профессору Гарвардского университета. Я не знаю другой современной области науки, которую бы в такой степени поносили, не понимали, переиначивали, неправильно истолковывали и неверно использовали. Одно только имя Скиннера приводит в ярость тех, кто является поборником «свободной воли» в качестве характеристики, отделяющей человека от животного. Для тех, кто воспитан в гуманистических традициях, воздействие на поведение человека при помощи своего рода осознанной техники кажется непоправимо безнравственным, несмотря на тот очевидный факт, что все мы пытаемся влиять на поведение друг друга любыми попавшимися под руку средствами. Пока гуманисты нападали на бихевиоризм и самого Скиннера с таким же жаром, с каким когда-то правоверные обрушивались на еретиков, бихевиоризм превратился в громадный раздал психологии, которым занимаются целые факультеты в университетах, он широко применяется в клинике, бихевиористы издают специальные журналы и созывают международные конгрессы, бихевиоризму обучают на специальных курсах, в нем возникает ряд доктрин и разных течений, ему посвящаются целые горы литературы. Это принесло определенную пользу обществу. Некоторые болезни — например, аутизм — оказались более чувствительны к формированию и подкреплению, чем к любым другим воздействиям. Многие врачи успешно разрешали эмоциональные проблемы своих пациентов, используя приемы бихевиоризма. Большая эффективность простого изменения поведения по сравнению со скрупулезным копанием в источниках его происхождения — по крайней мере, в некоторых обстоятельствах, способствовала возникновению семейной терапии, в которой рассматривается поведение, каждого члена семьи, а не только того, чье страдание наиболее очевидно. Обучающие машины и программированные учебники, разработанные на основе Скиннеровской теории, были первыми попытками разбить обучение на этапы и поощрять обучающегося за правильные ответы. Эти ранние механизмы были неуклюжими, но именно они были предвестниками компьютерного обучения, которое оказалось не только высокоэффективным, благодаря совершенству выбора времени подкрепления компьютером, но и внесло в процесс обучения веселые нотки в связи с забавным характером подкрепления (фейерверки, танцующие роботы). Программы подкрепления, использующие жетоны и талоны, которые можно накопить и обменять на конфеты, сигареты или какие-то льготы, были установлены в психиатрических лечебницах и некоторых других учреждениях. Нет недостатка в программах аутотренинга, позволяющих следить за весом и изменением других привычек в нужную сторону, и все они основаны на положительном подкреплении. Шопенгауэр сказал однажды, что каждая оригинальная идея сначала осмеивается, потом на нее яростно нападают, и наконец, она принимается как нечто само собой разумеющееся. Насколько мне известно, теория подкрепления не является исключением. Несколько лет назад Скиннера повсюду высмеивали за то, что он продемонстрировал формирование навыка, обучив пару голубей играть в пинг-понг... В теории подкрепления, по-видимому, существует естественный порядок, и в книге главы идут в той последовательности, в которой происходят процессы тренировки, от простого к сложному, как при реальном обучении, и это та самая последовательность, при которой наиболее легко овладеть профессией тренера. Книга построена таким образом, чтобы постепенно складывалось разумное понимание процесса тренировки при помощи позитивного подкрепления. Однако так как эта теория широко применяется на практике, то в пяти главах книги в качестве примеров приводятся различные жизненные ситуации, в которых позитивное подкрепление играет положительную роль.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|