Главная | Обратная связь | Поможем написать вашу работу!

Теория инструментального или оперантного обусловливания

Теория инструментального или оперантного обусловливания связана с именами Торндайка и Скиннера. Скиннер — один из виднейших представителей бихевиоризма, показал, что воздействие окружающей среды определяет поведение человека, он рассматривает в качестве главного фактора формирования человеческого поведения культуру, содержание которой выражается в определенном наборе комплексов подкреплений. С их помощью можно создавать и модифицировать человеческое поведение в нужном направлении. На таком понимании основаны методы модификации поведения, которые используются не только в психотерапевтической практике, но и в практике, например, воспитательных воздействий.

Термины «инструментальное научение» и «оперантное обусловливание» означают, что реакция организма, которая формируется по принципу проб и ошибок, является инструментом для получения поощрения и предполагает оперирование со средой, то есть поведение есть функция его последствий. При оперантном обусловливании поведение контролируется его результатом и последствиями. Модификация поведения осуществляется за счет влияния на его результаты и последствия. В соответствии со схемой оперантного обусловливания экспериментатор, наблюдая поведение, фиксирует случайные проявления желательной, «правильной» реакции и сразу же подкрепляет ее. Таким образом, стимул следует после поведенческой реакции, прямое подкрепление используется через поощрение и наказание. Результатом научения является оперантное научение, или оперант. В этом случае подкрепляется не стимул, а реакция организма, именно она вызывает подкрепляющий стимул, поэтому такое научение обозначается как научение типа R. Оперантное или инструментальное поведение — поведение типа R — это поведение, вызванное подкреплением, следующим за поведением. Скиннер, подчеркивая различия между респондентным и оперантным поведением, указывает, что респондентное поведение вызвано стимулом, который предшествует поведению, а оперантное поведение — стимулом, следующим за поведением. Иными словами: в классическом обусловливании стимул предшествует поведенческой реакции, а в оперантном — следует за ней.

Следует обратить внимание на соотношение таких понятий, как позитивное и негативное подкрепление и наказание, различать наказание и негативное подкрепление. Позитивное или негативное подкрепление усиливает поведение (поэтому иногда используется просто термин «подкрепление», предполагающий, что целью воздействий является усиление реакции вне зависимости от того каким будет подкрепление — позитивным или негативным), наказание — ослабляет. Позитивное подкрепление основано на предъявлении стимулов (наград), которые усиливают поведенческую реакцию. Негативное подкрепление заключается в усилении поведения за счет удаления негативных стимулов. Наказание также подразделяют на «позитивное» и «негативное»: первое основано на лишении индивида позитивного стимула, второе — на предъявлении негативного (аверсивного) стимула. Таким образом, всякое подкрепление (и позитивное, и негативное) усиливает частоту поведенческой реакции, усиливает поведение, всякое наказание (и «позитивное», и «негативное»), напротив, уменьшает частоту поведенческой реакции, ослабляет поведение.

Средства: Позитивное, Негативное Подкрепление;

Воздействие позитивного стимула

Прекращение действия негативного стимула

Наказание

Воздействие негативного стимула

Прекращение действия позитивного стимула

Приведем конкретные примеры. При позитивном подкреплении животное находит выход из лабиринта и получает пищу; родители хвалят ребенка за успехи в школе, создают ему возможности для развлечений. При негативном подкреплении животное находит выход из лабиринта, где действует электрический ток, и ток выключают; родители перестают постоянно контролировать, критиковать и ругать ребенка, если его успеваемость улучшилась. При «позитивном» наказании животное, постоянно получающее пищевое подкрепление в экспериментальной ситуации, перестает его получать при неправильном выполнении действия; родители лишают ребенка развлечений за плохую успеваемость. При «негативном» наказании животное в лабиринте упирается в тупик и ток включают, родители постоянно контролируют, критикуют и ругают ребенка за плохую успеваемость. Таким образом, первые два вида воздействия экспериментатора или родителей усиливают реакцию, так как являются подкреплением, а третье и четвертое — уменьшают, являясь наказанием.

Для различения стимула классического условного рефлекса и стимула оперантного условного рефлекса Скиннер предложил обозначать первый как Sd — дискриминантный стимул, а второй — как Sr — респондентный стимул. Дискриминантный стимул (Sd-стимул) по времени предшествующий определенной поведенческой реакции, респондентный стимул (Sr-стимул), подкрепляющий определенную поведенческую реакцию, следует за ней.

Ниже представлены сравнительные характеристики классического и оперантного обусловливания.

Классическое обусловливание S-R

Оперантное обусловливание R-S

Научение типа S

Научение типа R

Классическая парадигма Павлова

Оперантная парадигма Скиннера

Реакция возникает только в ответ на воздействие какого-либо стимула

Желательная реакция может появиться спонтанно

Стимул предшествует реакции

Стимул следует за поведенческой реакцией

Подкрепление связано со стимулом

Подкрепление связано с реакцией

Таким образом:

Респондентное поведение — поведение, вызванное определенным стимулом, предшествующим поведению

Оперантное поведение — поведение, вызванное подкреплением, следующим за поведением

Социальное научение. Этот тип научения основан на представлениях, согласно которым человек обучается новому поведению не только на основании собственного, прямого опыта (как при классическом и оперантном обусловливании), но и на основании опыта других, при наблюдении за другими людьми, за счет процессов моделирования. Поэтому этот тип научения также называют моделированием или научением по моделям. Научение по моделям предполагает научение посредством наблюдения и имитации социальных моделей поведения. Это направление связано, прежде всего, с именем американского психолога Бандуры, представителя медиаторного подхода (Бандура называл свою теорию медиаторно-стимульной ассоциативной теорией). Научение по моделям оказывает следующее действие: а) наблюдатель видит новое поведение, которого ранее не было в его репертуаре; б) поведение модели усиливает или ослабляет соответствующее поведение наблюдателя; в) поведение модели имеет функцию воспроизведения, может быть усвоено наблюдателем. С точки зрения Бандуры, сложное социальное поведение формируется посредством наблюдения и имитации социальных моделей. Наблюдение модели способствует выработке у наблюдателя новых реакций, облегчает реализацию ранее приобретенных реакций, а также модифицирует уже существующее поведение. Бандура выделяет три регуляторные системы функционирования индивида: 1) предшествующие стимулы (в частности, поведение других, которое подкрепляется определенным образом); 2) обратную связь (главным образом, в форме подкреплений последствий поведения); 3) когнитивные процессы, обеспечивающие контроль стимула и подкрепления (человек представляет внешние влияния и ответную реакцию на них символически в виде «внутренней модели внешнего мира»).

Если снова обратиться к основной формуле бихевиоризма S — (r-s) — R, (где r-s или r-s-r-s-...-r-s рассматриваются как промежуточные переменные), то очевидно, что решающая роль в процессе научения принадлежит не подкреплению стимула или реакции организма, а воздействию на промежуточные (медиаторные) переменные. Иными словами, научение в данном случае направлено на изменение более глубоких, закрытых психологических образований. Конкретные воздействия в рамках медиаторного подхода концентрируются на тех или иных психологических феноменах (промежуточных переменных) в зависимости от того, какие психологические процессы рассматриваются в качестве медиаторных (побудительные, когнитивные и пр.).

Теория обмена

Теория обмена представляет собой главное направление теорет. работы в социол. и соц. психологии, подчеркивающее важность взаимосвязи между вознаграждениями и затратами членов группы в формировании паттернов их соц. взаимодействия и их психол. реагирования друг на друга. Т. о. предполагают, что основу соц. жизни составляют вознаграждения (rewards) и затраты (costs), к-рые опосредуют отношения людей друг с другом. Считается, что различия в характере и типах этой взаимосвязи ответственны за такие феномены как соц. статус, соц. влияние, групповая сплоченность, соперничество/сотрудничество и выработка соц. норм.

Наиболее разработанные теории соц. обменов были предложены Тибо и Келли, Хомансом и Блау. Все теории соц. обменов включают аналогию между экономическими отношениями и др. видами соц. отношений. Считается, что обмен может происходить в ситуации, где каждый из участников располагает возможностью осуществлять контроль за благами, представляющими ценность для других, и каждый из участников ценит, по крайней мере, некоторые из тех благ, к-рые контролируют другие, выше чем, по крайней мере, некоторые из тех благ, к-рые контролирует он сам. Такими благами могут быть любые продукты, действия или условия, к-рые ценятся людьми. Следовательно, люди могут обменивать услуги на приязненное расположение, товары на услугу, и т. д. По сути, в этих теориях утверждается, что сама основа соц. жизни — ее существование и характер — состоит в такого рода обменах.

⇐ Предыдущая 123 Следующая ⇒

Воспользуйтесь поиском по сайту: