Валерий Иванович Олешкевич: История психотехники. Часть II. Психология и психотехника XX века. Глава 4. Становление и развитие бихевиоральной психотехники и психологии

Содержание

4.1. Культурно-исторические условия возникновения бихевиоризма, формирование психотехнического схематизма «стимул — реакция» и бихевиоральная психология
4.2. Психотехника и психология Б. Скиннера и культурология бихевиоральной психотехники
4.3. Социальные механизмы подкрепления
4.4. Культурология бихевиоризма и феномен подкрепления

4.1. Культурно-исторические условия возникновения бихевиоризма, формирование психотехнического схематизма «стимул — реакция» и бихевиоральная психология

В конце XIX — начале XX века с наступлением эпохи позитивизма в психологию всё настойчивее начинают проникать идеи, ориентированные на классическую научность, то есть на точное описание и эксперимент. Всё отчётливее проявляется ориентация на ценности, сложившиеся в европейских естественных науках. Но что в нашей психике является точно наблюдаемым? Какой её элемент мы могли бы точно регистрировать? Ведь всё внутреннее, что собственно мы называем психическим, слишком субъективно, текуче и неустойчиво, чтобы стать предметом научного исследования.

В начале XX века возникает новое направление в психологии, полемически настроенное против современной ему науки, которая была прежде всего психологией сознания. Какие же возражения выдвигались против психологии сознания? Одно из них направлено против «субъективных» методов исследования, к которым прежде всего относился метод самонаблюдения (интроспекции). Интроспекция кажется совершенно непостоянной и невоспроизводимой, поэтому ненадёжной и неустойчивой, как и её предмет — сознание. Остаётся только отказаться от столь нестабильного предмета исследования. Но что же останется?

Останутся внешние проявления внутреннего, воздействия среды на организм, которые мы можем регистрировать. Это с одной стороны. А с другой — собственно поведение, реакции организма на эти воздействия. Поэтому и психология эта была названа наукой о поведении, изучающей поведение, — бихевиоральной, то есть поведенческой. Изучать можно только то, что наблюдаешь, а значит — только поведение.

Итак, бихевиоризм появляется в рамках движения за объективность психологических методов и ратует за получение надёжных и объективных данных о человеке, стремясь перевести психологию в разряд строгих и точных наук. В таком случае оказалась нужна теория, на базе которой можно строить эксперимент и описание эмпирических фактов. И такая теория скоро нашлась. Точнее говоря, как впоследствии оказалось, соответствующая психология уже давно существовала.

Эта психология начала своё существование в России ещё ранее — с первых работ по физиологии И. П. Павлова. А ещё раньше, как уже говорилось, основные идеи такой психологии были сформулированы в философии Р. Декарта и затем получили резонанс в западноевропейском мышлении. Декарт разделил тело и душу, а затем в контексте развития идей материализма психологические идеи формируются в онтологическом ракурсе телесности. Эти же идеи развивает в России И. М. Сеченов. Но именно у И. П. Павлова они превращаются в полноценный предмет научного исследования. Описание И. П. Павловым механизмов образования условной связи на животных открыло новую эру не только в физиологии, но и в психологии. Теперь появляется совершенно новая, объективная психология животных.

Именно на этой исследовательской схеме И. П. Павлова начинает строиться новое направление американской психологии, основным материалом для которого стали животные, а задачей американского бихевиоризма — изучение процессов научения у животных.

Особый интерес к животным идёт от убеждения психологов в том, что результаты исследований с ними впоследствии можно будет перенести на описание, объяснение и управление поведением человека. Более того, после длительного изучения особенностей научения у животных и открытия ряда закономерностей всё настойчивее делается вывод о том, что их можно будет перенести и на человеческое поведение, поскольку кажется, что не должно существовать качественных различий между поведением животного и поведением человека. Согласно основной исследовательской идее бихевиоризма развитие животного мира состоит в количественном росте и усложнении всё того же самого процесса связи между стимулом и реакцией. И тогда человеческий интеллект есть только дальнейшее развитие количественного роста психических способностей животных.

Интересно, что бихевиористы всё же неявно ориентируются на интеллект. Для них отличие человека от животного состоит прежде всего в различии уровней интеллекта, как будто интеллект и составляет сущность психики. В этом смысле бихевиоральная схема исследования является, хотя это кажется парадоксальным, специфической проекцией человеческого сознания на поведение животных. То, что исследовательская схема «стимул — реакция» — сложный продукт человеческого сознания и определённая психотехническая форма европейской культуры, мы увидим в дальнейшем. Вначале попытаемся ответить на другой вопрос.

Почему всё-таки бихевиористы считали, что психологические закономерности обязательно вначале должны быть получены на животных? Понятно, что сама техника эксперимента не очень подходит для человека, поскольку нужна по возможности полная свобода варьирования переменными, введение в эксперимент экстремальных ситуаций, например приводящих к смерти и прочее. В этом отношении психология как бы пошла по линии медицины, стала ориентироваться на медико-биологическую традицию, внутри которой вначале опыты ведутся на животных и только уже потом повторяются с человеком. Если ранее Декарт не допускал у животного существования души, то теперь бихевиористы совсем отказались от исследования души, и те факты, которые раньше рассматривались как душевные явления, стали рассматриваться как телесные реакции. В бихевиоризме, так же как в психоанализе, на первый план выходит проблема тела, которая встаёт уже совершенно по-иному, чем ранее.

Но были и другие причины. Одна из них — это новоевропейское представление о единстве и непрерывном развитии объективного мира. С точки зрения этой методологии животные устроены проще, поэтому необходимо начинать изучение психики с них. Согласно гносеологическим принципам, берущим своё начало от Декарта, всегда нужно начинать познание, разложив объект на простейшие, далее неразложимые элементы.

Есть и ещё одна причина, объясняющая такой методический шаг и позволяющая его понять с совершенно другой стороны. Для бихевиоризма важно то, что человек делает, а не то, что он говорит или думает. Отсюда и неприятие психологии сознания с её интроспективными методами. Здесь результаты, опирающиеся на такой метод исследования, различаются в зависимости от субъекта наблюдения. Ведь все люди разные, у каждого человека своё содержание сознания и свои наблюдательные способности. Следовательно, такой метод не допускает никакой объективной точки отсчёта, никакой объективной регистрации данных. Другое дело — объективная регистрация непосредственных реакций. Но человек для такой объективной регистрации мало подходит. Он слишком много говорит, слишком много думает и действует чаще не непосредственно, а сначала подумает. Да и делает часто не то, что ему хочется, и говорит не то, что думает. А бихевиорист как настоящий учёный доверяет только действию. Так что человек, с этой точки зрения, существо странное и сложное. А вот животные подходят для такого исследования. У них нет самосознания, и они реагируют непроизвольно и непосредственно.

И в этом смысле совершенно не случайно, что бихевиоризм выбрал животных в качестве объекта исследования. Это не просто принцип объективного исследования, но также и принцип недоверия к сознанию. Это уже экспликация в исследовательской стратегии сознательной установки, не доверяющей тому, что люди теперь думают о себе и что они говорят. А вскоре обнаруживается, что нельзя доверять даже тому, что человек делает. Реакцией на такое фундаментальное понимание как раз и является бихевиоризм. В этом отношении вполне заслуженно можно поставить памятник собакам, лягушкам и прочим представителям животного мира, хотя они, конечно, в этом не нуждаются. Это необходимо людям. Поскольку именно на животных, на этом «лабораторном материале» люди начинают исследовать и понимать свою природу, проецируя на «братьев меньших» свои схемы жизнедеятельности и сознания. Благодаря этому человек открывает нечто новое в себе, достигает определённого самоосознания и через это возвращается к себе. Вслед за открытием животного в себе происходит открытие в себе живого, оживление себя, возрождение и открытие человеческого в человеке.

Такое фундаментальное понимание характерно не только для бихевиоризма. С аналогичной ситуацией мы встречаемся и в психоанализе — другом направлении новейшей психологии, казалось бы совершенно противоположном бихевиоризму. Там тоже существует принцип недоверия к сознанию, а доверия бессознательному как чему-то более объективному (или собственно объективному). В психоанализе тоже есть удобный «объективный» объект исследования. Это больные неврозами, в основном истерией, неврозом навязчивых состояний и некоторые другие. У них работа бессознательного может наблюдаться в более чистом виде, чем у среднего человека. Именно в таких «экспериментальных» психических состояниях распавшееся сознание (или бессознательное) обнаруживает свои элементы и свою структуру. И здесь также аналитик открывает сначала зверя в человеке, здесь также происходит продвижение к более непосредственному, бытийному сознанию, продвижение от неживого мышления к живому самоосознанию.

Другими словами, и бихевиоризм, и психоанализ — это движение в одном направлении, хотя и разными путями, это движение к одной цели. Психоанализ предполагает путь изнутри сознания человека, а бихевиоризм — извне проявлений человеческого сознания. И это родство двух психотехник имеет общий корень — ассоциативную психологию, опирающуюся на психотехнику организации ассоциативной связи, которая, с одной стороны, объективировалась вовне, в психотехническую схему «стимул — реакция», а с другой — трансформировалась в технику осознания (посредством воспоминания).

Но в противоположность психоанализу бихевиоризм с самого начала ориентировался на классическую научность, точнее, на новые её критерии, введённые позитивизмом. Европейская же наука всегда была связана с техникой и ориентирована на неё. Поэтому бихевиоральная психология, изначально неявно ориентированная на технику, затем превращается в настоящую рефлектированную психотехнику.

Как затем оказалось, эта техника уже давно существовала и работала в культуре. И вот теперь она появилась в рефлектированном виде. Теория здесь довольно проста. Совокупность фактов, которая связана с поведением, разбивается на два класса: стимулы и реакции. Именно эти элементы мы можем фиксировать, измерять или оперировать ими. Например, стимул, обозначающий любое физическое воздействие среды на организм, может быть зафиксирован, его можно также произвольно изменять, варьировать и наблюдать, как влияет изменение этого стимула на реакцию организма. В рамках таких представлений в психологии были получены закономерности, которые могут быть интересны для нас и сегодня.

Термины «реакция», «реактивность» уже давно использовались в медицине, а затем и в физиологии, они не новы и имеют свою историю до их использования в психологии. Но ещё раньше они были элементами схемы ассоциативной связи, эта схема была психотехнической схемой организации работы сознания, создания ассоциативных связей. Затем появляется ассоциативная психология как научный предмет. Здесь отношение стимула и реакции есть внутреннее отношение, связь элементов сознания. И вот теперь, наконец, эти внутренние отношения проецируются вовне, и появляется исследовательская схема «стимул — реакция» как отражение тесного взаимодействия организма и среды.

Психотехника реактивности и зависимости от стимула

В своё время основатель бихевиоризма Дж. Уотсон поставил перед психологией две задачи. Первая состоит в том, чтобы определить реакцию, которую данный стимул может вызвать. Вторая, тоже в конечном счёте психотехническая, — противоположна первой. Допустим, нам дана некоторая реакция, а необходимо определить стимул, который её вызывает. Итак, всё та же психотехническая схема (стимул — реакция), тот же принцип реактивности. Что же здесь неявно утверждается? Выдвигается положение, что всякое поведение является реакцией и, соответственно, эта реакция возникает на определённый стимул. Всегда с точки зрения этой психотехнической схемы должен существовать стимул. Теперь она становится схемой, с одной стороны, онтологической, то есть описывающей картину реальности как взаимодействие стимулов и реакций, а с другой — это также схема познания реальности и оперирования ей. Предписание поиска за каждой реакцией стимула, который её вызывает, или стимула, на который она отвечает, есть методическое предписание к психологическому познанию. По сути дела подчёркивается: всегда, за каждой реакцией, чтобы её понять, ищи стимул, на который она отвечает.

Дальнейшие исследования показали, что наше поведение во многом действительно реактивно, а в более глубоком смысле — реактивно вообще. И, соответственно, эта направленность мышления, эта психотехническая форма мышления оказывается продуктивной и адекватной для познания и управления человеческим поведением.

Итак, мы видим, что задачи бихевиоральной психологии довольно конструктивны. Определив стимулы, которые лежат за той или иной реакцией, мы сможем, оперируя этими стимулами, управлять реакцией. Обратная задача также конструктивна: найдя то определённое соотношение стимулов, при котором получается заданная нами (интересующая нас) реакция, мы сможем произвольно формировать реакции. А если есть такая зависимость, есть возможность оперирования элементами этой зависимости, то естественно поставить финальную задачу: научиться получать заданные формы поведения, управляя системой стимулов (Н. Ф. Талызина). Для этого, конечно же, нужно выделить как некоторые элементарные реакции, так и элементарные стимулы и характер связей между ними. Если мы сможем сформировать таким образом сложные структуры поведения, то сможем заключить, что так они формируются и в действительности. Формируя, мы фиксируем свою деятельность и знаем, как получаются реакции, следовательно, занимаясь формированием реакций, мы одновременно занимаемся и исследованием их происхождения. Это естественно, поскольку реакция с этой точки зрения всегда производится стимулом.

Бихевиоральная психология. Полемика вокруг закона эффекта

Одним из наиболее важных в бихевиоральной психотехнике является понятие подкрепление, которое не только выступает центральным в бихевиоризме, но и широко распространяется за его пределами. Поскольку подкрепление было впервые выделено в бихевиоральных исследованиях научения, то обратимся к его анализу в том содержании, в котором оно возникает и развивается в бихевиоризме. Проблема подкрепления в бихевиоризме постоянно рефлектировалась и постепенно выдвинулась на первый план теорий научения и педагогической психологии.

Сама идея подкрепления связана прежде всего с именем Э. Торндайка. Уже первая его работа «Ум животных» (1898) стала началом нового направления в исследовании научения у животных и важным пунктом на пути внедрения объективных методов в исследовании процесса научения вообще. Опыты Торндайка строились таким образом, что он помещал подопытных животных (кошек, собак, обезьян, и так далее) в экспериментальные устройства различной степени сложности (так называемые проблемные ящики), на выходе из которых находилось подкрепление. Задача экспериментатора состояла в том, чтобы фиксировать характер двигательных реакций животных, направленных на разрешение проблемной ситуации ради получения подкрепления.

Процесс течения опыта и его результаты изображались в виде кривых научения, на которых отмечались, с одной стороны, число и порядок проб, а с другой — затраченное время или число ошибок. Исследуя эти кривые, Торндайк приходит к выводу, что животное в сущности действует путём проб, ошибок и случайного успеха. Весь процесс научения содержательно трактуется как простое установление связей между внешними стимулирующими ситуациями и реакциями организма. Но во всех экспериментальных ситуациях этого рода всегда явно присутствует подкрепление, на его основе и происходит научение. Это и определило основную направленность теории Торндайка.

В отличие от классического бихевиоризма Дж. Б. Уотсона с точки зрения этого класса теорий, «процесс научения заключается не столько в усвоении новых, сколько в дифференциальном подкреплении некоторых уже существующих связей между раздражителями и ответами, благодаря действию таких специфических подкрепляющих факторов, как фактор «эффекта «Торндайка»… (Монпеллье Ж. Научение. // Фресс П., Пиаже Ж. Экспериментальная психология. — М., 1973. — Вып. 4. С. 93).

Но, согласно Торндайку, понятие связи может быть определено только в функциональном и вероятностном отношении. Он считает, что только таким образом можно охарактеризовать эти сложные закономерности. Связь между стимулом S и ответом R возникает тогда, когда вероятность появления R больше нуля, — пишет Торндайк. В отличие от теории И. П. Павлова, например, здесь физиологическое содержание процесса установления связей особенно не уточняется, связь рассматривается просто как «деятельность или определённое состояние нейронов» (Э. Торндайк). Торндайк считает, что физиология образования таких связей не является предметом психологии, но полагает — в духе классического позитивизма, — что задачей психологии является исследование наблюдаемого поведения. За это его критикуют исследователи, ориентированные на физиологическую детерминацию процессов научения.

С точки зрения бихевиоризма в принципе всякое изменение в поведении является научением. А процесс научения заключается в «установлении определённых связей между данной ситуацией и данной реакцией» (Э. Торндайк). Но поскольку всякое изменение есть научение, а само научение есть установление связи между стимулом и реакцией, то эту связь нужно особенно исследовать и измерить. Эта связь может быть слабой или сильной, и задача состоит в упражнении и упрочении этих связей. Каковы же условия

Их образования? Или как образуются такие связи? Это центральная задача психологического исследования.

Исследуя образование стимульно-реактивных связей согласно схеме «стимул-реакция», Торндайк выделяет ряд законов их формирования. О некоторых условиях уже было известно благодаря экспериментам И. П. Павлова, в которых была показана необходимость для образования условной реакции смежности стимула и реакции (когда, например, звонок предшествует подаче пищи) и необходимость воспроизводства этой смежности. Последнее условие стали называть законом упражнения, содержание которого состоит в следующем: чем чаще повторяется временная последовательность стимула и соответствующей реакции, тем связь между стимулом и реакцией прочнее.

Но как мы помним, в экспериментах по формированию условной связи всегда присутствует безусловный стимул, то есть удовлетворяется некоторая безусловная потребность или, как ещё говорят, существует подкрепление. Это подкрепление также является условием, причём первичным, образования условной связи. Торндайк подчёркивает, что одной только повторяемости временной последовательности стимула и реакции для образования условной связи недостаточно, но необходимо подкрепление («положительный эффект»). И если подкрепление присутствует, то повторение сочетания стимула и реакции усиливает их связь. Это условие Торндайк назвал законом эффекта.

Таким образом, у И. П. Павлова это условие образования связи (безусловный стимул, состояние потребности) всегда присутствовало, хотя и специально не исследовалось. Торндайк вычленяет это условие и превращает его в центральное, необходимое условие научения. И теперь упражняемость (повторение) имеет значение только в сочетании с подкреплением. Подкрепление, закон эффекта, превращается в необходимое условие образования связей между стимулами и реакциями. Можно сказать, что закрепляется та реакция, которая эффективна с точки зрения жизнедеятельности организма, что приводит к некоторому положительному эффекту или эффективному, с точки зрения его жизнедеятельности, состоянию. Вот как определяет этот закон Торндайк: когда процесс установления связи между ситуацией и ответной реакцией сопровождается или сменяется состоянием удовлетворения, прочность связи возрастает; когда же связь эта сопровождается или сменяется состоянием неудовольствия, прочность её уменьшается. Но что это такое — состояние удовлетворения? Введение такого состояния — это уже апелляция к внутреннему фактору, нехарактерная для бихевиоризма. Как можно узнать, что чувствует животное? Как описать и контролировать это состояние извне? Торндайк, основываясь на непосредственно наблюдаемых признаках поведения, пытается дать объективное определение этого состояния в терминах объективно наблюдаемых состояний организма. Он определяет состояние удовлетворения как такое состояние, которое организм стремится вызвать и сохранить, а состояние неудовольствия определяет как такое состояние, которое организм стремится избежать.

Состояние удовлетворения, согласно Торндайку, или состояние, связанное с положительным эффектом, закрепляет соответствующую условную связь. Напротив, отрицательный эффект приводит к её уничтожению или, по крайней мере, ослаблению. Причём, по его наблюдениям, положительный эффект быстрее приводит к образованию желательной связи, чем отрицательный — к разрушению нежелательной. Другими словами, научить легче, чем переучивать. Это положение становится фундаментальным методологическим тезисом бихевиоральной педагогической психологии.

Нехарактерный для бихевиоризма субъективный момент, связанный с определением закона эффекта, вызывает полемику. К. Халл впоследствии пытается уточнить его. Он связывает подкрепление не с процессом удовольствия или неудовольствия, а с процессом ослабления потребности. Важным новым моментом в таком определении является введение некоторой потребности, на основе которой образуется условная связь. В таком случае подкрепление предполагает существование адекватной устанавливающейся связи потребности и её ослабления посредством определённого стимула.

Но всё же переход от понятия закона (эффекта) к процессу (или технике) и термину подкрепление несколько меняет характер проблематики. Понятие подкрепления более операциональное и техническое. Здесь сразу возникает вопрос: что и как нужно подкреплять? То есть это шаг вперёд к операционализации понятия. Но есть и потери. Какая-то сущность закона эффекта здесь устраняется в процессе его инструментализации.

Торндайк выделяет и ещё один закон научения. Он называет его законом готовности. Этот закон указывает на зависимость скорости образования связи от соответствия её (этой связи) наличному состоянию субъекта. Этот закон или условие эффективного (или быстрого) образования условной связи является по сути дела некоторой спецификацией закона эффекта.

Торндайк настаивает на том, что закон эффекта, или механизм подкрепления — это не рефлексивный механизм, но некоторое непосредственное запечатление. Вот как он об этом пишет: «Однако эта реакция никоим образом не должна рассматриваться как восстановление в памяти (в форме воспроизведения или припоминания) данного ответа и следующего за ним эффекта удовольствия или неудовольствия. Иначе говоря, механизм эффекта не является интериоризированным повторением последовательности раздражитель — ответ и сопровождающего её эффекта, — механизм этот прямой и непосредственный: эффект автоматически, независимо от осознания его субъектом, вызывает увеличение интенсивности связи. Другими словами, реакция подтверждения представляет собой чисто физиологическое явление воздействия актуального состояния нервной системы на её предшествующее состояние, не предполагающее обязательно психологические процессы» (Торндайк Э. Процесс учения у человека. — М., 1935. С. 40). Хотя Торндайк и не скрывает, что природа этого воздействия в целом непонятна и «весьма неопределённа».

Но каким образом фактор эффекта оказывает влияние на упрочение связи? Это по сути дела вопрос о механизме подкрепления. Об одном определении этого механизма мы уже говорили. Но у Торндайка есть и ещё одно определение механизма подкрепления, согласно которому его сутью является механизм реакции «подтверждения».

Это определение механизма подкрепления, вероятно, в значительной степени связано с новыми экспериментами Торндайка с людьми. При переходе к новому объекту закономерности, полученные на животных, не подтверждались. В частности, несомненно, что под влиянием этих экспериментов Торндайк сводит закон эффекта лишь к его положительной составляющей или его позитивному аспекту. Теперь он считает, что состояние неудовлетворения совсем не обязательно приводит к ослаблению связи, но по его наблюдениям интенсивность стимульно-реактивных связей в этом случае иногда даже несколько возрастает. Эксперименты Торндайка на материале ситуаций угадывания, выбора и так далее ясно показали, что отрицательный эффект не уменьшает интенсивность связей. Однако они продемонстрировали, что под влиянием реакций подтверждения экспериментатора, положительной его оценки ответов подтверждённые ответы выбираются значительно чаще. Таким образом, с людьми положительный эффект подтвердился, а отрицательный — нет.

При рассмотрении экспериментов Торндайка можно отметить следующее. Во-первых, это эксперименты с людьми, обладающими сложным аппаратом сознания, с людьми, которые решают рациональные (с их точки зрения) задачи. Во-вторых, особенностью этих экспериментов является их основная переменная — подтверждение, оценка ответов испытуемых экспериментатором. Другими словами, в этих экспериментах эффект, подкрепление моделируется с помощью оценки. Оценка представляет подкрепление. Более того, экспериментатор полагает, что оценка или квалификация им ответа и в самом деле является подкреплением. Следовательно, неявно предполагается, что испытуемые в своих реакциях, в своей деятельности как раз и ориентируются на оценку. И эта оценка идёт от определённого индивида, который обладает знанием и соответствующим авторитетом, опирающимся на это знание. Таким образом, реакции экспериментатора воспринимаются не просто как оценка, а как оценка рационализированная, как рациональная квалификация ответа как правильного или неправильного.

В такой организации эксперимента имплицитно содержатся и представления о человеке как индивиде, ориентированном на правильный ответ, то есть человек представляется как рациональное существо, ориентированное на достижение правильного результата. Или более широко — испытуемый предстаёт как индивид, ориентированный на оценку своей деятельности экспериментатором. Таким образом задаётся некоторая модель общения. Помимо этого, здесь эксплицируется и структура сознания человека: человеческое сознание построено так, что оно ориентируется на реакцию другого человека, на оценку значимого другого. Или ещё по-другому — сознание человека ориентируется на подтверждение его действия или реакции. Не здесь ли кроется природа механизма подкрепления Торндайка как подтверждения? Но тогда это отнюдь не физиологический механизм, но механизм сугубо социальный, интроецированный механизм социального общения. Не наблюдается ли здесь проекция рационализированного европейского сознания в экспериментальную практику?

Далее, не являются ли бихевиоральные детерминанты поведения, стимулы и реакции проекцией рационализированных структур механизированного европейского сознания, проекцией трансформированного и механизированного внутреннего диалога этого сознания, а также специфической навязчивой ориентацией этого сознания на реакцию значимого другого? Наконец, это проекция схематизмов сознания, которое ориентировано на результат, то есть специфического деятельностного сознания. Все эти моменты отображают определённые ценности человека XX века, в рамках которых разрабатывалась проблематика подкрепления. Но и здесь мы встречаемся с проблемой, которую в дальнейшем более подробно будем обсуждать на примере психотехники Б. Скиннера. К примеру, почему необходимо ориентироваться именно на результат, а не на процесс (на запуск и подкрепление процессов) или не на состояние (то есть на производство и развитие состояний)? Сегодня в этом видится одна из проблем.

Для подтверждения реального существования реакции подкрепления Торндайком и его последователями приводятся, в частности, две группы интересных фактов. Первая группа базируется на утверждении о непосредственности механизма подкрепления, что подтверждают прежде всего факты бессознательного научения. Последнее состоит в формировании связей стимулов и реакций, которое проявляется в увеличении частоты правильных (подтверждённых) ответов при том условии, что испытуемый не осознает этот процесс или его часть. Например, это происходит тогда, когда испытуемый не знает, на какой аспект ситуации он даёт ответ (то есть не осознает стимул или раздражитель своей реакции) или каким образом он отвечает на данную ситуацию, стимул или раздражитель (то есть когда ответ испытуемого остаётся бессознательным). И в ряде экспериментов Э. Торндайк показывает, что в таких ситуациях научение также происходит и происходит оно по принципу подкрепления.

Эти эксперименты строятся так, что научение происходит под влиянием направленной оценки ответов экспериментатором. В подобных исследованиях реакции локализуются в областях с наиболее частым подкреплением такого рода. Бессознательное обычно понимается здесь как нечто физиологическое, а бессознательное научение — как научение, опирающееся на физиологические закономерности. Но в действительности, как показывают современные исследования, это не совсем так. Бессознательное — не обязательно имеет физиологическую природу, но оно имеет свои механизмы функционирования, которые аналогичны механизмам сознания. В частности, так же, как и сознание, бессознательное ориентировано на оценку. Здесь можно обнаружить существенное сходство бихевиоризма и психоанализа, которое уже обсуждалось нами и будет затрагиваться в дальнейшем. Как в бихевиоризме, так и в психоанализе полагается принцип недоверия к сознанию, но при этом констатируется принципиальная реактивность человеческого поведения. Другое дело, что психоанализ подходит к изучению психики изнутри, а бихевиоризм — извне. И когда бихевиористы начинают изучать человека, опираясь только на наблюдения внешних поведенческих проявлений, они сталкиваются с рядом сложностей, поскольку существуют и внутренние механизмы организации поведения, причём внутреннее у взрослого человека обычно прямо не соответствует внешнему.

Вторая группа фактов, подтверждающих идею механизма непосредственного подкрепления, согласно Торндайку, представлена феноменом распространения эффекта, который был открыт им в процессе многочисленных опытов по серийному научению. Суть этого феномена заключается в том, что отрицательно подкрепляемые связи, смежные в пространстве или во времени со связями, вызывающими положительный эффект (то есть положительно подкреплёнными), становятся более прочными. Например, ответы, отрицательно подкреплённые, которые следуют непосредственно за подкреплёнными, повторяются значительно чаще. Причём такое усиление прочности ответов выражено тем сильнее, чем ближе расположена связь, получившая отрицательное подкрепление к положительно подкрепляемой связи.

Таким образом, получается, что положительный эффект подкрепления переносится и на ближайшее окружение, закрепляет и ближайшие к нему неподкреплённые связи (или отрицательно подкреплённые).

Вероятно, для объяснения феномена распространения эффекта Торндайк вводит понятие сопринадлежность. Он считает, что эффект оказывает непосредственное влияние на связи, которые находятся с ним в отношении сопринадлежности. Причём иногда сопринадлежность определяется как лишь смежность во времени эффекта и связи стимула и ответа. Но одновременно Торндайк включает в понятие сопринадлежности и более глубокое содержание, определяя его через более внутренние связи. В этом случае эффект рассматривается как именно следствие ответной реакции. Таким образом, между реакцией и эффектом полагается причинная зависимость. Эта зависимость, по мнению Торндайка, аналогична той, которая существует между вкусовым ощущением и потреблением пищи или схватыванием добычи и прыжком. Это в некотором роде напоминает уже внутренним образом детерминированные концепции научения, например концепцию потребности и деятельности А. Н. Леонтьева.

Идеи Торндайка привлекли к себе внимание исследователей, многие из его экспериментов неоднократно воспроизводились другими учёными или были повторены в других условиях. В результате таких проверок концепция Торндайка вызвала множественные возражения, которые, в частности, относились к пониманию Торндайком механизма реакции подтверждения как прямого и автоматического процесса, совершенно не зависящего, по замыслу Торндайка, от какого-либо осознания индивидом событий или элементов закреплённой связи. Взамен механизма эффекта предлагались другие механизмы, но часто не более определённые, чем механизм эффекта. Например, предлагалось объяснить закрепление связей ретроактивным влиянием одного физиологического процесса на другой. Но всё же оставалось непонятным, почему это влияние ведёт к усилению именно предшествующего процесса (Ж. Монпелье).

Обычно искали механизм процесса подкрепления в физиологии. Поэтому и сам Торндайк признает, что механизм этого процесса в сущности неизвестен и что именно поэтому он описывает его действие в психологических терминах. Психическое рассматривается здесь, таким образом, как только эпифеноменальное, весь сущностный процесс усвоения видится в физиологических процессах.

Результаты опытов по проверке выделенного Торндайком феномена бессознательного научения тоже оказались противоречивыми. Исследователи, повторившие эти опыты, получили другие результаты, иногда противоположные результатам Торндайка. Вследствие этого появились и другие подходы к объяснению полученных данных. Например, предлагалось объяснить описанный Торндайком феномен бессознательного научения тем, что испытуемые постепенно овладевали принципом решения задачи, и так далее.

Условие оценки в бихевиоральных экспериментах. Эту противоречивую ситуацию, в частности, можно объяснить тем фактом, что главным фактором соответствующих экспериментов была оценка. Можно сказать, что оценка экспериментатора здесь — не только варьируемая переменная, но и некоторое важное условие эксперимента. С этой точки зрения необходимо очень тонко просчитывать условия построения эксперимента, чтобы контролировать его ход. Но это весьма трудная задача, поскольку оценка человеком осознается не всегда, не может быть проконтролирована им до конца, есть эмоциональные оценочные влияния экспериментатора на ответы испытуемого, и, наконец, всегда есть эмоциональная приверженность экспериментатора к собственной теории, есть ориентация на подтверждение собственной гипотезы и многие другие факторы, которые обычно не учитываются. В данных экспериментах учитывалась только эксплицируемая словесно рациональная оценка. Но, как известно, испытуемый часто может реагировать не на слова, но на выражение лица другого человека, на тон его голоса и многие другие факторы. В экспериментах, где центральное значение имеет оценка, очень большую роль играет личность экспериментатора: в силу того что процессы собственных оценочных воздействий трудно контролировать, экспериментатор вполне может проявлять тенденцию направленного влияния на испытуемого.

Положительная оценка (или подтверждение) и её восприятие испытуемым — это совсем не одно и то же. Испытуемый может совершенно по-особому воспринимать подтверждение, во всяком случае это подтверждение всегда интерпретируется испытуемым. Всегда есть и объективная ситуация оценки со стороны объективной и контролируемой организации эксперимента, и субъективное восприятие эксперимента испытуемым и в соответствии с этим его поведение в экспериментальных условиях и реагирование на них. Поэтому необходимо учитывать также и процесс интерпретации оценки.

Поскольку в такого рода экспериментах фактор подкрепления моделируется как подтверждение, оценка результата, то неявно предполагается, что испытуемый ориентируется именно на эту оценку автора эксперимента. Но этого может и не быть, по крайней мере это не обязательно. Оценка экспериментатора может быть для испытуемого совсем незначимой, он может быть сориентирован на собственную оценку своей деятельности и вообще экспериментальной ситуации. Или на оценку какого-то другого значимого для него лица. А оценка, как известно, связана с самооценкой. Если оценка воспринимается как значимая, идущая от значимого лица, как оценка личности и её деятельности, то на основе этой оценки формируется и самооценка. А самооценка формирует новую активность и определяет новые направления ориентировки в социальной реальности.

Как уже говорилось, есть не только словесная оценка, но ещё и не рационализированный, не объективированный элемент оценки. Этот момент экспериментальной ситуации очень трудно стандартизировать, если вообще возможно. Помимо этого, оценка может быть объективирована в самой задаче, она может быть заключена для испытуемого в объективной структуре задачи и субъективном процессе её решения. Сама задача, её условия тоже несут определённое подкрепление, оценку и обратную связь. Поэтому по отношению к определённому испытуемому подкрепление уже с самого начала определённым образом присутствует в ситуации. И этот параметр, это условие тоже важно учитывать и контролировать.

Поэтому не случайно, что оценочный план процессов подкрепления постепенно начинает выходить в поле экспериментального контроля. В частности, это произошло в связи с повторными экспериментами по поводу феномена распространения эффекта Торндайка. В связи с исследованием этого феномена также возник целый ряд экспериментально подтверждённых возражений. Хотя явление распространения эффекта, как правило, подтверждается, этому феномену стали давать и другие интерпретации, нежели интерпретация Торндайка. Так, в экспериментах на материале запоминания и выбора Дж. Ньютэна феномен распространения эффекта вовсе не был обнаружен. Тогда Ньютэн предложил испытуемым воспроизвести не только даваемые ими ответы, но и их оценку экспериментатором. Оказалось, что процент припоминания положительно оценённых ответов, которые в действительности получили от экспериментатора отрицательную оценку, гораздо больше для ответов, находящихся в непосредственной близости к действительно одобренному ответу, то есть находящихся непосредственно перед этим ответом или сразу после него. Таким образом был открыт новый феномен распространения эффекта именно в процессе припоминания оценки. Хотя данный феномен, конечно, никак прямо не свидетельствует о том, что связи, смежные с одобрением, являются более упроченными, чем другие, а показывает только, что существует некоторая тенденция к значительной «иррадиации одобрения» (Ж. Монпелье) и к вытеснению в процессе припоминания следов неодобрения, всё же в этих экспериментах выходит на поверхность нечто новое по сравнению с данными Торндайка. Обнаруживаются и становятся предметом исследования собственно внутренние процессы восприятия оценки, их связь с памятью и самооценкой. Причём открывается, что результаты запоминания собственно ответов и их оценок экспериментатором могут резко рассогласовываться. Ньютэн говорит, обсуждая результаты экспериментов, что испытуемый часто может вспомнить свой ответ, но затрудняется восстановить сведения относительно характера его оценки.

Взаимодействие фактора распространения эффекта и неуверенности в припоминании оценки может, согласно Ньютэну, привести к такой ситуации, когда поощряемые удачные ответы переносятся на близлежащие стимулы в ряду данных экспериментатором, поскольку они связаны в субъективном воспоминании испытуемого с переживанием успеха. Но если ответ был неудачным, испытуемый стремится не использовать его и по отношению к стоящим рядом стимулам, так как это связано с воспоминаниями о неудаче. Ж. Монпелье считает, что в таком случае нужно говорить о роли эффекта как индикатора или информатора о том, что нужно делать для выполнения задания, а вовсе не о прямом и автоматическом подкреплении некоторых связей.

Итак, мы обнаруживаем здесь, как постепенно в ходе изучения подкрепления на поверхность поднимается социальная механика взаимодействия людей. Обнаруживается диалог сознания, ориентированность человека на оценку значимого другого, и за понятием подкрепления открываются процессы социальной оценки. В сущности, здесь мы видим, как предшествующая проекция принципа ассоциативной связи на тело реинтроецируется, и человек обнаруживает в ассоциации интеракцию. В ассоциации представлений обнаруживается социальная ассоциация, взаимодействие людей.

Проблема подкрепления в необихевиоризме

Дальнейшая разработка понятия подкрепления в американском бихевиоризме связана также с именем К. Халла. Он начинал с изучения закономерностей механической памяти, а также образования понятий, экспериментально изучал гипноз и внушение, но всё же наибольшую известность приобрёл как теоретик необихевиоризма. Халл предложил свой вариант математической «гипотетико-дедуктивной» теории научения, где пытался, с одной стороны, совместить теорию И. П. Павлова и бихевиоризм, а с другой — охватить посредством этой теории все виды научения.

Для Халла, так же как и для Торндайка, научение состоит в образовании связей между раздражителями и ответными реакциями. Правда, теперь эти связи понимаются как устойчивые состояния организма и как связи, которые устанавливаются между рецепторными и эффекторными процессами на уровне центральной нервной системы. Структура этих связей соответствует привычному для бихевиоризма понятию навыка (S — R).

Халл вслед за Толменом вводит в научный оборот для объяснения поведения понятие промежуточная переменная, то есть некоторые факторы, опосредующие реакцию на определённый раздражитель. Хотя в общем у Халла природа состояний, соответствующих состоянию навыка, больше не уточняется. Полагается только, что это «гипотетические конструкции», то есть некоторые теоретические предположения, которые выполняют функцию промежуточных переменных между раздражителем и ответом и проявляются в плане поведения как определённая его тенденция. Эта тенденция в свою очередь описывается как вероятность возникновения реакции при воздействии раздражителя.

Теория научения Халла интересна тем, что в её центре стоит понятие подкрепления. Основное условие образования стимульно-реактивных связей, согласно Халлу, аналогично условию эффекта Торндайка. Халл называет это условие подкрепляющим фактором, или подкрепляющим агентом. Но в отличие от Торндайка здесь подкрепление понимается не как состояние удовлетворения, но как процесс ослабления потребности. Феномен подкрепления, то есть редукцию потребности, и её уменьшение в результате удовлетворения Халл считает главным фактором научения. Чем чаще и интенсивнее редуцируется потребность, тем больше будет сила образующегося навыка.

Таким образом, в центр выносится понятие потребности, механизм подкрепления объясняется через существование некоторой потребности и процесса её последующего ослабления. Следовательно, можно предположить, что и подкрепление тоже является процессом.

Халл полагает, что о наличии потребности организм информируют специфические афферентные сигналы, то есть потребность интерпретируется как специфически внутреннее состояние, состояние внутреннего напряжения, или потребность интерпретируется изнутри. Поэтому процесс подкрепления рассматривается как преимущественно внутренний процесс.

В таком случае единственным условием, необходимым для запуска действия подкрепления и образования связи раздражителя и реакции, является, с одной стороны, смежность во времени реакции и действия раздражителя или его следа и с другой — смежность с этим состоянием процесса ослабления потребности.

Что же нового привносит Халл в закон эффекта Торндайка? Прежде всего вводится понятие потребность, которого у Торндайка явно не было. Потребность — это не бихевиоральное понятие, это не внешне наблюдаемое поведение, оно не принадлежит ни к бихевиоральному классу стимулов, ни к классу реакций. В классическом бихевиоризме (например, Уотсона) понятия потребности и не требовалось. Научение рассматривалось как прежде всего функция внешней среды, функция стимулов. Собственно стимул и нёс мотивирующую функцию. А понятие потребности — это не только нечто не соответствующее принципу внешней наблюдаемости, но и определяющее развитие поведения уже не извне, а изнутри, как процесс, связанный с функционированием потребностей.

Правда, у Халла сохраняются два принципа: традиционный принцип связи стимула и реакции и принцип потребности, который вводится как параллельный для объяснения подкрепления и закрепления этой связи. В центре внимания остаются содержательные связи стимула и реакции, именно они несут основное содержание усваиваемого опыта, именно они собственно и усваиваются. Динамика потребности только может увеличить интенсивность этой связи. Вследствие ослабления потребности связь усиливается, а сама потребность исчезает бесследно. Таким образом, она не привносит никакого качественного содержания в опыт индивида, она никак не модифицирует закрепляемые связи.

Связи стимулов и реакций оказались бессодержательными, связанными только механически (по принципу смежности стимулов и реакций). И в этом состоянии возникла необходимость ввести потребность и процесс её ослабления для объяснения количественных закономерностей их связывания и уровня их закрепления индивидом. Это осуществляется благодаря тому, что вводится новый объяснительный принцип — принцип смежности стимульно-реактивных связей и процессов ослабления потребности.

В этом смысле Халл теряет нечто из преимуществ простой бихевиоральной схемы объяснения поведения, в которой оно детерминируется исключительно извне, когда мотивация поведения образуется, производится благодаря стимулу. Но неявно он вводит внутреннюю точку наблюдения, изнутри функционирования поведения, правда, только с целью объяснения закрепления связей раздражителя и реакции.

В принципе, ослабление потребности, по Халлу, может вызываться двумя путями. Во-первых, через присутствие соответствующего раздражителя, который удовлетворяет данную потребность. И во-вторых, потребность может удовлетворяться устранением отрицательного, «вредного» (вредящего) раздражителя. Это устранение также вызывает исчезновение потребности, обусловленной наличием этого вредного раздражителя, или её ослабление.

В этом специфическом описании потребности как процесса ослабления, разрядки некоторого внутреннего напряжения есть некоторые специфические особенности объяснения закрепления связей. В описании Халлом процесса потребности как процесса её ослабления несомненно чувствуется влияние учения о мотивации и влечениях психоанализа, поскольку более привычным всё же является интерпретация процесса потребности как процесса удовлетворения, то есть как интроекции чего-то извне внутрь. Именно в этой логике более привычно рассуждать об усвоении опыта, что и происходило, например, в отечественной психологии. Рассуждение же в терминах ослабления потребности — это мышление о потребности и мотивации в логике избегания, ухода от внутренней ситуации напряжения, её разрядки. Этот мотивационный процесс не связан с усвоением опыта в смысле его интроекции и ассимиляции. В психоанализе с такими процессами связываются другие формы усвоения опыта. Здесь у Халла наблюдается тенденция, которую продолжили его последователи: объяснение психоанализа в бихевиоральных терминах (Н. Миллер, Дж. Доллард и другие).

Поэтому только с такими оговорками можно сказать, что Халл понятием ослабления потребности и связанным с ним процессом подкрепления обобщает закон эффекта Торндайка. В другом отношении, он этот закон и сужает, и вводит в него изначально чуждую ему идею ослабления потребности. Вводя понятие потребности, Халл объективирует психику также и изнутри, чего не было у Торндайка. Положительная сторона такой объективации состоит в том, что теория становится более точной, и понятие подкрепления получает многочисленные уточнения, что выливается в постановку более точных экспериментов по исследованию подкрепления. Теперь подкрепление связывается с ослаблением определённой фиксированной потребности, и его можно значительно точнее описывать.

Вместе с тем Халл связывает процесс ослабления потребности также и с ослаблением возбуждения в духе Павлова.

В отличие от Павлова Халл связывает возбуждение с наличием некоторой потребности. Но механизм подкрепления или усиления связи можно понять и как непосредственно детерминированный уменьшением возбуждения, физиологически. Можно понять этот механизм так, что благодаря уменьшению возбуждения наступает переход от энергетической рассеянности к концентрации энергии на связи, которая задаётся извне. Если подойти к пониманию возбуждения более феноменологически и противопоставить состояние возбуждения состоянию успокоения, то этот закон можно понять и таким образом, что в спокойном состоянии наше сознание значительно более легко воспринимает и также запечатлевает внешние объекты. Этот факт эффективно демонстрируют простые опыты с непосредственным запоминанием. Правда, в этом случае важен не процесс ослабления потребности или процесс ослабления возбуждения, но само состояние, противоположное возбуждению, состояние покоя или внутренней сосредоточенности.

Этот вышеприведённый закон Халл называет законом первичного подкрепления. Н6 есть также и вторичное подкрепление. Закон вторичного подкрепления является, по Халлу, следствием закона первичного подкрепления. Он состоит в том, что при более или менее абсолютном совпадении (с интервалом не более 20 с) любого раздражителя, вызывающего возбуждение рецепторов (то есть создающего афферентный импульс), с процессом ослабления потребности и сам этот раздражитель может становиться подкреплением. Этот закон значительно расширяет действие механизма подкрепления, распространяет его, в частности, и на более сложные случаи научения и усвоения опыта, когда ослабление потребности является результатом довольно длительной цепи деятельностей, которая охватывает период более продолжительный, чем тот, в котором возможно действие первичного подкрепления. Сам факт введения оппозиции первичного и вторичного подкрепления несомненно имеет фундаментальное значение для понимания как механизма, так и исследования развития структуры подкрепления, хотя тех объяснений, что сделал Халл, явно недостаточно.

Некоторые итоги бихевиоральных исследований подкрепления и появление нового проблемного поля исследований. В процессе развития бихевиоризма всё более явно обнаруживается существенная двойственность. Как известно, на первых этапах развития «объективной» психологии (начиная с психофизиологии и работ И. П. Павлова) во внимание принимаются только закономерности образования условной связи или связей стимулов и реакций. Так обстояло дело в основном и у Павлова, и в классическом бихевиоризме. Образование связей объясняется смежностью и повторением.

Но в процессе развития бихевиоризма быстро обнаруживается и ещё одно условие (ранее присутствовавшее в психологических экспериментах и бывшее предпосылкой их успешного завершения), которое оказывает влияние на образование стимульно-реактивной связи, то условие, которое Э. Торндайк назвал законом эффекта. Вследствие этого открытия оказалось, что в организации научения участвуют два процесса. Один из этих процессов можно назвать собственно процессом научения. Он осуществляется, например, в ходе движения животного по лабиринту, действия на него стимулов окружения, в результате чего образуются связи между стимуляцией окружения и реакциями на него организма. Это процесс, как его называет Торндайк, проб, ошибок и случайного успеха. Именно благодаря ему и происходит собственно научение. Научение представляется как образование связи между стимулами и реакциями или является следствием образования таких связей.

Но в описании этого процесса отсутствует фактор, который собственно и организует как поведение, так и научение прохождению по лабиринту. Этим фактором является пищевой стимул, который находится в конце лабиринта. Данный фактор в процессе построения кривых научения как бы выносится за скобки. Таким образом, научение изучалось в заданных условиях конструкции определённого лабиринта, проблемного ящика или другой технической конструкции, то есть в специально сконструированных и стандартизированных условиях. Вначале поведение разбивается на стимулы и реакции, формируются стандартные и контролируемые условия, а затем изучаются особенности образования связей между этими стимулами и реакциями.

В процессе варьирования конструкций лабиринтов, проблемных ящиков и вообще фиксированных условий обнаруживается ещё один фактор научения, названный впоследствии фактором подкрепления. Этот фактор задаётся уже просто тем условием, что если в конце лабиринта нет пищевого стимула, то научения не происходит. Таким образом, благодаря варьированию экспериментальных условий и накоплению фактов научения, а также вследствие усложнения самих экспериментов (экспериментальных условий) обнаруживается действие фактора эффекта или подкрепления в процессе образования стимульно-реактивных связей. Фактор подкрепления обнаруживается как момент, как бы обрамляющий процесс научения и образующий условие этого процесса.

Появляются два пересекающихся психологических процесса — научения и подкрепления. Последний становится предметом многочисленных исследований. Вскоре объяснение процессов подкрепления законом эффекта сменяется более дифференцированной схемой объяснения. Так, у Халла подкрепление связывается с потребностью и её ослаблением, вследствие этого появляется более уточнённое описание. На основе постулируемой связи подкрепления с ослаблением потребности выделяется подкрепляющий агент (подкрепитель), то есть стимул, который и реализует функцию подкрепления, в частности, ослабляет потребность. Таким образом, подкрепление определяется и объективно, как специфический стимул, связанный с ослаблением определённой потребности. Это позволило более точно организовать эксперимент по исследованию закономерностей подкрепления. Поскольку подкрепление может быть описано в терминах стимулов, то появилась возможность исследовать количественные параметры подкрепления. Тогда возникает возможность варьировать параметр величины подкрепления через измерение количественных параметров подкрепления, его интенсивности и прочее. Таким образом, закон эффекта преобразуется в новую, более расчленённую исследовательскую схему и следующие из неё закономерности подкрепления как дискретного процесса. С этой точки зрения подкрепление может быть или не быть, в определённое время быть, например, редким или частым. Так выделяется временной параметр подкрепления, его частота и другие. Такая дифференциация возможна потому, что подкрепление рассматривается как определённое действие стимула.

Вследствие этого происходит (у Халла, например) некоторое удвоение процесса научения. Но подкрепление объясняется в тех же терминах, что и само научение. Подкрепление объясняется как образование ассоциативной связи уже между стимульно-реактивной связью и некоторым состоянием организма (удовольствия, ослабления потребности, и так далее). Таким образом старый принцип смежности переносится и на объяснение подкрепления.

Интересным фактом является положение, характерное практически для всего бихевиоризма, что подкрепление никак не влияет прямо на формирование содержания навыка, на содержание закрепляемой связи. Оно влияет только на закрепление связей, на их интенсивность. Например, согласно Спенсу, подкрепление вообще не влияет прямо на формирование навыка, а лишь определяет интенсивность потенциала возбуждения.

Сама этимология слова «подкрепление» указывает на определённое вторичное значение этого процесса, призванного усилить то, что уже существует. Подкрепление таким образом обнаруживается как необходимая добавка к уже существующим процессам научения, как некоторое внешнее для научения «подталкивание», «поддержка» основного процесса, как бы внешняя помощь для его усиления или закрепления (путём, например, поощрения или наказания).

Но само подкрепление не научает, а только подкрепляет или закрепляет то, что уже есть, что приобретается за счёт смежности стимула и реакции. Такая бессодержательность, содержательная пустота подкрепления, характерные для бихевиоризма в целом, указывают на определённое сознание и его конфликт. Такие представления могут возникать только в условиях разорванного сознания, когда учение рассматривается как процесс вынужденный, неестественный или не имманентный сознанию индивидов. Такое положение вещей могло возникнуть только в условиях высокорационализированного сознания, когда рациональное знание начинает противостоять феноменальному, непосредственному сознанию.

Но в действительности подкрепление — это тоже стимул, и он должен вносить свой вклад в формирование реакции на уровне её содержания. На самом деле должна существовать содержательная связь между различными способами и формами подкрепления и научения, а также усвоения опыта вообще.

Ничего принципиально не меняется в этом отношении и у Б. Скиннера, хотя у него подкрепление становится практически основой обучения, его организующим моментом. У Скиннера бихевиоризм полностью раскрывает своё лицо и превращается в настоящую теорию и технику действия на другого человека, который и рассматривается прежде всего как объект внешних воздействий. Процессы подкрепления теперь осознаются как объективные, заданные извне структурой общественных норм, санкций и поощрений, организующих поведение людей. Таким образом, подкрепление осознается как объективированная вовне структура социальной стимуляции поведения. Несмотря на это, у Скиннера всё-таки намечаются определённые связи подкрепления и содержания усваиваемого опыта, чего не было у его предшественников.

Другая проблема, открывающаяся при исследовании процессов подкрепления в ходе развития бихевиоризма, явно обнаруживает недостаточность такого рода исследований. Эта проблема эксплицируется введением оппозиции научения и исполнения.

Вместе с этим открывается и несостоятельность традиционного бихевиоризма. В рамках этой оппозиции возникает проблема самосознания как детерминанты поведения, обнаруживается много-уровневость процессов подкрепления. Здесь же возникает проблема зависимости подкрепления от его объекта. Человеческая психика неоднородна, поэтому и процессы подкрепления оказываются сложными. Процессы подкрепления должны определяться также и теми психическими содержаниями, на которые подкрепление направлено.

В связи с этим открывается новое проблемное поле исследований феноменов подкрепления.

4.2. Психотехника и психология Б. Скиннера и культурология бихевиоральной психотехники

Переворот, осуществлённый Б. Скиннером в бихевиоризме

Скиннер подводит итог длительной традиции в американской психологии. Эта традиция зародилась в конце XIX века, во времена разгара дискуссий по поводу учения Ч. Дарвина об эволюции видов. Такие дискуссии развернулись и в США, их острота определялась тем фактом, что учение Дарвина существенно затрагивало природу самого человека, представления об его особости и уникальности среди других живых существ. В частности, казавшаяся ранее уникальной и несомненной способность человека думать подвергается теперь сомнению. В связи с учением Дарвина стали говорить также и о разуме животных.

Под влиянием этих дебатов происходит быстрый перенос основных предикатов, ранее прилагавшихся только к поведению человека, на поведение животных. Со времён Декарта, в связи с развитием рефлексивного мышления в науке существовал явный или неявный запрет на это, хотя в обыденном языке подобный перенос слов (мышление о животных по образцу собственного мышления) существовал непрерывно всегда. В конце XIX века эти представления становятся научной гипотезой, в частности гипотезой о способности животных «думать».

Именно в таком русле происходило формирование взглядов Э. Торндайка. И эксперименты Торндайка, направленные в сущности на объяснение мышления животных, стали действительно значительным явлением в становлении новой психологии.

Возникли новые методы исследования и в связи с этим новые проблемы и новые понятия мышления, научения и вообще усвоения опыта. Здесь возникла масса вопросов. Например, можно ли считать, что наблюдаемые на животных факты научения аналогичны соответствующим человеческим фактам? Говорят ли факты научения животных о наличии у них соответствующих человеческим психических процессов? Или эти «очевидные проявления мышления» (Торндайк) могут быть объяснены по-другому? Эти вопросы, в частности, разрешаются в бихевиоризме через постулирование положения об отсутствии «необходимости в представлении о внутренних мыслительных процессах» (Скиннер). В дальнейшем понадобился громадный объём исследований, чтобы вопрос о специфике поведения человека встал снова, но уже на другом качественном уровне.

В экспериментах Торндайка, где кошка помещается в ящик, из которого она может выбраться, только открыв задвижку, обнаруживается, что она проявляла вариативный набор видов поведения, при этом только некоторые из них оказались эффективными. Торндайк показал, что при многоразовом помещении кошки в такой ящик «успешное поведение» наступало всё быстрее. В конечном счёте оно становилось простым и выполнялось сходу. По видимости, кошка решала свою задачу как «разумное существо», но Торндайк не находил при этом мыслительных процессов. Он объяснял этот результат научения через факт «запечатления» поведения кошки в силу того, что это поведение сопровождалось положительным эффектом открытия двери.

Экспериментальные данные Торндайка свидетельствовали о том, что в рамках одной и той же ситуации формируемое таким образом поведение становится всё более стабильным, в отличие от других поведенческих паттернов. Определяя промежутки времени, которые требовались кошке, чтобы выбраться из ящика в каждой последующей пробе, Торндайк строил кривые научения, которые описывали зависимость процесса научения от времени и числа проб. Вот как характеризует это достижение американской психологии Б. Скиннер: «Эта ранняя попытка описать поведенческий процесс количественно, аналогичная описанию физических и биологических процессов, рассматривалась как важный шаг вперёд. Он раскрыл процесс, который развёртывался в течение длительного времени и который был доступен для наблюдения» (Скиннер Б. История зарубежной психологии (30–60-е годы XX века) / Под редакцией П. Я. Гальперина, А. Н. Ждан. — М., 1986. С. 62).

Таким образом, задача и достижение Торндайка состояли в описании процесса научения и соответствующего поведения как объективного, независимого от «произвола» индивида, который «производит» это поведение. Другими словами, в отличие от психологии, где поведение рассматривалось как функция сознания, как то, что управляется сознанием, поведение видится теперь как процесс, независимый от сознания и определяемый взаимодействием реактивности организма и воздействий окружающей среды. Следовательно, процесс формирования определённого поведения рассматривается как процесс, подчиняющийся определённым законам. Одним из законов формирования поведения становится закон эффекта, о котором мы говорили ранее.

На новый уровень эту проблематику поднимает Б. Скиннер. Признавая достоинства исследований Торндайка, он всё же возражает против того, что кривые научения описывают «сущность запечатления». Он полагает, что критерий Торндайка при построении кривых научения (время, необходимое животному, чтобы выбраться из клетки) был связан, в частности, и с устранением других видов поведения. Скиннер считает, что кривые Торндайка зависели от физических возможностей кошки действовать в заданных обстоятельствах. Естественно, что форма кривой зависела также от того, какое поведение выбиралось как «успешное» и было ли оно естественным и характерным для обычного поведения кошки.

На этом основании Скиннер принципиально возражает против такого рода исследований. Он пишет: «Можно сказать, что кривая научения, построенная таким образом, отражает свойства ящика с задвижкой, а не поведение кошки. Это положение распространяется на многие другие устройства, разработанные для изучения научения» (Там же). Согласно Скиннеру, «базисный процесс запечатления» в такого рода кривых не отражён.

Анализируя эти и другие эксперименты по научению, Скиннер приходит к выводу, что обычно основным детерминирующим фактором научения там является подкрепление. Поэтому он «извлекает» понятие подкрепления из всех «ящиков», «лабиринтов» и превращает его в самостоятельную оперативную конструкцию, а также управляемую характеристику формирования процессов поведения. Тогда поведение определяется как прямая функция подкрепления. Для определения подкрепления Скиннер больше не апеллирует к внутренним состояниям, как было у Торндайка, Халла и других исследователей. Для Скиннера подкрепление, с одной стороны, является функцией среды, а с другой — определяется через последствия поведения. «Последствия поведения могут играть роль обратной связи для организма. В этом случае они изменяют вероятность осуществления поведения, породившего их» (там же). Но его уже мало интересует внутренняя сущность процесса подкрепления. Он определяет как поведение, так и подкрепление в вероятностных терминах.

Скиннер производит настоящий переворот в американском бихевиоризме. Основываясь на том, что поведение является функцией подкрепления, операционализируя понятие подкрепления, он начинает производить эксперименты по исследованию поведения совершенно другого рода. Эти эксперименты с полным правом можно назвать формирующими. Он уже не ищет принципиальных закономерностей детерминации поведения, они уже известны. Он формирует поведение на основе этих закономерностей. Изменяется у Скиннера и схема исследования (и формирования) поведения, которая сконцентрирована вокруг «реакции и подкрепления». Поведение формируется путём специальной организации подкрепления некоторой исходной реакции. Как только реакция появляется, она должна быть подкреплена. Для формирования определённого поведения исследуется «репертуар реакций индивида» и выбирается та реакция, на базе которой на основе подкрепления можно «вырастить» некоторое заданное поведение. В этом смысле для Скиннера является проблемой не что такое подкрепление или поведение, это для него становится уже установленной истиной, но как необходимо подкреплять, чтобы сформировать поведение с заданными параметрами. Поэтому проблематику и способ работы Скиннера вполне можно ввести в единое дискуссионное поле (правда, с известными оговорками) с идеями формирования психики П. Я. Гальперина и теорией поэтапного формирования.

Развитие идей подкрепления в концепции Б. Скиннера и контексты американской культуры

В теории и экспериментальной практике Скиннера идеи бихевиоризма вообще и идея подкрепления в частности максимально заостряются и доводятся до своего логического конца. Понятие «подкрепление» разрабатывается им особенно подробно, являясь основным понятием скиннеровской психологии. В связи с этим имеет смысл остановиться на основных идеях Скиннера более развёрнуто.

Продолжая развитие бихевиоризма, его концепция, полемизируя, в частности, с необихевиоризмом, ещё сильнее настаивает на объяснении поведения исключительно средой или внешним окружением индивидуума. Скиннер утверждает, что изучение внутреннего ничего не прибавляет к изучению поведения. Внутреннее рассматривается прежде всего в технических или кибернетических терминах, как «чёрный ящик», как нечто такое, что невозможно, да и не нужно контролировать. Вопрос для Скиннера заключается прежде всего в контроле поведения, проблемы ставятся в терминах кибернетики и возможностей управления психикой.

Для традиционного бихевиоризма внутреннее — это (прежде всего или даже в целом) физиология. Продолжая эту традицию, Скиннер вносит в неё новые мотивы. Он не интересуется физиологией не потому, что она малодоступна и сложна для понимания и объяснения, а потому, что с его точки зрения физиологическими переменными нельзя оперировать в силу трудностей контроля над ними и, соответственно, опираясь на них, сложно управлять поведением. В этом отношении с практической (прагматической) точки зрения они бесполезны.

Кибернетика, как известно, возникает как наука, изучающая возможности управления механизмами и автоматами. Аналогичные задачи ставит Скиннер и по отношению к поведению человека. Люди с его точки зрения по своей природе — машины, хотя и сложные. Он принципиально возражает против того, чтобы приписывать поведению человека что-нибудь вроде свободной воли, сознания, внутренней мотивации и прочее. Эта старая идея, берущая своё начало от Дж. Локка и поднятая на щит Дж. Уотсоном, у Скиннера достигает своего логического конца. И в общем это идея европейской науки в целом, одной из вершин развития которой стала кибернетика. По Скиннеру, наука о поведении людей принципиально не отличается от любой другой естественной науки, которая основана на фактах. Наука о поведении имеет ту же цель, что и всякая наука, а именно — предсказать, проконтролировать изучаемое явление, то есть овладеть этим явлением, овладеть тем, что противостоит сознанию.

Весь этот процесс объективации мира берёт своё начало от Р. Декарта, который объективировал мир, сделал его телом и противопоставил сознанию. Именно Декарт ввёл понятие человека как машины. Правда, по аналогии с машиной рассматривалось только тело, душа ещё сохраняла свою автономность. Но вскоре принцип Декарта распространяется и на человека в целом, который начинает рассматриваться как тело, как телесный механизм. Теперь тело видится уже не только как часть человека, но и собственно человеческий индивид предстаёт как тело, как телесный механизм. И этот механизм должен быть рассмотрен как функция внешней среды.

В этой же традиции работает Скиннер продолжая её, он утверждает, что поведение можно достоверно описать, определить и проконтролировать условиями среды, что для контроля над поведением и для его описания достаточно анализа условий окружения. Причём характерно, что для Скиннера понимание и контроль поведения принципиально тождественны. Понять поведение для него означает это поведение проконтролировать и наоборот — проконтролировать означает понять. Это тоже старая традиция. Аналогичное мы находим у И. Канта, который говорил: я могу понять то, что я могу сделать. В действительности, это основная идея европейской экспериментальной науки. Её можно перефразировать ещё и так: я могу понять только то, чем могу овладеть или что могу присвоить.

Теперь эти принципы классической европейской науки настойчиво применяются к человеку. И тот факт, что бихевиористы и Скиннер в их числе начинают свою науку на материале исследования животных, строится на вполне картезианских принципах.

Во-первых, начинать нужно с простого, поскольку сложное появляется из простых элементов. С этой точки зрения, поведение животных не должно принципиально отличаться от поведения человека. Во-вторых, изучать необходимо то, что можно контролировать, и чем легче это контролировать, тем лучше для исследования. Животные в таком случае — наиболее благоприятный материал.

Правда, тот же Декарт замечал, что, изучая внешний мир, «природу», мы изучаем это в формах собственного сознания, то есть мы проецируем собственное сознание вовне и благодаря этим проекциям способны понимать внешний мир. И когда бихевиористы изучают животных в терминах «стимул — реакция» или «подкрепление», это означает, что они таким образом проецируют своё самосознание, они нечто говорят и о себе как самосознающих и функционирующих существах.

Но у Скиннера в отличие от позитивизма классического бихевиоризма становятся явными методология и идеология прагматизма. Прагматизм уже изначально присутствовал в самом позитивизме. И теперь он поднимается на поверхность и становится во главу угла. Основная задача состоит не просто в познании поведения, но в его контроле и управлении имени Идеология прагматизма, родившаяся на специфической американской культурной почве, у Скиннера достигает одной из своих вершин.

Идеи обусловливания поведения средой в полном объёме могли возникнуть, вероятно, только в условиях североамериканской культуры, наряду с высоким уровнем техники, товарно-денежных отношений, культурой разнообразия социальных пространств и возможностями оперирования ими, вместе с высоким уровнем объективации человека в этой культуре. В таких культурных условиях, когда человеческое поведение механизировано, а стимулы, им управляющие, становятся всё более очевидными, и возникают феноменальные условия для возникновения бихевиоризма и его развития. В частности, в этих условиях феномен подкрепления становится очевидным фактом. И если ранее бихевиористы пытались заниматься исследованием природы подкрепления или его предполагаемых механизмов, то для Скиннера подкрепление, научение через подкрепление становятся очевидными. И он занимается скорее исследованием технических проблем, разрабатывает техники подкрепления, что, правда, оказывает обратное влияние на исследование природы и механизмов подкрепления. Это даёт новый импульс к онтологическому исследованию проблемы подкрепления.

В методологии исследования поведения у Скиннера появляется один очень важный элемент, которого не было как в классическом бихевиоризме, так и в необихевиоризме. Он придавал особое значение анализу поведения единичных организмов. Это положение обосновывается Скиннером прежде всего гипотезой о том, что все организмы развиваются (и научаются) по одним и тем же законам, которые сохраняются в своей основе тождественными как у человека, так и у животных. Поэтому Скиннер полагал, что, изучая одну крысу или одного человека, можно обнаружить также и общие законы, присущие всем организмам.

В этом смысле он возражал против исследования усреднённого индивида, но настаивал на том, что, вместо того чтобы делать различные предположения о поведении несуществующего, «усреднённого индивида», психологи должны пытаться предсказать влияние одной или более контролируемых переменных «на обусловленный компонент поведения отдельного организма в контролируемом окружении». Именно эту задачу должна ставить перед собой психологическая наука, полагает Скиннер, ссылаясь на Павлова, который тоже считал, что, управляя внешними обстоятельствами, можно увидеть закономерности поведения. В этом отношении Скиннер действительно ближе к Павлову, чем к бихевиористам и необихевиористам с их многочисленными выборками и статистически обосновываемыми экспериментами. Эта методология определяется тем обстоятельством, что основным фактором поведения Скиннер считает подкрепление. Подкрепление же, с его точки зрения, вполне можно контролировать, изолировав организм и взяв его под экспериментальный контроль. Причём для этого не нужно полностью пытаться контролировать стимуляцию организма, не нужно создавать «башню молчания» (чтобы слышны были только контролируемые стимулы), как в экспериментах Павлова. У Скиннера нет такой проблемы, её нет потому, что экспериментально создаётся и контролируется потребность организма, который настроен на подкрепление и чувствителен к подкреплению. Это «метод научения через кормушку»: крыса, лишённая пищи, будет легко фиксировать реакции, приводящие к пищевому подкреплению, и случайное нажатие на рычаг, сопровождаемое пищевым подкреплением, будет склонно закрепляться.

В этом отношении крыса «свободна», и свой метод Скиннер не случайно называл «свободным оперантным методом», а свой ящик («ящик Скиннера») — «свободной оперантной камерой». Модель эксперимента с крысами отображает образ жизни американского общества, объективированное сознание общественных атомов, внешне свободных, но внутренне сплошь определённых конструкцией общественной среды. Это развитое состояние сознания всё той же протестантской культуры с её внешней свободой и внутренней необходимостью.

Первостепенное значение Скиннер придавал функциональному анализу поведения организма. Этот анализ, с его точки зрения, должен установить точные и обусловленные отношения между наблюдаемым или «открытым» поведением (реакцией) организма и условиями окружающей среды (стимулами), которые и контролируют поведение. Скиннер считал, что эти переменные должны существовать независимо от наблюдателя и должны быть определены количественно. Таким образом, психологи, согласно Скиннеру, могут, работая в рамках естественной науки, открывать законы, относящиеся тем не менее к поведению отдельных индивидов. Так построенное исследование даёт возможность манипулирования и варьирования независимыми переменными окружающей среды. Именно такое манипулирование стимулами среды позволяет производить измерение поведенческих реакций, изучать закономерные связи между стимулами и реакциями и на этой основе делать прогнозы возможных реакций (зависимых переменных) в определённых условиях. Тот факт, что появляется возможность свободного манипулирования независимыми переменными, имеет и первостепенное практическое значение, поскольку даёт возможность эффективно управлять поведением. Эта практическая возможность и лежит в основе концепции Скиннера.

Он полагает, что причинно-следственные отношения, которые получаются из такого функционального анализа, могут стать всеобщими законами «науки о поведении». Этот свободный перенос частного на общее определяется спецификой методологии Скиннера, в основе которой лежит положение примата общего над частным во всяком индивидуальном случае. Принцип подкрепления — это общий принцип образования всяких связей и закрепления любой реакции. С точки зрения Скиннера, изучение поведения предполагает нахождение специфического характера взаимоотношений между поведением организма и результатами этого поведения, которые его подкрепляют. Другими словами, всякое поведение, которое мы можем наблюдать, которое воспроизводится, существует в силу того, что результаты этого поведения своим следствием имеют подкрепление. Всё, что развивается, согласно Скиннеру, развивается или закрепляется именно через подкрепление. А поскольку функция подкрепления — это функция внешней среды, то поведение, его закрепление и способность его развития определяется этой средой, несущей в себе подкрепление. Тогда индивидуальные различия между людьми определяются особенностями среды, их следует понимать в терминах интеракций поведения и окружающей среды во времени.

Эта идентичная среда подкрепления формирует очень похожих людей, людей стандартных, которые и являются собственно функцией этой среды. В этом отношении действительно достаточно обследования одного индивида, чтобы понять функционирование этой среды, среды, которая является внутренним элементом индивидуального (которое в этом смысле является и общественным) поведения людей. В этом смысле то поведение, которое исследует Скиннер, его внутренние и внешние детерминанты являются объективацией рационализированного общественного сознания.

Скиннер противопоставляет павловское классическое обусловливание и инструментальное научение, исследованием которого он в основном и занимается. Классическое, или в его терминах респондентное, обусловливание он также интерпретирует в терминах подкрепления, как подкрепление стимула. Инструментальное или оперантное поведение, с точки зрения Скиннера, отличается той особенностью, что оно не связано с каким-либо стимулом. Формирование такого поведения определяется стимулами, которые последуют за данным поведением, стимульными ситуациями, которые станут последствиями такого поведения.

Этот тип поведения, согласно Скиннеру, предполагает, что организм активно действует на окружение с целью изменить события и получить подкрепление. Поэтому он определяет такое поведение как оперантное, чтобы подчеркнуть воздействие именно реакции на будущее поведение. Оперантное поведение является результатом оперантного научения, которое определяется событиями, следующими за реакцией. Иными словами, всякое поведение имеет следствия и природа этого следствия изменяет тенденцию организма повторять данное поведение в будущем. Всякое более или менее произвольное действие рассматривается Скиннером как оперант, контролируемый результатами, следующими за соответствующим поведением.

В последнем случае Скиннер считает, что речь идёт о произвольных приобретённых реакциях, на том основании, что для них не существует стимула, который можно явно распознать. Он утверждает, что бессмысленно рассуждать о происхождении оперантного поведения, поскольку в данном случае неизвестен стимул, или внутренняя причина, ответственная за появление поведения. Поэтому, считает Скиннер, следует полагать, что оно происходит спонтанно. Правда, остаётся одна сложность. Понятие реакции, реактивности предполагает стимул, на который происходит реагирование, в отличие от произвольного поведения, происходящего, по определению, из волевого усилия индивида. Скиннер не видит принципиального различия в особенностях подкрепления одного и другого типа поведения. Помимо этого, положение Скиннера о спонтанности оперантного поведения можно рассматривать методически как требование исходить из данного. В таком случае научение рассматривается как рост чего-то уже наличного, как усиление реакции, которая уже в своём начальном виде всегда присутствует. Тогда, приступая к организации научения, исследователь должен найти некоторый зародыш реакции, которую он хочет сформировать. А формирование, то есть рост реакции, будет происходить через систематическое подкрепление.

Таким образом, суть оперантного научения, согласно Скиннеру, состоит в том, что подкреплённое поведение стремится повториться, а поведение неподкреплённое или наказуемое, напротив, имеет тенденцию не повторяться или подавляться. Сила позитивного подкрепляющего стимула определяется его воздействием на последующую частоту реакции, которые непосредственно предшествовали данному стимулу. Это одновременно и закон научения, согласно Скиннеру. И концепция подкрепления играет здесь центральную роль.

В оперировании термином «подкрепление» у Скиннера можно заметить некоторую характерную двойственность. С одной стороны, под подкреплением понимается стимул, который следует за реакцией. Это объективное определение подкрепления в терминах стимулов, определение извне. Но, с другой стороны, Скиннер описывает подкрепление и в более внутренних терминах, как эффект реакции или её последствия для организма. Так, он говорит, что если последствия благоприятны для организма, то вероятность повторения «операнта» в будущем усиливается. В таком случае предполагается, что подкрепляют именно последствия, или же оперантные реакции, полученные в результате такого подкрепления, обусловились, что гарантирует высокую вероятность их появления в будущем. Если же последствия реакции неблагоприятны (или не подкреплены), тогда вероятность получить необходимый «оперант», наоборот, уменьшается. Скиннер считал, что в таком случае оперантное поведение контролируется негативными последствиями. Негативные, или аверсивные последствия, согласно Скиннеру, ослабляют поведение, которое их порождает.

Последствия от реагирования — это то, что ощущается изнутри индивида, это непосредственное, экзистенциальное ощущение результатов реакции. Само действие подкрепляющего стимула может быть и не дано индивиду, тогда он будет реагировать только на результат реакции, эффект от которого может переноситься на всю реакцию, в том числе и на её начало. В таком случае эффект подкрепления и закрепления может состоять субъективно, изнутри субъекта реагирования не в реакции на стимул, а в реакции на реакцию и соответствующий ей эффект. Но при рассмотрении ситуации извне она будет выглядеть иначе. Поскольку это экспериментальная ситуация, то подкрепляющий эффект организует экспериментатор посредством контролируемого им подкрепляющего стимула.

Эти два аспекта у Скиннера неразличимы. Во многом это связано с тем, что Скиннер в своей теории описывает и неявно анализирует североамериканскую высокорационализированную систему жизни и систему контроля поведения человека в этой системе (см. Новая технократическая волна на Западе. — М., 1986). Социальная жизнь в США построена таким образом, что индивидуальная жизнь человека с детства подвергается тонкому, изощрённому и последовательному контролю. В этой системе рационально рассчитаны не только подкрепление и соответствующие реакции человека (подкрепляемые и оставляемые без подкрепления), но также и человеческая деятельность, которая рефлектирована, объективирована и отчуждена от непосредственного самоощущения отдельного индивида. Подкрепление настолько укоренено в американскую социальную действительность, что его трудно отнять от деятельности людей. Без подкрепления она становится непонятной для американца. В этой системе жизни всё рассчитано и предсказуемо. Поэтому определение действия подкрепления в терминах последствий вполне обосновано. Но это последствия социокультурные, это рационализированный принцип социального контроля, который формирует у людей навык точно просчитывать последствия своих действий наперёд.

Поэтому для Скиннера (а психология и психотехника Скиннера — это типичная американская психология и психотехника) нет различия внешнего и внутреннего, всё видится как внешнее. Действия людей подчинены логике рациональности и становятся автоматическим функционированием, реагированием на социальные стимулы. Поэтому стимулы — это, конечно, искусственные, социальные и культурные стимулы, а эффект, подкрепляющий эффект — это социальный эффект. Подкрепляющий стимул — это специально сконструированный стимул для управления поведением. Образцом такого стимула в американском обществе являются деньги. Этот «всеобщий подкрепитель», как его называет сам Скиннер, — стимул, который даёт бесконечные возможности для оперирования поведением. Такая конструктивность подкрепляющего стимула неявно предполагается и у Скиннера, когда он даёт ему функциональное определение. О том, что скиннеровская теория описывает американский образ жизни или некоторую психотехнику этой жизни, говорит также описание Скиннером режимов подкрепления, которое отображает способы экономического и социально-правового регулирования поведения человека в обществе США. Экспериментальное манипулирование с животными является по сути дела проекцией на животных социальных форм научения, а не наоборот (за что обычно упрекают бихевиористов).

Согласно Скиннеру, скорость, с которой приобретается и сохраняется оперантное поведение, зависит от режима применяемого подкрепления. Режим подкрепления определяется как некоторое правило, которое устанавливает вероятность, в соответствии с которой подкрепление будет происходить. Наиболее простым таким правилом является предъявление подкрепления каждый раз, когда субъект даёт желаемую реакцию. Эта стратегия, или режим подкрепления, называется Скиннером режимом непрерывного подкрепления. Такая стратегия подкрепления обычно используется на начальном этапе всякого оперантного научения, для того чтобы организовать научение организма определённым образом реагировать или производить нужную реакцию.

Это сугубо экспериментальный режим подкрепления. В большинстве ситуаций повседневной жизни, полагает Скиннер, такое подкрепление либо неосуществимо по различным причинам, либо же неэкономично. Это связано с тем, что в повседневной жизни подкрепление поведения осуществляется отнюдь не всегда и является не одинаковым, не регулярным. Но Скиннер идёт прежде всего по линии исследования наиболее эффективных и наиболее экономичных форм подкрепления или по линии проектирования возможных его форм. Наличные, жизненные формы подкрепления его интересуют скорее как исходный материал для проектирования. Основываясь на том факте, что в большинстве случаев социальное поведение человека подкрепляется только иногда, Скиннер ставит перед собой задачу описать и исследовать различные формы частичного подкрепления, исследовать соответствующие возможные режимы подкрепления и их влияние на формирование желаемых реакций.

Хотя в принципе можно выделить довольно много различных режимов подкрепления, Скиннер всё же считает, что их можно классифицировать, опираясь на два параметра, характеризующие особенности предъявления подкрепления. Во-первых, подкрепление может появиться только после истечения определённого или случайного интервала времени с момента подачи предыдущего подкрепления. Этот класс режимов называется режимами временого подкрепления. И во-вторых, подкрепление может предъявляться только после того, когда с момента предыдущего подкрепления было получено определённое или случайное количество реакций. Этот класс режимов называется режимами пропорционального (числу реакций) подкрепления.

Опираясь на эти два параметра, Скиннер выделяет четыре основных режима подкрепления.

1. Первый в этом ряду режим называется режимом подкрепления с постоянным соотношением (ПС). В этом случае организм подкрепляется после достижения заранее определённого и постоянного числа соответствующих реакций. Такой режим, согласно Скиннеру, широко распространён не только в промышленности, торговле, но также и в обществе в целом. Он исторически оправдал себя, и ему по праву принадлежит наиболее важная роль в контроле над поведением людей. По мере того как образование превращается в технологию, такой режим начинает применяться и в образовании. В промышленности такая система подкрепления называется системой платы за единицу продукции, работодатель платит своим сотрудникам обычно в соответствии с числом единиц продукции, которые они произвели или продали. Этот режим подкрепления глубоко проник в американский образ жизни, даже в воспитание детей в семье.

Согласно исследованиям Скиннера, этот режим обычно даёт «высокий оперантный уровень», поскольку существует чёткая и осязаемая связь между числом реакций и подкреплением, чем чаще в этом случае организм реагирует, тем большее подкрепление он получает. Ещё одна особенность такого режима подкрепления состоит в том, что он стимулирует достижение всё больших результатов. Другими словами, такой режим подкрепления даёт эффект не просто закрепления, но и роста эффективности реагирования, в частности скорости реагирования, и стимулирует индивида ко всё более высоким достижениям. По сути дела Скиннер здесь описывает обычную буржуазную систему стимуляции труда, а затем и других сфер социальной жизни.

Второй выделяемый Скиннером режим подкрепления называется режимом подкрепления с постоянным интервалом (ПИ). В этом случае индивид подкрепляется только после того, как «твёрдо установленный» или «постоянный» интервал времени проходит с момента предыдущего подкрепления. Примером такого способа подкрепления является, например, ежемесячная выплата зарплаты и почасовая оплата труда, выдача ребёнку денег на карманные расходы и прочее. Здесь Скиннер тоже описывает обычную для него социальную действительность. Типичным примером использования такого режима подкрепления являются экзамены как регулярный способ контроля и поощрения учения. Скиннер полагает, что этот режим подкрепления даёт низкую скорость реагирования сразу после того, как получено подкрепление. Студенты после экзамена делают перерыв в обучении, эффективность учения часто низка в середине семестра и поднимается только перед экзаменом. Этот феномен был назван паузой после подкрепления.

Третий режим подкрепления, описанный Скиннером, — режим подкрепления с вариативным соотношением (ВС). В этом случае индивид подкрепляется после какого-то в среднем предопределённого числа реакций. Примером такого рода подкрепления является режим выигрышей в азартной игре. Угасание поведения, приобретённого с помощью такого режима подкрепления, согласно Скиннеру, происходит очень медленно, потому что индивид не знает, когда будет следующее подкрепление. Под контролем такого режима подкрепления игрок принуждается опускать монеты в автомат, несмотря на низкий выигрыш или даже проигрыш, веря, что в следующий раз он выиграет. Считается, что такая настойчивость вызывается именно данным режимом подкрепления или что она типична для него. Но всё же пример с азартной игрой как иллюстрацией данного режима подкрепления вряд ли является точным. В азартной игре присутствуют дополнительные мотивы. Например, мотив получения награды без усилий, мотив угадывания закономерностей подкрепления, мотив риска, мотив разрешения ситуации неопределённости, и так далее.

Наконец, четвёртый режим подкрепления Скиннер называет режимом подкрепления с вариативным интервалом (ВИ). В этом случае индивид получает подкрепление после прохождения неопределённого интервала времени. Время подкрепления в этом режиме варьирует вокруг какой-то средней величины (то есть величины времени между подкреплениями, но не является точно определённым). При этом режиме, согласно Скиннеру, скорость реагирования является прямой функцией используемой длины интервала между подкреплениями. Короткие интервалы времени между подкреплениями порождают высокую скорость реагирования, а длинные, напротив — низкую. Под контролем такого режима подкрепления индивид стремится установить постоянную скорость реагирования, потому что он не может предвидеть, когда будет следующее подкрепление. При отсутствии подкрепления в этом случае реакция угасает медленно.

Этот режим подкрепления используют преподаватели, которые дают неожиданные контрольные работы учащимся. В таком случае от учащихся ожидают высокого уровня прилежания, в силу того что они не знают, когда им будут устраивать испытание. Считается, что режим подкрепления с вариативным интервалом порождает более высокую скорость реагирования и большую сопротивляемость угасанию, чем режим подкрепления с постоянным интервалом. Все эти режимы подкрепления, как и само подкрепление, существуют объективно в культуре и формируются её развитием, куда индивид включён уже изначально. Таким образом, Скиннер незаметно для себя переходит от проблематики, сформулированной в рамках оппозиции «индивид — среда» к проблематике, репрезентированной через оппозицию «индивид — культура».

Условное подкрепление и проблема социальных механизмов подкрепления

Скиннер продолжает разработку идей о первичном и вторичном подкреплении. Первичное подкрепление, как уже говорилось, понимается Скиннером прежде всего функционально, как любые события, объекты, вообще стимулы, которые сами по себе обладают подкрепляющими свойствами. Эти стимулы являются непосредственными подкрепителями в том смысле, что они непосредственно связаны с биологическими потребностями. Поэтому они не требуют предварительной ассоциации с другими подкреплениями, чтобы быть способными прямо удовлетворить биологическую потребность. Именно опираясь на такие подкрепления, и строил Скиннер свои опыты на животных. По отношению к людям значение таких первичных подкрепляющих стимулов обычно приписывается пище, воде, физическому комфорту, сексуальным стимулам и прочему. Этой же точки зрения придерживается и Скиннер.

Значение первичных подкрепителей для организма безусловно, их ценность, согласно Скиннеру, не зависит от научения. Противоположным образом обстоит дело с вторичными (или, как их ещё называют, условными) подкрепителями. К таким подкрепителям Скиннер относит любые события, стимулы, объекты, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциативной связи с первичным подкреплением. Образование такой связи всегда обусловлено прошлым опытом организма. Самые частые примеры вторичных подкрепляющих стимулов для человека — это деньги, внимание, хорошие оценки и привязанности.

Но вторичные подкрепления не являются только характерной человеческой особенностью. Скиннер экспериментально формирует этот тип подкрепления или вызывает поведение на его основе у крыс. После того как крыса научалась нажимать на рычаг в ящике Скиннера, в экспериментальную ситуацию после каждого факта осуществления реакции вводили звуковой сигнал, за которым непосредственно следовало пищевое подкрепление. Таким образом, звук скоро приобрёл значение различительного стимула для крысы. Благодаря такому опосредующему сигналу крыса некоторое время училась реагировать только при наличии звукового сигнала, который опосредовал пищевое подкрепление и сообщал о пищевом вознаграждении. После установления такой специфической реакции пищевое подкрепление было устранено; таким образом начали осуществлять процедуру угашения формирования реакции. В связи с этим крыса через определённое время вообще переставала нажимать на педаль. Затем снова подавался звуковой сигнал, когда крыса нажимала на педаль. Несмотря на отсутствие в этой ситуации непосредственного подкрепления (первичного подкрепления), крыса продолжает реагировать на вторичное подкрепление. Она как бы «понимает», что нажатие на рычаг вызывает звуковой сигнал, поэтому продолжает настойчиво реагировать.

В такой ситуации процесс угашения реакции ослабевает. Изменяющаяся скорость нажатия на рычаг, как полагает Скиннер, отражает тот факт, что звуковой сигнал теперь действует как условный (вторичный) подкрепляющий стимул. Точная же скорость реагирования зависит от силы звукового сигнала как условного подкрепляющего стимула. А сама эта сила зависит от числа случаев, когда звуковой сигнал ассоциировался с первичным подкрепляющим стимулом, в данном случае с пищей, в процессе научения.

Скиннер утверждает, что в принципе любой сигнал может стать подкрепляющим, если он ранее ассоциировался со стимулами, уже имевшими подкрепляющие свойства. Это очень сильное утверждение. Скиннер считает, что феномен условного подкрепления поэтому значительно увеличивает сферу возможностей оперантного научения. Особенно это расширение возможностей оперантного научения применимо к социальному поведению человека. Посредством понятия условного подкрепления Скиннер по сути дела и объясняет все достижения индивида.

Если условное подкрепление, по мысли Скиннера, объединяется более чем с одним первичным подкреплением, то оно генерализуется. Это в сущности ещё один вид подкрепления. Если рассматривать историю культурных форм подкрепления, то действительно можно заметить тенденцию не только обусловливания первичного подкрепления, но также и тенденцию к генерализации условного подкрепления.

Наиболее типичный пример генерализованного подкрепления — деньги. Деньги не могут удовлетворять непосредственно первичные потребности и влечения человека, но в определённой культурной ситуации, в ситуации специфически культурно организованного обмена товаров и услуг, они являются мощным подкрепляющим стимулом, условием получения множества удовольствий. Деньги позволяют иметь необходимые услуги, медицинскую помощь, образование, предметы первой необходимости и многое другое, в некотором роде и при определённом стиле мышления деньги означают эквивалент всего.

Другими видами генерализованного подкрепления, согласно Скиннеру и другим представителям бихевиоральной психологии, являются такие генерализованные подкрепляющие стимулы, как лесть, похвала, символы власти и подчинения себе других людей, привязанности людей друг к другу. При этом отмечается, что это стимулы, включающие в себя поведение других людей, они являются социально подкрепляющими стимулами. Отмечается также, что такие стимулы действуют «сложно», «иногда едва уловимо», но всё же они очень существенны для поведения человека.

В этом контексте часто приводится пример стремления детей привлечь внимание к себе. Действительно, можно привести много примеров из практики и ряд исследований, где показывается, как дети притворяются больными, становятся назойливыми, задают нелепые вопросы, настойчиво вмешиваются в разговор взрослых, вступают в конфликт с другими детьми, обнаруживают невротические реакции, и так далее. И всё это именно для того, чтобы получить необходимое внимание. Факт, что внимание значимого другого — родителей, учителя, влюблённого и так далее для индивида является мощным стимулом, подкрепляющим соответствующее поведение. В этом смысле это особенно эффективный «генерализованный условный стимул», который может содействовать «поведению привлечения внимания».

Считается, что ещё одним из сильных социальных стимулов и генерализованным подкрепителем выступает социальное одобрение. Именно таким механизмом социального подкрепления объясняется прихорашивание человека перед зеркалом, феномен моды, который описывается как предмет социального одобрения. В целом люди хотят получить одобрение других людей. В этом смысле Скиннер вполне обоснованно полагал, что условные и генерализованные подкрепляющие стимулы очень важны в контроле над поведением людей. Но структура и механизм действия таких стимулов всё же не так просты, как это выглядит у Скиннера. Например, он говорит, что хорошие отметки являются позитивным подкрепляющим стимулом для ребёнка потому, что ранее дети получали за них похвалу родителей. То есть подкрепляющая сила отметок как бы переносится с подкрепляющей силы похвалы родителей или образуется благодаря связи этих двух подкреплений.

В действительности всё может быть гораздо сложнее. Ведь не все дети, которые получают похвалу за хорошие отметки, действительно на них ориентируют свою деятельность и получают их реально. Механизмы действия подкрепления для их полноценного описания и изучения, конечно, требуют учёта более сложных и более тонких моментов функционирования психики и человеческих интеракций. Мы уже говорили об этом и будем говорить в дальнейшем. Но здесь важно отметить следующие положения, явно или неявно присутствующие у Скиннера и у других бихевиористов, а также в когнитивной психологии.

Во-первых, следует отметить тот факт, что изучение феномена подкрепления началось от изучения непосредственного, первичного подкрепления, а затем обнаруживается, что существуют и более сложные формы подкрепления. Во-вторых, обнаруживается тенденция к обусловливанию подкрепления. Особенно эта тенденция характерна для развития и усвоения социального опыта человека. На этом же материале раскрываются генерализованные формы подкрепления, генерализованные стимулы — подкрепители. Основываясь на анализе истории культуры, нетрудно заметить, что формы такой генерализации подкреплений в различных культурах различны, но они встречаются повсеместно. Наконец, в европейской культуре XX века присутствуют свои особые способы генерализации подкрепляющих стимулов и свои специфические стимулы. Из чего можно заключить, что направление генерализации определяется социальными и культурными механизмами.

Это всё подтверждается и уточняется следующими фактами. При исследовании первичных форм подкрепления у человека учёные увидели, что здесь приходят в действие другие, более сложные механизмы. И в этой связи описание поведения человека с опорой на схему элементарного механизма подкрепления терпит неудачу. Изучение форм условного подкрепления и генерализованных форм подкрепления показывает, что все они так или иначе связаны с социальной оценкой, самооценкой и самосознанием человека, базовые структуры которого формируются в первые годы жизни. Если это так, то такие «условные» и «генерализованные» формы подкрепления находятся как бы «в крови» человека, они являются изначальными формами подкрепления человеческого поведения и усвоения человеком опыта так же, как изначально человек является социальным существом.

Если следовать логике бихевиоризма, в частности Скиннера, то развитие подкрепления должно идти от непосредственного подкрепления к условному, а затем к генерализованному подкреплению и формированию ориентации на подкрепление. Но когда мы берём воспитание и развитие ребёнка, процесс развития его отношений с матерью уже в первые месяцы жизни, то эта логика развития форм подкрепления не подтверждается. В некотором, очень важном смысле, как показывается в психоанализе и в других направлениях современной глубинной психологии, в том случае если мы попытаемся перевести проведённые в них сквозные идеи на язык бихевиоральной психологии, то вначале также существуют и специфические ориентации ребёнка на подкрепление. Более того, ребёнок в такой же мере подкрепляет реакции и действия матери, как и мать реакции ребёнка. Воспитание осуществляется в процессе сложных интеракций и сцеплений социальных подкреплений.

Если исследовать генетически исходные формы подкрепления, например подкрепление матерью поведения младенца, то оказывается, что содержательно исходными формами подкрепления являются не частные подкрепители, а общие. В данном случае — это безусловная любовь матери к ребёнку, то есть нечто абсолютно общее и «генерализованное». И именно на основе такого генерализованного подкрепления вырастают более частные формы подкрепления в процессе дифференциации его «базовой» формы.

Подкрепление и процессы генерализации и различения стимула. Скиннер выделил и подробно описал (конечно, во многом вслед за другими авторами) ещё один важный класс феноменов и понятий, который он называл генерализацией и различением стимулов. Согласно Скиннеру, генерализация возможна по отношению не только к подкреплению (подкрепляющим стимулам), но также и ко всем стимулам. Скиннер считает, что поведение, усиленное в одной ситуации, по всей вероятности, повторится, когда организм столкнётся с другими ситуациями, напоминающими первую.

В сущности это положение логически продолжает и расширяет принцип подкрепления. С этой точки зрения существует тенденция переноса одной подкреплённой ситуации на другие стимулы, на некоторое множество подобных ситуаций. Реализацию этой тенденции Скиннер и называет генерализацией стимула. Такая тенденция действительно наблюдается, и она в некотором смысле даже является общим моментом процесса воспитания. Родители хвалят ребёнка за определённое поведение дома в надежде, что он будет переносить (обобщать) это поведение и на аналогичные ситуации вне дома.

Известно, что единичный аверсивный опыт закрепляется и генерализируется на широкий класс стимулов. Единичный аверсивный опыт к человеку определённой расы легко переносится и на других её представителей. Единственный негативный опыт молодой женщины в отношениях с мужчиной может перенестись на всех мужчин, которые будут напоминать ей о травме. Некоторые авторы полагают, что в таких ситуациях единственного опыта достаточно. Экспериментально это показал ещё Дж. Уотсон в своих исследованиях, выполненных с грудными детьми, и другие авторы. Эти феномены, которые демонстрируют эффект одноразового подкрепления и эффекты генерализации стимула, по всей вероятности, связаны с генетически ранними механизмами подкрепления. Это ситуации, когда подкрепление ещё не рационализировано, когда действуют некоторые базовые, ещё рационально не расчленённые механизмы подкрепления. Здесь важен тот факт, что в такого рода исследованиях показывается непосредственная связь стимула, на который организм реагирует, и подкрепления, а также специфический перенос подкрепления на многие стимулы. Это говорит о том, что подкрепление первично по отношению к стимулам, а также о том, что подкрепление является изначально общим. Оно подкрепляет целое психики.

Противоположная генерализации стимула тенденция — это тенденция различения стимула. Она связана со способностью индивидов различать сходные стимулы и способностью по-разному реагировать на них. Это и составляет суть объяснения научения индивида: реагировать адекватным образом в различных ситуациях окружения. Согласно Скиннеру, способность к различению стимулов приобретается через подкрепление реакций в присутствии одних стимулов и неподкрепления в присутствии других. Посредством такого дифференциального подкрепления различные стимулы дают нам возможность предвидеть вероятные результаты, последующие за выполнением данной реакции в различных социальных ситуациях. В таком случае естественно, что индивидуальные вариации такой различительной способности зависят от уникального для каждого индивида опыта различных подкреплений в прошлом. Так ребёнок учится различать дружелюбную домашнюю собаку и злую собаку, поведение, находящее одобрение у сверстников и у взрослых. Способность различения стимулов связана со способностью обобщения и в определённом смысле является составной его частью.

Скиннер предполагал, что удачное личное развитие происходит в результате взаимодействия генерализующей и различительной способностей, с помощью которых люди регулируют своё поведение. А они регулируют его, согласно Скиннеру, таким образом, чтобы максимализировать позитивное подкрепление и минимизировать наказание. Здесь снова появляется вопрос о механизмах подкрепления. Когда мы говорим: «люди регулируют своё поведение», то предполагаются механизмы рефлексивной регуляции поведения, в том числе и подкрепления. Или же существуют различные уровни подкрепления? На этот вопрос Скиннер не отвечает.

Опираясь на предыдущий анализ, мы можем заключить, что процесс «генерализации стимула» всё же является некоторым первичным паттерном, на основе которого впоследствии происходит различение. Причём это различение происходит на основе более частных форм подкрепления, нежели процессы генерализации стимула. Они основываются на некоторых исходных и менее дифференцированных механизмах подкрепления. Но в любом случае как генерализация стимула, так и его дифференциация осуществляются на основе подкрепления.

Обнаруживаемые здесь связи стимула и подкрепления должны сказать нам и нечто большее о самом феномене подкрепления. Тот факт, что стимул и подкрепление так тесно связаны друг с другом, говорит о том, что существуют стадии развития, когда нельзя различить функцию стимула и функцию подкрепления. Такое состояние мы находим, например, у новорождённого. Появляющееся различие стимула и подкрепления свидетельствует о развитии Я ребёнка и соответствует становлению оппозиции сознания «Я — внешний мир» и в связи с этим — о различении когнитивного и эмоционального планов восприятия. На младенца же стимулы оказывают непосредственное воздействие и в этом смысле являются подкрепителями в широком смысле слова. Различение стимулов (сигналов) и эмоционально значимых воздействий среды появляется на определённом этапе развития ребёнка, и в этом смысле на определённом этапе развития появляется и проблема подкрепления как проблема связывания стимула и подкрепления. Только впоследствии, в силу развития сознания, они должны быть разделены. Но вначале они не дифференцируются.

Анализ типологии подкрепления Б. Скиннера

До сих пор мы в основном говорили о положительном подкреплении, но в действительности существуют и другие типы подкреплений. Скиннер их также пытается анализировать, строя свою типологию. Он считает, что поведение современного человека в основном контролируется аверсивными (то есть неприятными или болевыми) стимулами. Поэтому одним из предметов его исследований была аверсивная стимуляция и её воздействие на человека. По содержанию подкрепляющего воздействия он разбивал аверсивную стимуляцию, или аверсивный эффект, на собственно наказание и негативное подкрепление. Скиннер полагал, что можно различать наказание, при котором происходит аверсивное событие, пропорциональное реакции, и негативное подкрепление, где подкреплением является устранение условного или безусловного аверсивного стимула.

Таким образом, наказанием является любой аверсивный стимул или явление, которое следует или которое зависит от появления определённой оперантной реакции. Скиннер считает, что наказание по крайней мере временно уменьшает вероятность того, что реакция повторится. Он считает, что по меньшей мере одна из осознаваемых человеком целей наказания — побудить людей вести себя соответствующим образом. Скиннер полагает, что наказание — это наиболее общий метод контроля поведения в современном мире.

Итак, наказание, согласно Скиннеру, может быть осуществлено двумя способами: как позитивное и как негативное. Позитивное наказание определяется аверсивными следствиями поведения. Если поведение ведёт к аверсивному исходу, тогда речь идёт о собственно наказании, или позитивном наказании. Когда ребёнок себя «плохо ведёт» и его за это бьют или бранят — это позитивное наказание. Более опосредованные виды наказания — тюрьма, штраф за определённые виды поступков, исключение студента из учебного заведения за плохую успеваемость.

Несмотря на то что это различные по содержанию формы наказания, здесь есть определённый общий элемент. Этим элементом является вынуждение индивида к определённому поведению вслед за некоторым совершенным им поступком. В этом случае тоже развиваются условные формы подкрепления (наказания). Например, угроза — это уже условное наказание. По-другому осуществляется негативное наказание. Оно появляется тогда, когда вслед за поведением следует устранение возможного позитивного подкрепляющего стимула. Здесь предполагается, что положительное подкрепление уже было включено в ситуацию поведения, а затем устраняется. Примером такого вида подкрепления является лишение части зарплаты вследствие нарушения дисциплины труда или других условий получения полного подкрепления.

Аналогичная ситуация осуществляется в случае, когда детям запрещают смотреть телевизор (который они смотрели ранее) из-за некоторых проступков. В реализации данного вида подкрепления возможны два подхода. Первый осуществляется через устранение из ситуации подкрепляющего стимула (например, лишение части зарплаты). Второй — так, что за определённое поведение индивида удаляют из ситуации, в которой доступны некоторые подкрепляющие стимулы (например, ученика, который мешает вести занятия, удаляют из класса). Последний случай более сложен, поскольку здесь присутствует и элемент вынуждения и насилия, то есть также и позитивное наказание.

Следующий вид подкрепления, по Скиннеру, — негативное подкрепление. В этом случае организм ограничивает действие аверсивного стимула или избегает его. Следовательно, предполагается, что организм имеет некоторую свободу действий и определённый выбор, чего нет в случае позитивного наказания. Любое поведение, которое препятствует аверсивной ситуации, аверсивной стимуляции, в таком случае следует назвать негативно подкреплённым. Это всегда поведение, опосредованное уходом от действия аверсивного стимула.

Негативное подкрепление также может обусловливаться. Одно дело — непосредственный уход от действия аверсивного стимула, а другое — избегание аверсивного стимула, когда он специфически не репрезентирован для индивида. По такому типу, согласно Скиннеру, формируется стратегия поведения, известная как научение избеганию. Одновременно это и способ бороться с неприятными для индивида внешними условиями, то есть научиться вести себя так, чтобы предотвратить появление аверсивных стимулов. Такая стратегия подкрепления часто используется и в учебных процессах. В частности, если структура учебного процесса построена так, что она позволяет ученику избежать выполнения домашнего задания, тогда негативное подкрепление используется для усиления интереса к обучению. Но на основе такого подкрепления может формироваться поведение избегания, весьма искусные обходные пути, которые не ведут к положительным педагогическим результатам.

Таким образом, согласно Скиннеру, как подкрепление, так и наказание могут осуществляться двумя способами. Эти способы связаны с тем, что следует за реакцией — предъявление или устранение стимула. А сами стимулы могут быть двух типов: или это подкрепляющий (позитивный) стимул, или же это стимул аверсивный. Скиннер считает, что подкрепление усиливает реакцию, а наказание её ослабляет. Подкрепление поэтому может быть как позитивным, так и негативным. Позитивное подкрепление осуществляется через включение в ситуацию поведения или через предъявление положительного стимула. Негативное подкрепление осуществляется через извлечение (или удаление) из ситуации поведения аверсивного стимула. Также и наказание может быть осуществлено двумя способами: или предъявлением аверсивного стимула (позитивное наказание), или за счёт удаления позитивного подкрепляющего стимула из ситуации (негативное наказание). Если эти два вида подкрепления и два вида наказания всё же обозначить термином «подкрепление», то можно сказать, что, согласно Скиннеру, четыре формы подкрепления образуются за счёт двух видов стимулов (положительных и аверсивных), двух положений этих стимулов (их предъявления или же извлечения). Таким образом конструируются и формы подкрепления.

Предъявление аверсивной стимуляции и удаление положительного стимула лучше в исходном, простейшем случае назвать всё-таки подкреплением, потому что термин «наказание» предполагает более сложные ассоциации. Когда говорят о наказании, то обязательно предполагают два самосознающих субъекта действия и связанную с ними интеракцию. Поэтому объект наказания (субъект, испытывающий наказание) всегда связывает наказание с определённым субъектом, осуществляющим его, а также со своим поведением. Следовательно, в простейшем случае можно, например, называть предъявление аверсивного стимула отрицательным подкреплением, а удаление положительного стимула — негативным отрицательным подкреплением, или как-то ещё.

В этой типологии подкреплений явно обнаруживается конструктивность теории Скиннера, её специфическая рациональность и психотехническая ориентированность. Несмотря на некоторые её достоинства, она явно не исчерпывает формы подкрепления в процессе воспитания человека и в процессе усвоения опыта, а также она не способна описать закономерности подкрепления в этих процессах. Для описания реальных процессов воспитания недостаточно говорить о «потребности вообще», о «подкреплении вообще», но необходимо анализировать конкретные процессы подкрепления. А эти процессы имеют сложную интерактивную природу и не всегда поддаются описаниям в терминах стимулов и реакций, но скорее описываются, например, в терминах «реакция — реакция». Непроизвольность этих процессов приводит к тому, что ими нелегко оперировать. Социальные подкрепители имеют значительно более сложную структуру, чем их описывает Скиннер. Например, молчание значимого лица в ответ на вопрос ребёнка может являться специфическим подкреплением процессов экстериоризации у ребёнка определённого психического содержания. Но такие типы подкреплений не описываются в рамках типологии Скиннера.

Положение о примате положительного подкрепления у Б. Скиннера

Скиннер более всего ценил положительное подкрепление. Он активно боролся с использованием всех форм контроля поведения, основанных на аверсивных стимулах. Особенно он настаивал на положении о том, что наказание — неэффективное средство контроля поведения, и обосновывал это тем, что из — за своей угрожающей природы тактика наказания нежелательного поведения может легко вызвать побочные социальные и эмоциональные эффекты (тревогу, страх, антисоциальные действия, потерю самоуважения, уверенности в себе, и так далее). Это действительно важные побочные явления, связанные с обычным в европейской практике использованием наказания.

Скиннер считает, что угроза, внушённая аверсивным контролем, легко может подтолкнуть индивида к ещё более социально негативным моделям поведения, нежели те, за которые человек был наказан первоначально. Например, если родители наказывают ребёнка за посредственную учёбу, то впоследствии, в отсутствие родителей ребёнок (подросток) может вести себя ещё хуже. Наказание действительно может временно подавить нежелательное поведение. Но обычно это подавление в целом неэффективно. Основным возражением Скиннера против такого способа воспитания было следующее: поведение, за которым последовало наказание, скорее всего вновь появится там, где отсутствует тот, кто может наказать. Он говорит, например, что человек, которого посадили в тюрьму за жестокое нападение, не обязательно будет меньше склонен к жестокости. Поведение, за которое наказали, может появиться вновь после того, как исчезнет вероятность быть наказанным. Ребёнок, которого бьют за то, что он ругается дома, говорит Скиннер, может это делать свободно в других местах.

Хотя в действительности может дело обстоять и так, что в самом этом наказании существует соответствующее неявное указание: «этого нельзя делать именно дома, а на улице это разрешается». Так что сам феномен наказания оказывается более сложным, что показано в динамической психологии, трансактном анализе и прочее. (З. Фрейд, Ж. Делёз, Э. Берн). Наказание уже само по себе является сложной интерактивной структурой и требует к себе конкретного подхода.

Вместо аверсивного контроля поведения Скиннер рекомендовал позитивные подкрепления как наиболее эффективный метод формирования поведения, а также устранения нежелательного поведения. Аргументировал он это, как уже говорилось, не только неэффективностью аверсивной формы контроля (приводя пример тюрьмы, которая не исправляет преступников), но также и тем фактом, что позитивные подкрепляющие стимулы не производят тех побочных явлений, которые связаны с аверсивными стимулами. Именно поэтому положительное подкрепление наиболее пригодно, согласно Скиннеру, для формирования поведения.

Заслугой Скиннера является то, что он действительно показал огромные возможности позитивного подкрепления. Это оказало сильное влияние на методики воспитания детей в США и вообще на американскую педагогику. Эти идеи нашли своё приложение не только в педагогике, но также и в бизнесе, и в промышленности. Поэтому вообще в американском обществе (и не только в США) появилась тенденция управления поведением за счёт роста поощрения желательного поведения, а не за счёт наказания нежелательного.

Но всё же если мы обращаемся к процессам воспитания, усвоения опыта, развития человека, то такая позиция Скиннера в целом обнаруживает их непонимание. Можно с полной уверенностью сказать, опираясь на многочисленные исследования, что воспитать человека, организовать развитие личности, полноценно усвоить социальный опыт совершенно невозможно, опираясь только на удовлетворение потребностей, то есть в терминологии Скиннера на одном лишь положительном подкреплении. Например, Д. В. Винникот, опираясь на длительные исследования процессов воспитания ребёнка, утверждает, что фрустрация является необходимым условием полноценного воспитания и развития. Но эта фрустрация должна осуществляться на основе привязанности ребёнка ко взрослому, на основе их положительной связи. Таким образом, перефразировав идею Винникота, можно сказать, что значимым в процессе воспитания является специфическое сочетание типов подкреплений.

В рамках гештальттерапии давно разрабатывается теория, которая утверждает, что для продуктивной психотерапии (и воспитания тоже) необходим определённый баланс фрустрации и поддержки (Ф. Перлз).

Таким образом, несмотря на многие достоинства, концепция подкрепления Скиннера имеет свои ограничения, что в некотором отношении связано с идеологией бихевиоризма в целом, где и возникла проблема подкрепления. В этом смысле культурологическое изучение бихевиоризма может пролить Новый Свет и на проблему подкрепления.

4.3. Социальные механизмы подкрепления

Проблематизация бихевиоральной психотехники изнутри: оппозиция научения и исполнения. Бихевиоральная психология постепенно начинает ориентироваться на исследования когнитивных структур поведения. Во многом трансформация бихевиоральной психологии в когнитивную происходит под влиянием гештальт-психологии и психоанализа, хотя для подобного изменения были основания и в опыте развития самого бихевиоризма. К примеру, одно из направлений критики выводов Э. Торндайка представляет собой возражение против того факта, что подкрепление и закрепление являются подкреплением и закреплением именно связей стимула и реакции. Так, например, Г. Зеркл, повторяя эксперименты Торндайка, показывает, что тенденция к повторению ответа, смежного с получившим положительную оценку, проявляется и в том случае, когда в каждом последующем предъявлении порядок раздражителей, в частности близких к одобренному, изменяется. Из этого делается вывод, что влияние эффекта распространяется не собственно на сами связи стимулов и реакций, а именно на выполнение ответных реакций. По сути дела это возражение против исследования механизма подкрепления в рамках исследовательской схемы «стимул — реакция».

Последующие возражения по поводу закона эффекта Торндайка (которые являются также и возражениями против теории подкрепления Халла) связаны с влиянием когнитивной психологии и её идеологии. Авторы этого направления исследований полагают, что воздействие эффекта проявляется не столько как воздействие аффективного фактора, вызывающего состояние удовольствия или неудовольствия, а скорее как фактора, информирующего о том, что нужно и что не нужно делать для выполнения задачи (Ж. Монпелье). Значение эффекта, таким образом, сводится к его информирующей функции: эффект является не абсолютным, а относительным фактором, он определяется успехом или неуспехом выполнения задачи. Правда, здесь вступает в силу уже другая интерпретация, другая исследовательская схема, которая рассматривает испытуемого не просто как реагирующего и устанавливающего стимульно-реактивные связи, но как действующего и решающего задачи. По сути дела здесь понятие подкрепления во многом замещается понятием обратной связи. Такое замещение служит объяснением тех экспериментальных данных, где обнаруживается, что влияние эффекта тем сильнее, чем точнее даваемая испытуемому информация.

Например, повторяя опыты Торндайка, в которых испытуемые с закрытыми глазами должны были вычерчивать линии заданной длины, X. Кейсон и М. Троубридж (1932) сравнили четыре типа экспериментальных условий, в различной мере информационно насыщенных. Условие первое состояло в том, что реакция не сопровождалась абсолютно никакой информацией. Условие второе — реакция сопровождалась бессмысленным слогом. Условие третье — реакция испытуемого сопровождалась в зависимости от точности его работы оценкой «хорошо» или «плохо». Наконец, четвёртое условие состояло в указании точной длины проведённой испытуемым линии. Впоследствии были получены такие результаты: число точных реакций при первом условии равно 13,6 процента, при втором — 5,1 процента, при третьем — 22,6 процента, при четвёртом — 54,8 процента. Отсюда делается заключение, что чем более точно даётся информация, тем точнее становится реакция.

В этом случае центральным детерминирующим фактором подкрепления полагается цель экспериментальной деятельности в глазах испытуемого и его включённость в задачу. Поэтому эффект сказывается только на тех ответах и возможных детерминантах этих ответов, которые входят в задачу, и «ясно, что в данном случае речь идёт о внутренней сопринадлежности, а не просто о совпадении или смежности» (Ж. Монпелье). Эта внутренняя сопринадлежность по сути дела состоит в сопринадлежности подкрепления или обратной связи с целью задачи и процессом её выполнения.

Дж. Ньютэн специально для объяснения действия эффекта вводит понятие открытой и закрытой задачи. Он полагает, что специфический эффект воздействия положительного эффекта в реакциях научения (в его терминологии, в реакциях при открытой задаче) состоит в том, что субъект действия более или менее определённо знает, что некоторые реакции, прежде всего реакции, получившие положительную оценку, нужно запомнить и сохранить, поскольку возможно, что их придётся воспроизводить и припоминать в дальнейшем. Наоборот, в «закрытой» задаче, то есть в тех случаях, когда выполнение задачи не сопровождалось научением, положительный эффект не оказывает благоприятного воздействия по сравнению с отрицательным эффектом. Таким образом, функция эффекта явно сводится к задаче запоминания, более или менее произвольной функции деятельности и мышления.

Последующие исследования, направленные на проверку результатов Торндайка, показали, что отрицательный эффект тоже оказывает влияние на процесс и результаты научения. Из этих исследований делается, в частности, вывод, что отрицательный эффект может прежде всего оказывать положительное влияние на ответ антагонистический, противоположный тому, который получает отрицательную оценку. Например, реакция избегания, возникающая под действием отрицательного эффекта, будет вызывать положительный эффект — ощущение облегчения. И этот специфический эффект будет впоследствии упрочивать связь реакции избегания с данной ситуацией (Ж. Монпелье).

На материале экспериментов по научению в лабиринте показывается также, что отрицательный эффект может выполнять также информирующую по отношению к некоторому определённому ответу функцию и становиться подкрепляющим опытом определённой связи. Подчёркивается часто также связь отрицательного подкрепления и его значимости для испытуемого, а также способности подкрепления интегрироваться в систему индивидуального опыта. В частности, эксперименты Ньютэна показали, что в определённых условиях ответ, получающий отрицательную оценку, но способствующий выполнению последующей задачи, может лучше интегрироваться, чем положительно оцениваемый, но неинтегрированный ответ.

Опираясь на эти и другие исследования, Ж. Монпелье допускает, что отрицательный эффект способствует образованию связи между ситуацией и ответом, вызывающим этот эффект, но эта связь не проявляется в поведении при выполнении реакции, поскольку выполнение реакции требовало бы положительного эффекта. Здесь, в частности, на примере исследования отрицательного эффекта приводится возражение против бихевиоральной схемы исследования вообще: не всякая реакция является наблюдаемой или, по-другому, не всё, что человек хочет или знает, он обязательно делает. По этой причине после многочисленных исследований многие авторы настаивают на необходимости различения понятий научение и исполнение. Такого различения нет в раннем бихевиоризме, его нет и не может быть у Торндайка, это различение вводит некоторый новый ракурс рассмотрения в традиционные бихевиоральные исследования.

В частности, предлагается рассматривать связь стимула и реакции как связь процесса раздражения и некоторой потенциальной реакции таким образом, что в физиологическом плане эта связь будет проявляться в поведении лишь после замещения отрицательного эффекта положительным. Но формируется эта связь гораздо раньше, до своего проявления. Из этого делается вывод: положительный эффект является, вероятно, не необходимым фактором научения, а необходимым фактором исполнения.

Эти эксперименты и рассуждения, таким образом, исключают закон эффекта из факторов научения и переводят его действие на совершенно иной уровень. Уровень научения в бихевиористской онтологии психики и поведения — это непосредственный уровень усвоения опыта. Уровень исполнения — это более рефлектированный уровень усвоения и функционирования опыта. Можно нечто желать, уметь делать, но исполнять или не исполнять это желание или проект действия. Предполагается, что именно на уровне исполнения действует закон эффекта. Здесь вводится второй уровень функционирования психики, надстраивающийся над первым, непосредственным. Кроме того, предполагается определённая «коммуникация» между этими уровнями.

Таким образом, с одной стороны существуют определённые влечения, основанные на непосредственном опыте и его непосредственном самоощущении. Но, с другой — есть и уровень рефлексивного контроля над непосредственными влечениями и организации их исполнения. Для того чтобы такой контроль был возможен, необходима внутренняя коммуникация между непосредственными психическими интенциями и их рефлексивным отображением. Такое рефлексивное отображение должно быть ориентировано двояко. Во-первых, оно должно отображать сами непосредственные влечения, а во-вторых — следствия их реализации вовне, то есть возможное подкрепление. Это — отображение возможных последствий исполнения.

Итак, проблема усвоения опыта, его подкрепления и закрепления удваивается. На месте одной проблемы появляются две. Осознается, что научение или, шире, непосредственное усвоение опыта — это не то же самое, что его исполнение, реализация вовне. Этой же проблематикой, но в другом контексте ещё раньше начал заниматься З. Фрейд, но он пошёл ещё дальше и стал искать связи между двумя пластами функционирования психики, обнаружив срединные звенья в виде компромиссных психических структур.

При помощи этих структур он и стал описывать человеческий опыт. В связи с осознанием такого рода трудностей и в самом бихевиоризме появляется направление, ставящее своей задачей изучение социальных аспектов человеческого опыта и его подкрепления. Таким образом, осознаются ограничения и когнитивной психологии.

Социально-когнитивное направление в исследовании поведения и научения

Специфическим развитием классического бихевиоризма, необихевиоризма и когнитивной психологии стало так называемое социально-когнитивное направление в исследовании поведения и научения. В отличие от классического бихевиоризма человеческое поведение рассматривается здесь как регулирующееся сложными взаимодействиями между внутренними факторами (например, вера, ожидания, самовосприятие) и факторами внешнего окружения. Наиболее известный представитель этого направления А. Бандура полагает, в частности, что, несмотря на то что внешнее окружение действительно оказывает большое влияние на поведение человека, люди тоже играют активную роль в создании собственной окружающей среды.

В отличие от Б. Скиннера, у которого внешняя среда является единственной причиной поведения и который рассматривал научение в основном посредством прямого опыта, непосредственного соприкосновения со средой, Бандура делает основной акцент на научении посредством непрямого соприкосновения с человеческим опытом. Основной акцент в его концепции ставится на значении научения посредством наблюдения (научения посредством примеров). В человеческом развитии, согласно Бандуре, научение происходит в основном через наблюдение за поведением других людей и его результатами. В этой связи большое значение придаётся когнитивным процессам.

Если Скиннер объяснял поведение человека в терминах социальных стимулов, которые это поведение вызывают, и подкрепляющих последствий, которые его сохраняют, то Бандура настаивает также на учёте когнитивных процессов, которые опосредуют поведение. Когнитивные процессы позволяют человеку предсказывать появление событий, а также создавать средства контроля над тем, что влияет на поведение людей, и таким образом контролировать внешние влияния на повседневную жизнь. Другими словами, Бандура считает, что хотя окружение действительно детерминирует поведение, но всё же люди могут оказывать некоторое влияние как на своё поведение, так и на непосредственное окружение. Например, грубое поведение человека в непосредственном социальном окружении может привести к тому, что действия окружающих будут «наказывающими» для него, напротив, дружелюбный человек создаёт вокруг себя атмосферу поощрения своего поведения.

Таким образом, поведение человека может изменять его непосредственное окружение. И более того, поскольку человек обладает уникальной способностью планирования, он может планировать своё окружение, в том числе (сознательно или неосознаваемо) поощрения и наказания, поступающие из социального окружения. В этом смысле люди являются не только продуктами, но и производителями своего окружения.

Свою схему объяснения научения Бандура называет взаимным детерминизмом трёх детерминант: наблюдаемого (открытого) поведения, окружения (с его внешними поощрениями и наказаниями) и познавательной сферы или личностных факторов (веры, ожиданий, самовосприятий). Именно взаимное влияние этих факторов и определяет наличное поведение. Более того, Бандура полагает, что такая схема объяснения может помочь также и предсказывать реальное поведение.

Когда он полемизирует с традиционным бихевиоризмом (например, со Скиннером, который утверждает, что внешнее подкрепление является необходимым условием для научения), то он всё же принципиально против него не возражает. Бандура просто утверждает, например, что научение через внешнее подкрепление — это не единственный способ научения, то есть он пытается дополнить традиционные бихевиоральные способы научения другими. Согласно Бандуре, люди в результате предыдущего опыта могут ожидать, что определённое поведение будет иметь последствия, которые они ценят, другое поведение, с их точки зрения, произведёт нежелательные результаты, а третье — окажется малоэффективным. Таким образом, поведение людей в значительной мере регулируется предвиденными последствиями, то есть не реальными, а идеальными, умственными.

Именно в этом смысле Бандура говорит, что люди могут учиться, наблюдая, слыша, читая о поведении других людей. Научение происходит не на основе собственных последствий, а на базе учёта последствий других людей, как, например, мы можем полагаться на информацию, полученную от других людей о роковом исходе определённого поведения. Предвидеть будущие последствия возможного поведения мы можем на основе прошлого опыта в аналогичных ситуациях, на основе учёта усвоенных закономерностей появления определённого рода событий (например, предвидя возможную грозу, мы одеваемся соответствующим образом), на основе размышления, и так далее.

Бандура полагает, что, предвидя будущие последствия, мы переводим их в сиюминутные побуждения, то есть в факторы, которые влияют на поведение так же, как и реальные последствия. Это связано с тем, что наши психические процессы дают нам возможность предвидения. Очень многое в поведении люди приобретают, просто наблюдая, что делают другие, а затем повторяя их действия, то есть посредством восприятия примера, и в отсутствие внешнего подкрепления. Но таким образом вводится также оппозиция внешнего и внутреннего подкрепления, подкрепления прямого и непрямого. В научении через наблюдение некоторое подкрепление тоже присутствует, но оно не является прямым. Акцент на исследовании научения через непрямое подкрепление — характерная черта теории социального научения Бандуры.

Для обозначения внутренних факторов, влияющих на поведение, Бандура вводит понятие саморегуляции. Оно обозначает, что, устраивая своё непосредственное окружение, обеспечивая когнитивную поддержку и осознавая последствия своих собственных действий, люди обычно способны оказать некоторое влияние на своё собственное поведение.

Но, с точки зрения Бандуры, функция саморегуляции имеет внешнее происхождение, эта функция как создаётся, так и часто поддерживается влияниями внешнего окружения. Но однажды установившись, сформировавшись, эти внутренние влияния частично регулируют то, какие действия будет выполнять человек. Посредством вербальных и образных репрезентаций люди способны производить и сохранять опыт таким образом, что он становится ориентиром для осуществления будущего поведения. Кроме того, высшие интеллектуальные способности человека, его способность оперировать символами дают людям средства для воздействия на окружение.

Способность формировать образы желаемого будущего может кристаллизироваться в бихевиоральные стратегии, которые контролируют поведение людей, направленное на отдалённые цели. В таком случае внешнего контроля, внешнего подкрепления для осуществления поведения не требуется, внешний контроль и подкрепление заменяются их некоторыми внутренними коррелятами. Используя способность к оперированию символами, человек может решать проблемы, не обращаясь к реальному открытому поведению, не действуя путём проб и ошибок. По мнению Бандуры, опираясь на собственное мышление, мы можем предвидеть вероятные последствия различных действий и в соответствии с этим изменять наше поведение. И в этом предвидении последствий в виде образа действует всё тот же эффект подкрепления. Например, уже ребёнок способен предвидеть различные последствия своих действий, он знает, что за нежелательные по мнению родителей действия он может быть наказан, а за желательные — поощрён.

Бандура в противоположность классическому бихевиоризму полагает, что научение через наблюдение (моделирование) является не просто видом научения среди других, но представляет собой основу социальных форм научения. С его точки зрения научение было бы не только утомительным и неэффективным, но и опасным, если бы оно осуществлялось только на основе нашего личного опыта, наших собственных действий. В действительности в культуре научение обеспечивается прежде всего за счёт вербальной передачи опыта (информации) и наблюдения соответствующих моделей, например, деятельности других людей. Именно такое кодирование опыта и опосредованная его передача обеспечивает основу для приобретения сложных форм поведения человека. В пример часто приводится обучение вождению машины, где опыт точно описан, закодирован и быстро усваивается. Невозможно себе представить, чтобы машину учились водить путём проб и ошибок, по крайней мере это очень неэкономично. Даже дети учатся не на прямом опыте, а наблюдая игру других детей и повседневную деятельность взрослых. Дети учатся социальным навыкам, общаясь с игрушками, научаясь социальным навыкам в общении с куклами, и могут затем переносить эти навыки на общение с другими детьми. Затем на основе наблюдения люди могут выстраивать новое поведение, извлекая некоторые общие черты из наблюдавшегося поведения, конструируя различные элементы наблюдаемого опыта, формулируя правила и прочее. Всё это даёт возможность идти глубже того, что непосредственно наблюдается.

Бандура полагает, что научение на примере (через наблюдение, модели) прежде всего и формирует индивидуальный опыт. Когнитивный образ определённой поведенческой реакции через наблюдение поведения модели кодифицируется в долговременной памяти и становится ориентиром для последующего поведения. В этом смысле Бандура склонен отождествлять непосредственный опыт человека и опыт опосредованный, рационализированный. Так, например, он считает, что все феномены научения, приобретаемые в результате прямого опыта, могут также приобретаться косвенно, путём наблюдения за поведением других людей и его последствиями. Такого рода утверждения являются в действительности весьма проблематичными и исходят из позиции рационализированной американской культуры, где с опытом и научением так в действительности дело и обстоит. Хотя совершенно очевидно, что прямой опыт и опыт, полученный из вторых рук, — это различные виды опыта. И подкрепление в обоих случаях также различно. Понятно, что можно учиться на чужих ошибках, но это будет особое научение и особый тип опыта, отличный от того, который приобретается на собственных пробах и ошибках.

Бандура считает, что важным способом усилить стремление человека наблюдать, сохранять и выстраивать поведение является ситуация предвидения подкрепления или наказания. В этом смысле наблюдение за поведением, которое является причиной позитивного поощрения, или же за поведением, которое может быть предотвращением определённого аверсивного условия, может быть сильным стимулом к вниманию, сохранению, а впоследствии, в аналогичной ситуации, и к выстраиванию аналогичного поведения. В данном случае подкрепление переживается косвенно, человек может предвидеть, что сходное поведение приведёт к сходным последствиям.

Бандура подчёркивает, что внешнее подкрепление не является необходимым условием научения, хотя и может часто ему способствовать. Прямое и внешнее подкрепление вполне может способствовать организации моделирования, но этот процесс не требует с необходимостью такого подкрепления. Возражая Скиннеру, он утверждает, что внешнее подкрепление редко выступает в роли автоматического определителя поведения; если бы действия людей определялись только внешними поощрениями и наказаниями, они вели бы себя подобно флюгеру. Но это не значит, что научение может происходить без подкрепления. Бандура считает, что помимо прямого и внешнего подкрепления существует более широкий круг подкрепляющих воздействий. Человек не только подвергается влиянию непосредственного опыта, опыта, приобретённого в результате своих собственных действий, но также регулирует поведение на основе ожидаемых последствий и создаёт такие последствия для себя сам. Анализируя функции подкрепления в научении через наблюдение, он подчёркивает значение когнитивной ориентации подкрепления, в частности выполнение подкреплением побудительной и информативной функции. Например, подкрепление, следующее за реакцией, может указывать человеку на необходимость строить новую гипотезу о «правильной» реакции. Такая информативная функции подкрепления или обратной связи может осуществляться в том случае, когда подкрепление переживается как прямо, так и косвенно. С информативной точки зрения в том случае, если человек является свидетелем наказания других людей за некоторые поступки, то это наблюдение даёт ему столько же информации, как если бы наказывали самого этого человека. В таком случае, как полагает Бандура, подкрепление сообщает нам, какие последствия можно ожидать в результате соответствующей («правильной» или «неправильной») реакции.

В когнитивном контексте он говорит о косвенном подкреплении. Косвенное подкрепление — это наблюдаемое подкрепление, наблюдаемые поощрения и наказания других людей или наблюдаемые последствия других людей. Идея косвенного подкрепления занимает одно из центральных мест в этой концепции, которая предполагает, что наблюдаемые подкрепления других могут играть значительную роль в организации человеческого поведения. Люди как общественные организмы постоянно следят за действиями других людей, а также за ситуациями, в которых поведение других поощряется, наказывается или игнорируется. Поэтому люди усваивают новые способы поведения, наблюдая успехи и поражения других людей в такой же мере, как и опираясь на свой собственный опыт. Поэтому пробы и ошибки, а также оперантное обусловливание могут быть получены из «вторых рук». Всё это, позволяет экономить энергию и учиться на успехах и ошибках других.

Таким образом, Бандура полагает, что если индивид видит, что кого-то поощряют за определённые действия, то он может прийти к заключению, что также получит аналогичное подкрепление, если поступит сходным образом. И наоборот, если индивид увидит, что кого-то за определённые действия наказывают, то он может прийти к заключению, что сходным образом поступать не следует, в противном случае он попадёт в аналогичную ситуацию. Рассуждения в данном случае строятся на уровне получения и переработки информации, размышления и планирования. Человек рассматривается как рациональное существо, способное к анализу наблюдаемого поведения и извлечению из, этого наблюдения соответствующей информации. Бандура считает, что люди способны предвидеть последствия своих действий, ибо без этой способности они вели бы себя непроизвольно и рискованно. В этом видится когнитивная ограниченность его концепции. Как и все бихевиористы, он не различает рациональную имитацию (и вообще подражание) и идентификацию, уделяет недостаточное внимание изучению внутренней структуры сознания.

Бандура делает акцент в своей концепции на самоподкреплении. Это, конечно, значительно повышает объяснительные возможности теории. С точки зрения его социально-когнитивной теории научения, многие поступки людей регулируются самоналагаемым подкреплением. Более того, Бандура даже считает, чаю поведение человека в основном регулируется посредством подкрепления самого себя. Например, люди явно, или неявно всегда устанавливают для себя планку достижений, поощряют или наказывают себя за её достижение, превышение или неудачу. Причём здесь, возможны также различные стратегии поведения. Можно установить уровень достижений высоко или низко или оставить в среднем положении. Индивид может в соответствии с этим иметь различные стратегии самооценки и ожидания, он может ориентироваться на сверхдостижения или на точное выполнение задачи, или же на минимальное её исполнение Таким образом, люди сами выбирают критерии собственной оценки, а также и способы подкрепления себя из множества доступных способов, они сами себя наказывают, хвалят, разочаровываются в себе или поздравляют себя. Обычно человеку не требуется, чтобы его кто-то подкреплял постоянно, поскольку у него уже есть некоторый образ того, что должно получиться в результате, к примеру, определённой работы. И такой внутренний образ желаемого будущего, пусть иногда и очень смутный, даёт внутреннее основание для оценки собственной работы, коррекции и поощрения себя.

Таким образом, человек имеет возможность контролировать себя посредством некоторых доступных ему поощрений и наказаний. Соответствующими поощрениями люди обычно награждают себя в случае достижения ими же установленных норм поведения. В связи с тем что люди могут реагировать на своё поведение как позитивно, так и негативно, для обозначения всех особенностей такого реагирования Бандура вводит термин саморегулирования. Саморегулирование означает по сути дела действие на поведение самооценки, связанные с этим действием эффекты. Он считает, что саморегулирование побуждений усиливает поведение в основном через свою мотивационную функцию. Например, получая самоудовлетворение от достижения поставленных целей, человек может мотивировать себя прилагать ещё больше усилий, которые необходимы для достижения желаемого поведения. В целом уровень «самопроизвольной» мотивации обычно варьируется в соответствии с характером и ценностью побуждений и особенностями норм поведения. Для описания процессов саморегуляции Бандура выделяет три элемента, которые участвуют в саморегулирующем поведении. Это процессы самонаблюдения, самооценки и самоответа. Самонаблюдение нечто фиксирует, процесс самооценки — оценивает, а самоответ, опираясь на самооценку, соответствующим образом реагирует на самонаблюдаемое и самооценённое поведение.

У Бандуры идея опыта и его подкрепления развивается далее, точнее, получает свою экспликацию прежде всего, когда он говорит о том, что опыт человека — это непрямой опыт. И этот опыт также формируется посредством подкрепления. Здесь речь идёт о рационально оформленном опыте, находящемся вовне индивида и должном перейти внутрь его, стать его «собственностью».

Близкие в этом отношении идеи развиваются и в отечественной психологии. Например, в теории деятельности А. Н. Леонтьева — идея присвоения общественного опыта. А. Н. Леонтьев основывается на работах К. Маркса, у которого идея присвоения опыта связана прежде всего с юридическими отношениями собственности и с политической идеологией формирования новых отношений собственности. В этом смысле присвоить — значит сделать своим то, что принадлежало другому. Это, в сущности, также и идея классовой борьбы, идея (уже советская) «присвоения буржуазной культуры».

Но сама по себе идея собственности и присвоения — это идея определённого самосознания, в частности пролетарского. В рамках такой идеи усвоения опыта подкрепляться должны процессы присвоения, интроекции. Эти процессы подкрепляются, в частности, через их фрустрацию, а затем организованное положительное подкрепление. Моделью здесь является эксперимент Скиннера: он сначала не даёт подопытному голубю есть, а потом при помощи пищи подкрепляет необходимые ему реакции. Но это является моделью процессов подкрепления, которые действительно существуют в европейской культуре. Аналогичные формы подкрепления можно найти и в других концепциях психики. Например, формирование обходных путей (К. Левин), процессов опосредования (Л. С. Выготский, А. Н. Леонтьев) осуществляется также на базе процессов интроекции и на основе их специфического подкрепления.

Эта модель усвоения опыта происходит через рационализацию процессов питания. Действительно, в человеческой культуре ребёнка кормят, и кормление, а также его фрустрация являются основными видами подкрепления. Правда, этот процесс обрамляется сложными социальными интеракциями. Поэтому акт питания и кормления является диалогом ребёнка с социальной средой. Ребёнок просит есть именно у матери, он контактирует именно с ней, а не с абстрактной «средой». Но из этого общения, из этих диалогов происходят все последующие формы общения и деятельности человека.

Этот механизм усвоения опыта сохраняется у человека и впоследствии является фундаментальной культурной формой усвоения опыта. Например, сегодня наиболее распространённая интроективная форма усвоения опыта — процесс «питания» информацией. В современном информационном обществе человек запрашивает свежую информацию, новости точно так же, как свежие фрукты на стол.

3. Фрейд одним из первых открывает новые формы опыта, до сих пор бывшие скрытыми. Он открывает реактивные процессы в производстве и усвоении опыта, а вместе с этим и новые формы его развития. Примером новых форм опыта можно назвать проекцию. Проекция в классическом смысле — это реактивный процесс. Но вместе с тем это процесс, на основе которого образуется опыт. Для того чтобы актуализировать процессы, проекции необходимы новые формы подкрепления (необходимо, по словам Г. Меррея, «снять внешнее давление среды»). Проективный эксперимент актуализирует процессы проекции, а вместе с ними внутреннюю структуру сознания, выносит их вовне и позволяет анализировать и заново присваивать проекции. В этом смысле проективный эксперимент в такой же мере необходим для изучения (в том числе и в процессе формирования) опыта, как и формирующий эксперимент П. Я. Гальперина (Н. С. Бурлакова, В. И. Олешкевич, 2001).

Для организации осознания и последующего принятия собственного вытесненного, то есть соответствующим образом подкреплённого опыта, Фрейд и другие представители динамического направления в психологии используют новые формы подкрепления, которые можно описать вполне точно (В. И. Олешкевич, 1997).

4.4. Культурология бихевиоризма и феномен подкрепления

Всякое понятие, всякая идея определённым образом культурно обоснованы и являются функцией культуры и общества, где они появляются. Что можно сказать в этом отношении о подкреплении, каковы культурологические условия образования этого понятия? Понятие подкрепления должно быть некоторым ответом культуры на изменившиеся условия её функционирования.

Как мы уже говорили, понятие подкрепление появилось, складывалось и развивалось в процессе поступательного движения бихевиорального направления в психологии. Идея подкрепления, идущая от закона эффекта Э. Торндайка, постепенно операционализируется, и у Б. Скиннера, который поставил это понятие в центр своей психологии, превращается в операционально-прагматическое понятие организации психотехнического действия по отношению к поведению людей. Таким образом, из сугубо исследовательского понятие подкрепления превращается в специфически психотехническое. Такая операционализация происходит на основе выделения психологической и психотехнической схемы анализа поведения, схемы «стимул — реакция». Благодаря принципу наблюдаемости, открытости этих детерминант поведения они постепенно дифференцируются, операционализируются.

Психотехническая схема «стимул — реакция» появляется в культуре, развивающейся внутри культурной оппозиции «субъект — объект»> «Я — мир». Вследствие такого развития происходит объективация мира, он превращается в объект исследования и овладения. Эта схема понимания переносится и на человека, который также становится объектом исследования. Как уже говорилось, традиция объективации человека началась от Р. Декарта, который рассматривал животных как автоматы, реагирующие на изменения среды. В американском позитивизме и прагматизме эта традиция продолжает своё развитие.

Но познание человека, схемы исследования психики отображают и психотехническую практику формирования психики. На самом деле человеческое сознание уже давно стало объектом манипулирования, будучи глубоко рационализированным европейской культурой. Например, в психоанализе человек тоже осознается как существо глубоко объективированное, и это осознание происходит изнутри самого сознания, через практику самоосознания. Таким же образом в психоанализе достигается осознание реактивности человеческого сознания. В бихевиоризме это осознание достигается другим путём, через специфическое наблюдение и исследование сознания извне, когда схема исследования формируется как проекция способа функционирования самого сознания исследователя. Состояние человека в культуре, состояние самой культуры и инициируют возникновение бихевиоризма

Как новой психологической парадигмы. Поэтому вопросы о том, почему появляется бихевиоризм, в чём его историческая сущность, можно трансформировать в вопрос о культурно-исторических условиях его возникновения.

Схемы исследования, которые предложил бихевиоризм, уже давно существовали в американской культуре и были важным организующим моментом её функционирования. Задолго до исследований Торндайка, Скиннера психотехническая схема подкрепления была её конституирующим моментом. Буржуазная культура предполагает анализ и измерение труда, свободную рабочую силу, а также систему вознаграждения труда как технику его стимуляции и управления его эффективностью. Таким образом, подкрепление сначала существует как психотехника в новоевропейской буржуазной культуре, которая своё дальнейшее развитие находит в постиндустриальном обществе, а затем уже становится психологией, психологической схемой исследования и схемой управления формированием поведения.

Феномен подкрепления — культурное явление. Акт подкрепления осуществляется на основе идентификации с символами культуры, поэтому подкрепление в своей основе связано с образами культа и образами культуры В этом смысле именно культура подкрепляет и формирует способы подкрепления. В таком случае способ подкрепления непосредственно связан с сознанием, которое подкрепляется, и можно сказать, что способ подкрепления формирует сознание, но верно также и обратное: существующее сознание через свои проекции внешних объектов тоже формирует способ и формы подкрепления в определённой культурной ситуации. И в этом смысле подкрепление как процесс и как функция существует не только воовне, но и внутри сознания изначально.

Так, например, в Средние века настоящая награда за страдания в земной, телесной жизни наступает только после смерти, не в этом, а в другом мире. Награда, наказание или воздаяние осуществляются на небесах. Это одновременно и смерть, и награда, и возрождение. В протестантской культуре сознание индивида резко меняется. Формируется личность, свободная от внешних идеологических принуждений и внешнего контроля, но принуждение и контроль становятся внутренними моментами сознания. Формируются системы правового регулирования поведения, происходит становление идеи всеобщего равенства и основанной на идеях формального права формальной свободы системы поощрения и наказании. В это же время формируется ценность личных достижений, на основе которой становятся новые виды подкрепления новоевропейского человека Таким образом, в различных культурах можно обнаружить/некоторые сквозные для них ценности подкрепления, ориентации на определённое подкрепление и подкрепители.

Развитие капитализма и наёмного (свободного) труда создало необходимость объективного и всеобщего измерения труда. Развитие разделения труда приводит также и к более сложным системам его объективного определения и измерения. Всё это ведёт к новой организации труда и его стимулированию. Дальнейшее разделение труда, механизм рыночного регулирования производства и потребления, формирование механизма денег (этого всеобщего эталона и «всеобщего подкрепителя», по словам Скиннера) приводят к новому сознанию и новой системе подкрепления его функционирования и развития. Точное экономическое измерение работы по внешне наблюдаемым продуктам на основе измерения количества и качества труда в денежном отношении позволяет организовать точное денежное вознаграждение за выполненный труд. Поэтому в буржуазной психотехнической культуре подкрепление труда и поведения вообще осуществляется довольно просто и постепенно механизируется и автоматизируется. Это становится возможным благодаря тому, что здесь все уже измерено, все соотношения реакций индивида и следующих за ними социальных стимулов вполне предсказуемы и заранее определены. В такой ситуации поведение человека действительно можно предвидеть. В этой рационально расчленённой системе социальной жизни возможно точное измерение подкрепления, его дозирование в соответствии с выполненной полезной для экономической системы работой. Именно в такой ситуации становится возможным определение подкрепления через его последствия. Это вполне естественно в такой культурной ситуации, в которой всё стремится быть предсказуемым.

Соответствующим образом объективируются, рационализируются потребности людей и способы их удовлетворения, тоже благодаря экономическому измерению способов и средств их удовлетворения и выражению в денежной форме. Это, вероятно, одна из причин, почему в бихевиоризме отсутствует понятие потребности, к этому времени все потребности людей объективированы и измерены. Они могут быть представлены вполне в объектной форме, могут быть созданы извне, поэтому в такой ситуации понятие внешнего стимула вполне может заместить понятие потребности.

В буржуазном обществе идея подкрепления формируется сразу как идея стимулирования произвольного (заданного) поведения, а также как идея развития (стимулирования роста) выбранного поведения, система подкрепления строится так, чтобы у индивида появлялся интерес к интенсификации и расширению своей активности. То есть система подкрепления соответствует системе и идеям расширенного производства и его развития. Но так же, как экономическая культура ориентирована на накопление, так и ориентация индивида на подкрепление существует в форме влечения к накоплению подкреплений. Подкрепление строится так, что оно стимулирует желание ещё большего подкрепления. Это оказывается возможным потому, что схема подкрепления рационально прозрачна, обобщённа и предсказуема, а также интроецируется внутрь сознания индивида.

В такой ситуации культуры и происходит формирование бихевиоризма, на основе специфического самоосознания индивида в этой культуре, на основе специфической экспликации такой ситуации, в которую человек уже изначально включён, на основе специфического, хотя и неадекватного осознания этой ситуации и себя в ней. В классическом бихевиоризме данная ситуация функционирования и развития человека проецируется на животных, в экспериментах с которыми роль точно установленной и экспериментально создаваемой потребности, точно соответствующей внешнему стимулу, выполняет голод, роль подкрепления — пища, а роль поведения — произвольно выбранные реакции и извне задаваемые требования к ним и к направлениям их роста. Но вначале бихевиористы как члены североамериканского общества эту схему испытали на себе, будучи включёнными в социальную и культурную психотехнику жизни американского общества.

Правда, остаются всё же и другие типы стимуляции поведения и вознаграждения, более идеологические и менее рациональные, к примеру, государственные награды, льготы, почести, ордена, и так далее. Советское государственное управление строилось на такого типа идеологии, поэтому советским людям был присущ более иррациональный вид стимуляции поведения. Это одна из причин, почему в нашей стране идея подкрепления не разрабатывалась, а соответствующие психологические феномены не исследовались.

Протестантская психотехническая культура как преемник средневековой культуры была ориентирована в целом на отсроченное конечное подкрепление. Но в начале XX века в Европе и прежде всего в США начинается рост новых ценностей. Они ориентированы уже не на систематический труд и достижение социального и материального успеха в жизни, не на отсроченное подкрепление, а на личное счастье и удовлетворённость жизнью в настоящий момент. Поэтому возникает потребность получить подкрепление сразу, без всяких отсрочек.

В связи с такой переориентацией ценностей появляются и новые идеологии жизни, новые психотехники. Но вместе с ними, вместе с психотехникой Б. Скиннера, а затем и Д. Карнеги в США происходит переход от протестантской к иной культуре, в том числе и психотехнической. В этой психотехнике главное, во-первых, положительное подкрепление и, во-вторых, подкрепление «мгновенное» (неотсроченное). Параллельно и навстречу этой психотехнике развиваются психотехники, ориентированные на принцип «здесь и теперь» в гуманистической психологии и в психоанализе.

В бихевиоризме психотехнический схематизм ассоциативной связи проецируется вовне, интерпретируется в терминах объектных отношений и задаёт новую схему психотехнической деятельности, предмет психологического исследования и видения человека. Ведь что значит, когда мы говорим, что вся совокупность человеческого поведения и его условий разбивается на два класса элементов: класс стимулов и класс реакций? Предполагается, во-первых, что поведение человека формируется извне, через воздействие на него определённого ряда стимулов. Такое утверждение, конечно, удерживает некоторое действительное положение человека в новоевропейской культуре и одновременно является психотехническим утверждением о том, что человека нужно изменять, и указывает, как это нужно делать. В этом смысле такая схема является прежде всего психотехнической и превращение её в схему исследования вторично. Но даже в исследовательских задачах чётко просматривается психотехническая их функция, задача воздействия на человека и его изменение. Это по-прежнему всё та же локковская идея человека как чистой доски, на которой общество пишет свои письмена. Задача, соответственно, состоит в том, чтобы изыскать, исследовать, сконструировать стимулы, которые способны изменять человека, который изначально как бы пустой, в частности, в том смысле, что все люди имеют одинаковый набор врождённых реакций. Бихевиористы вслед за Дж. Локком утверждают, что именно внешняя среда формирует индивида. Следовательно, все проблемы сводятся к научению, поэтому бихевиоризм формируется как психология научения, можно сказать, как преимущественно педагогическая психология.

Но суть научения, согласно бихевиоральной схеме исследования, состоит в стимулировании, поскольку реакции зависят от стимулов. Стимул — это всякое внешнее воздействие среды на организм. С одной стороны, есть организм, индивид, а с другой — существует объективный мир, который на него действует. Индивид сам по себе пассивен, но на него воздействует объективная среда. За такой феноменологией восприятия мира стоит психология человека XX века, прежде всего американца. Теперь социальная и культурная среда так противопоставлена самому человеку, так организована, и человек так зависим от неё, что он ощущает себя лишь в качестве воспринимающего её влияния. А становясь на позицию управления изолированными индивидами, психолог видит свою задачу в организации подобных воздействий.

Таким образом, за понятием стимул скрываются объектное действие и воздействие. Ведь мы же говорим, «какое действие оказал стимул», «действие стимула» и прочее. Но здесь действует не субъект, а объект, субъект лишь воспринимает действия, реагирует. Что же это за объект? Общество, культура. И так обстояло дело достаточно давно, но в связи с рядом исторических условий в Америке это состояние сознания проявилось наиболее отчётливо.

Слова «стимул», «стимулирование» имеют и ещё один смысл. Стимулируют всегда что-то, стимул даётся для чего-то, за использованием стимула стоит какое-то самосознающее существо. Мы стимулируем поведение, труд, и так далее. И именно благодаря развитию капитализма, рыночного производства, свободного (наёмного) труда развивалась, разрабатывалась и рефлектировалась практика стимулирования труда. Чтобы стимулировать труд крепостных крестьян, не нужно большой изощрённости, но стимулирование наёмных рабочих требует большей точности. Теперь развивается механизм денег (механизм стимулирования), труд измеряется и в соответствии со своей мерой подкрепляется. Благодаря технике измерения труда и существования всеобщего эквивалента общественных ценностей (денег, культуры денег) достигается максимально точное подкрепление труда, его физической, «наблюдаемой» части прежде всего. И это положение всё более и более рефлектируется, объективируется и отчуждается от непосредственного сознания отдельного индивида, вытесняется из его сознания. Не является ли схема исследования «стимул — реакция» проекцией именно такого объективированного состояния сознания? И эта проекция отображает действительное состояние человеческого сознания. Отдельный индивид ощущает на себе воздействие некоторой безличной и объективированной среды, которая стимулирует его поведение.

Классический бихевиоризм не случайно игнорирует понятия потребности, мотива, влечения, но ограничивается исследовательской схемой «стимул — реакция». Это тоже проекция культурного состояния человека и его сознания. Понятие мотива, в частности, — это, конечно, внутреннее понятие, поэтому является понятием самосознания и предполагает активность индивида (но эта активность мыслится как рефлектированная!). Оно несёт в себе значительную рефлексивную нагрузку и восходит, вероятно, к практике морального самоотчёта и оправдания и к юридической практике объяснения и квалификации человеческих поступков. Здесь человек мыслится как самосознающее, рефлектирующее, отдающее себе отчёт в своей деятельности и в этом смысле активное существо.

Создатели бихевиоризма встречаются уже с иной ситуацией или воспринимают поведение человека по-другому. И действительно, к этому времени человеческие мотивы были уже вполне объективированы, измерены и расчленены. Поэтому отпала необходимость обращаться к внутреннему, оно уже сплошь объективировано вовне. Поэтому бихевиоризм ориентирован на то, чтобы действовать извне, через объективные стимулы и объективированные, «научные закономерности». Он базируется на том, что потребности людей уже давно сформированы, представляют некоторую общеизвестную константу, и эти потребности рационально вполне прозрачны. Так в действительности обстоит дело в рыночном обществе с его механизмом денежного регулирования отношений людей. Посредством механизма денег всё может быть измерено, а сами деньги стали всеобщим эквивалентом самого различного рода побуждений человека. Если за деньги можно приобрести все, достигнуть всего, то они становятся основным мотивом. Но эта переменная внешняя и «внешне наблюдаемая», она относится к классу стимулов.

Поэтому какой смысл изучать мотивацию, если она кажется очевидной, она давно объективирована в культуре и её механизм давно стал механизмом управления людьми? Проблема мотивации замещается проблемой изучения стимулов. А поскольку человек рассматривается как существо принципиально реактивное, то изучение стимуляции и её механизмов представляется вполне самодостаточным. Человек к этому времени действительно стал реактивен, а его поведение вполне предсказуемо.

Таким образом, за понятиями «стимул», «реакция» и прочее скрываются механизмы социального управления. Например, возьмём центральное для бихевиоризма понятие «поведение»: слово поведение содержит признак самосознания в субъекте, которому мы этот предикат приписываем. Вести себя, повести себя соответствующим образом может только индивид, наделённый самосознанием и навыками самоконтроля, который может рефлексивно расслоиться, наблюдать за своим поведением и вести самого себя в определённом направлении.

«Повести себя так или иначе» — это мы можем сказать о самосознающем, саморефлектирующем индивиде, который благодаря этому имеет выбор. Мы говорим ребёнку, когда квалифицируем его активность: «так нужно вести себя, а так не следует», обращаясь тем самым к его самосознанию и стимулируя рефлексию поведения. Этой фразой мы говорим о том, что нужно «водить себя», как бы водить себя за руку или, как говорят немцы, уметь держать себя в руках (такова немецкая этимология термина «поведение»). Здесь слово «поведение» несёт прежде всего социальный, культурный, моральный и педагогический смыслы.

Но вот бихевиористы употребляют «поведение» в совершенно противоположном смысле, они понимают под этим термином прежде всего нечто внешне наблюдаемое. За этим словоупотреблением нетрудно увидеть проекцию сознания новоевропейского индивида и новоевропейской морали, в центре которой внешняя благопристойность, которая социально оценивается и подкрепляется. Это и есть цель воспитания, это и есть социальное поведение. Поэтому и ставится задача формирования поведения, поскольку именно оно имеет социально-прагматическое значение. Это то, что наблюдаемо, что могут увидеть и оценить другие люди.

Однако поведение рассматривается и как что-то не только внешне наблюдаемое, но и формируемое при помощи стимулов извне. Поведение — это не только наблюдаемое извне, то есть социальная маска человека, но и то, что сначала существует в виде социальных образцов, а только затем интроецируется в психическую организацию индивида. Этот процесс и описывается как процесс научения, результатом которого является навык.

Феноменология слова «навык» тоже интересна и тоже характерна для бихевиоризма. Это слово так же, как и термин «поведение» происходит от общего корня «вести». Но когда говорят о навыке, то неявно предполагается некоторый процесс, к нему приводящий — наведение.

С этой точки зрения, чтобы образовался навык, необходимо на него навести. А наведение — это не процесс прямого воздействия, а способ опосредованного влияния. Понятие навыка существовало уже в раннем бихевиоризме. В ходе развития исследований в рамках бихевиоризма и, таким образом, саморефлексии этого направления исследований, прежде всего методической, формируется и собственно техника наведения (или подкрепления) Скиннера. Но эта идеология неявно существовала с самого начала развития бихевиоризма как некоторое его условие. Скиннер лишь прямо, методически эту идеологию выразил.

Из всего вышесказанного можно также сделать следующие выводы. Во многом проблема подкрепления, как она разрабатывалась в бихевиоризме, имплицирована буржуазной и постиндустриальной психотехнической культурой. Психотехника подкрепления в этих культурах ориентирована на самосознание индивида. Поэтому следует предположить, что феномены подкрепления существенно связаны с самосознанием самой культуры и самосознанием отдельного индивида. В этой связи подкрепление есть не только внешний психический феномен, но и внутренний. Подкрепление в своём функционировании и развитии существенно связано (по отношению к человеческому сознанию, по крайней мере) с процессом самоподкрепления.

Именно в этом направлении, как мы видели на примере анализа концепции Бандуры, происходит развитие психотехники и исследований проблемы подкрепления в западной психологии. И это, в сущности, некоторое возвращение западной психотехники к своим истокам. Таким образом, цикл развития психотехники в европейской культуре завершается.

Павлов И. П. Лекции по физиологии. 1912–1913 годы — М., 1949.
Скиннер Б. Оперантное поведение. // История зарубежной психологии (30–60-е годы XX века) / Под редакцией П. Я. Гальперина, А. Н. Ждан. — М., 1986.
Скиннер Б. Технология обучения. — Киев, 1974.
Талызина Н. Ф, Управление процессом усвоения знаний, — М., 1984.
Толмен Э. Поведение как полярный феномен. // История зарубежной психологии (30–60-е годы XX века) / Под редакцией П. Я. Гальперина, А. Н. Ждан. — М., 1986.
Торндайк Э., Уотсон Дж. Б. Бихевиоризм. — М., 1998.
Уотсон Дж. Б. Бихевиоризм. // Хрестоматия по истории психологии / Под редакцией П. Я. Гальперина, А. Н. Ждан. — М., 1980.
Халл К. Принципы поведения. // История зарубежной психологии (30–60-е годы XX века) / Под редакцией П. Я. Гальперина, А. Н. Ждан. — М., 1986.

Разделы и рубрики