Теория выполнения действия: значимое поведениеВ
С этим парадоксом часто сталкиваются те, кто работает в области физиологии. Поражение вентромедиальной зоны гипоталамуса, приводящее к повышенной реактивности, не стимулирует животное «длительно работать за пищу», напротив, такие животные дают меньше реакций, чем контрольные в тех же самых условиях опыта (лишение пищи). После всестороннего изучения условий, которые вызывают такое расхождение результатов, эти факты получили рациональное объяснение при различении двух систем: систем «запуска» и «остановки», мотивации и эмоций. Изучение условий, приводящих к угашению поведенческих реакций, в этих случаях уменьшает трудности, с которыми сталкивается теория научения. Согласно этой теории, выполнение действия должно отражать «усилие», затрачиваемое организмом, когда он Эксперименты показывают, что стойкость к угашению не просто связана с неспособностью обучаться новому, неспособностью вырабатывать новые дифференцировки, неэффективностью усвоения информации или образованием конфликтующих ответов. Разные авторы по-разному интерпретировали эти факты. Например, Д. Лоуренс и Л. Фестингер (1962) предполагали, что информация, необходимая для осуществления «конфликтных», «рассогласованных», или «диссоциированных», ответов, вызывает более стойкий навык, чем это можно было ожидать. А. Эмзель (1958) подчеркнул состояние фрустрации, которое переживает организм в подобных «рассогласованных» ситуациях. Большинство экспериментов и споров было связано с изучением состояния, которое возникает в подобных ситуациях, вызывающих рассогласование и фрустрацию. Так, было установлено, что рассогласование и фрустрация возникают в том случае, когда результат действия не приводит к таким последствиям, которые в достаточной мере его «оправдывают». Однако если вся информация, предшествующая действию, была бы налицо и был бы свободный выбор, действие вообще не осуществилось бы. Иначе говоря, рассогласование и фрустрация возникают только тогда, когда результаты поведения не совпадают с ожидаемыми, то есть когда организм не может регулировать своё поведение. Таким образом, поведение становится выражением эмоциональпого процесса, а не регулируется — через мотивационные каналы — его результатами. Но исчерпали ли мы тем самым полностью проблему? Хорошо известно, что у морфинистов часто сила их влечения, стремления к наркотику пропорциональна величине затраты той «энергии», которая требуется для получения наркотика. Действительно, в большинстве случаев больные, у которых наблюдались симптомы отказа от наркотика, испытывают понятное отвращение к нему. В экспериментах с обезьянами-резусами обнаруживается сходная взаимосвязь между влечением и режимом подкрепления у животных (Clark and Polish, 1960; Clark, Schuster and Brady, (1961). Конечно, существенную роль играют индивидуальные различия, однако законы, регулирующие потребление морфия (например, действующие в Англии), определяются прежде всего соотношением «энергия — влечение»; в Англии наркоманы получают наркотики по медицинским показаниям и поэтому проявляют мало поведенческих нарушений. Вследствие этого контрабанда наркотиками не имела успеха и проблема наркомании была сведена к минимуму. (К сожалению, в последнее время картина несколько изменилась Эти наблюдения приводят нас к тому же самому, до сих пор не разрешённому вопросу, а именно: может ли тот факт, что поведение находится под контролем эмоциональных процессов, быть единственным объяснением стойкости к угашению? Какие другие объяснения здесь возможны? Обратимся к теории информации, которую подтверждают некоторые весьма интересные эксперименты, показывающие, как организм привыкает к наркотикам или как у него вырабатывается влечение к ним. В большинстве случаев организм способен осуществить ряд альтернативных ответных реакций. Когда поступающая информация уменьшает число таких ответов, говорят, что информация исчерпана. Именно объём информации определяет сокращение числа известных альтернатив, количество неопределённости, которое организм может освоить в процессе выбора. Как мы уже отмечали в главе XI, теория информации связывает, таким образом, количество информации с количеством неопределённости. Термин «информация» имеет отношение к будущему (какое количество информации может быть получено?), тогда как термин «неопределённость» имеет отношение к прошлому (насколько уменьшилась неопределённость в результате действий?). Когда организм решает уже знакомую «му задачу, его действия не уменьшают эту неопределённость. Тем не менее регуляция поведения каким-то образом продолжается. Подобная ситуация наблюдается тогда, когда поведение контролируется центральным гомеостатическим механизмом. Так, у животных, испытавших когда-то голод, жажду или сексуальное влечение, действия, направленные на удовлетворение этих потребностей, имеют тенденцию к продолжению. Влечения и аффекты этих животных обнаруживают повторный и циклический характер. Каким же образом эти гомеостатические механизмы осуществляют контроль над поведением? Ответ предполагает, что действия регулируются тем значением, которое эти действия имеют для организма. Изменение значения тех факторов, которые управляют поведением — в обычном смысле этого слова, — конечно же, обеспечивается информацией. Однако, согласно более узкому пониманию теории информации, этот процесс аналогичен процессу настройки сервомеханизма, поскольку он устанавливает ценность поведенческого акта, который стабилизирует этот процесс. Точный смысл слова «ценность» идентичен тому смыслу, который обычно придаётся «тому слову в социальных науках (см., например, Zimbardos, 1969). На различии между «информацией» и «ценностью» мы остановимся несколько позднее. Р. Уолен (1961) провёл следующий эксперимент с крысами, продемонстрировавший разницу между информацией и ценностью. Он показал, что у самца выбор между двумя коридорами лабиринта зависит от завершения его контактов с сексуально доступной самкой, но скорость бега в лабиринте продолжает варьировать в прямой зависимости от числа подобных контактов, несмотря на то, что животное не получает никакой новой информации о местонахождении самки после первых нескольких проб. Спепс (1956) получил сходные результаты, используя в качестве подкрепления кусочки пищи.
Результаты Уолена и Спенса показывают, что, как только начинается действие, подкрепляющие агенты обнаруживают интересные свойства: увеличение числа подкреплений в определённых пределах ведёт к равномерному увеличению скорости выполнения задания. Таким образом, ценность поведения определяют подкрепляющие агенты, благодаря им корригируется поведение. Следовательно, результаты поведения могут совпадать с установкой организма, с его влечениями или же расходиться с ними. Это означает, что поведение регулируется, скорее, опережающим процессом, а не процессом обратной связи (см. Рис. XVI–1). Парадокс системы «средства — цели»Тот фактор, который определяет, контролируется ли поведение процессами обратной связи или опережающими процессами, прямо вытекает из анализа отношения «средства — цель» и их парадоксального изменения. Дж. Мейс (1962) указывал на те факторы, которые вызывают такое изменение отношений.
Некоторые условия, при которых происходит перестановка в системе «средства — цели», уже известны. Д. Примак (1959) провёл эксперименты с выработкой оперантных условных рефлексов. Он измерял частоту ответов в значимой для организма ситуации (например, частоту актов еды), затем сравнивал эту величину с другой независимой величиной (например, частотой нажатия на рычаг). Полученные им результаты говорят о том, что подкрепление возникает всякий раз, когда ответы с низкой независимой частотой (нажатия на рычаг) совпадают — в определённых границах — со стимулами, которые управляли осуществлением ответов с высокой независимой частотой (еда).
Остроумная постановка эксперимента подтвердила эту точку зрения; один из этих опытов особенно показателен. «Были созданы такие условия для крыс, которые вызывали в одном случае большую вероятность питья, чем бега, а в другом — большую вероятность бега, чем питья. У тех же самых животных бег служил подкреплением для питья, а питье — подкреплением для бега. Такие отношения означали, что «вознаграждался» попросту любой ответ, который сам по себе более вероятным, чем другой» (Premack, 1962, р 255; Pис. XVI–2). Очень интересен эксперимент, посвящённый изучению активности животного в приспособлении с колесом, которое было снабжено тормозом и механизмом, прекращающим поступление жидкости.
К сожалению, Примак рассматривает только связь между ответами. Ему не удалось полностью выявить те непосредственные операции, которые определяют ответ. Ответ в ситуации оперантных условных реакций указывает на то, что организм действует в зависимости от данной ситуации. Действие (как об этом говорилось в главе XIII) подготавливается ие набором мышечных сокращений (движений) организма, а совокупностью внешних условий, вызывающих это движение. В действительности оперантный «ответ» как показатель действия является одним из компонентов этой совокупности. Следовательно, «частота ответа» — объект изучения Примака — имеет отношение не столько к быстроте движений, сколько к той скорости, с которой некоторые действительно наблюдаемые последствия этих движений могут быть зарегистрированы организмом. Например, в одних экспериментах наблюдалась обезьяна Цебус. Эта обезьяна прекрасно умела чмокать губами, кружиться в клетке и кувыркаться; всё это были иррелевантпые движения, которые не должны были регистрироваться в данной ситуации как ответы, поскольку объектом изучения были манипуляции с рычагом, дверью и корзиной. Даже частные движения, включённые в эти действия, были совершенно несущественны в этих экспериментах — обезьяна могла пользоваться для выполнения действия правой или левой рукой, ногами или даже головой». Короче говоря, оперантные условные ответы фактически представляют собой звенья Значение стимула и формирование плановВ книге «Планы и структура поведения» (Миллер, Галантер, Прибрам, 1965) обсуждались два аспекта проблемы мотивации: планы и значимость поведения. Планы строго направляют поведение, то есть выбор программ выполнения этих планов. Значимость играет несколько иную, менее специализированную роль в запуске планов, их выполнении и завершении. Если рассматривать значимость как фактор, определяющий выполнение и завершение действия, то понятие значимости поведения становится более ясным. Таким образом, эффект действия, подкрепляющий его результаты, обнаруживает две особенности: он может обеспечивать информацию, то есть сокращать количество неопределённости в ситуации или направлять поведение организма, определяя его значимость (см. Рис. XVI–1). Рассмотрим две эти особенности подкрепляющего эффекта действия более подробно. Во второй части книги мы показали, что сенсорные возбуждения вызывают длительные изменения в работе центральной нервной системы. Возникшие констелляции нервных процессов могут быть описаны как процессы, происходящие в сенсорном, «входе». Если эти сенсорные потоки адресуются к одной из «компетентных» систем, они превращаются в воспринимаемую информацию. Таким образом, количество воспринимаемой информации может быть определено как величина совпадения между входом информации и компетентностью систем. Это определение следует из теории информации, согласно которой количество воспринимаемой информации соответствует количеству информации, передаваемой по каналам, пропускная способность которых соответствует нервной компетентности. В главе XIV, однако, было отмечено, что мобилизация компетентности организма зависит от гибкого, способного к модификациям механизма, который описан в главе XV как процесс подкрепления, ведущий к завершению поведенческого акта. Необходимость в завершении действия возникает потому, что нервный субстрат поведения (по крайней мере у млекопитающих) не содержит локальных механизмов, работа которых автоматически ведёт к выполнению акта. Вместо этого существуют механизмы, запускающие частные виды активности, связанные с различными отделами нервной системы; для выполнения акта необходима интеграция, организация этих частных видов активности. Такое распределение частных функций, очевидно, свойственно всей нервной системе, и в главах VI, VII и VIII мы рассматривали влияние этого неврологического факта на процесс переработки сенсорной информации (и необходимость таких явлений, как топографическая трансформация и так далее). Теперь я хочу добавить к этому следующий важный вывод: переработка сенсорной информации, поскольку она является подкреплением, формирует вначение стимула. Как известно, раньше все проблемы психологии сводились к двум вопросам: какова природа сходства стимулов и какова природа подкрепления. В действительности же это вовсе не две проблемы: сходство и подкрепление представляют любой одно и то же явление, хотя в одном случае оно описывается преимущественно на языке стимулов (сходство), а в другом — главным образом на языке ответов (подкрепление). Подкрепление последовательно увеличивает способность к различению стимулов и уменьшает их генерализацию; процесс различения стимулов, то есть приобретения ими определённого значения, и есть подкрепление. Нервные процессы, участвующие, согласно этой точке зрения, в механизме научения, будут коротко описаны ниже. «Возможно, что эта модель является прекрасным описанием того, что представляет собой подкрепление для организма. Этот нервный механизм в силу иерархической природы его избирательного контроля над его же собственными модификациями допускает изменение Образа результата в ходе последовательных актов поведения. Всякий раз, когда поступающая информация такова, что не происходит полного совпадения этой информации с Образом результата, последний модифицируется для того, чтобы включить эту информацию, и поведение продолжается. Таким образом, организм может в относительно неизменных или мало изменяющихся внешних условиях осуществлять поиск во внешней среде той дополнительной информации, которая ему необходима для уменьшения неопределённости. Эта нервная модель могла бы быть ответственной за процесс поиска информации организмом, нуждающимся в такой информации, до тех пор, пока корригирующие изменения в Образе результата ие прекратятся, то есть до тех пор, пока не будет достигнута стабильность» (Pribram, 19606, р. 8). Акты рассматривания, принюхивания, прислушивания, ощупывания и тому подобное являются, по сути дела, подкрепляющей активностью, с того момента, как организм начал выполнение задачи. Обезьяны в процессе решения задачи отказываются от пищи, которая даётся им в награду за правильный ответ, потому что их защечные мешки и руки полны пищей, и всё же они будут упорно продолжать решение задачи. Так, обезьяна будет засовывать в свой защечный мешок земляной орех, который она получает в награду за правильное выполнение задания, только для того, чтобы потом снова вытащить и съесть его, когда она совершит свою следующую ошибку. Главным фактором, управляющим поведением, становится не пища, а стремление получить информацию. Однако, для того чтобы информация стала фактором, регулирующим поведение, то есть чтобы информация етала значимой для организма, обезьяна должна превратить поступающую информацию в последовательные информационные звенья, связанные с её компетентностью и стремлением к завершению задачи, подобно тому, как в пищеварительной системе заглатывание пищи предшествует её перевариванию. Таким образом, значение стимула формируется иерархически организованным механизмом, перерабатывающим информацию. В главах XII и XIII проводилось подробное сравнение сенсорных и моторных механизмов мозга. Чему соответствует в моторном механизме процесс формирования значения, когда информация перерабатывается с помощью сенсорного механизма? Можно предположить, что в моторном механизме происходит иерархический процесс, аналогичный тому, который характерен для сенсорных систем. Образ результата формируется не «объектами» или «интересами», а с помощью тех факторов, которые продуцируются самим действующим организмом. Эти факторы должны обусловливать то стремление к завершению действия, которое подготавливает моторные механизмы к результату. Более того, благодаря работе быстродействующего мозжечкового механизма Образ результата предвосхищает действие. Итак, известно, что: 1) нервный механизм вследствие его избирательного контроля над его же собственными модификациями допускает изменение Образа Результата в ходе последовательных актов поведения и что 2) всякий раз, когда «не происходит полного совпадения поступающей информации с Образом Результата, последний модифицируется для того, чтобы включить эту информацию, и поведение продолжается… до тех пор, пока корригирующие изменения в Образе Результата не прекратятся»; следовательно, любая последовательность предвосхищающих образов, но существу, представляет собой программу или План. Таким образом, достижение результата осуществляется в процессе выполнения действия, и, признав это, мы тем самым признаем теорию, объясняющую выполнение действия через результат. Эта теория объясняет различия в функциях подкрепляющих агентов во время научения (когда они обеспечивают информацию) и во время осуществления действия (когда они оценивают и управляют поведением). По крайней мере один класс переменных — частота ответов, — как выяснилось, играет главную роль в определении тех условий, при которых организм больше не обучается, хотя и продолжает выполнять действие по обратной схеме: вместо «средства — цель» — «цель — средства». Выполнение действия достигается благодаря иерархической природе процессов подкрепления (на языке стимулов — благодаря процессам различения): значения возникают, если информация по иерархическим законам перерабатывается в сенсорных системах, а планы и программы формируются в процессе переработки информации в предвосхищающем моторном механизме. Следующая (четвёртая) часть книги содержит подробное изложение неврологии тех процессов, которые лежат в основе формирования значения и планирования, в ней описывается взаимодействие рецепторных и моторных мозговых механизмов и каждого из них с мозговыми механизмами других существ. ЗаключениеПрежде чем продолжить изложение, подведём итог сказанному. В первой части книги обсуждался двухпроцессный кодирующий механизм работы мозга, который имеет дело с состояниями и с тем, как протекают операции на фоне этих состояний. Состояния кодируются в виде микроструктуры медленных потенциалов, которые генерируются в соедипениях нейронов. Перекодирование операций осуществляется посредством нервных импульсов, которые возникают при сдвиге этих состояний; импульсы продолжаются до тех пор, пока не будет восстановлено исходное состояние. Модификации микроструктурных синаптических процессов (память) бывают трёх видов: длительные, временные и мгновенные. Во второй части двухпроцессный механизм работы мозга рассматривался в связи с субъективным опытом. Помимо детекторов (врождённых) признаков и особого аналитического (изменчивого) механизма, нервный аппарат обладает гибкой системой распределения информации. Это свойство обеспечивается синаптической микроструктурой медленных потенциалов и в функциональном отношении напоминает те механизмы переработки зрительной информации, которые называются голограммами. Кроме того, во второй части было описано, каким образом с помощью билатеральной симметричной сенсорной стимуляции конструируется образ внешней «реальности», а также то, каким образом такие специфические состояния, как голод и жажда, настораживание и сонливость, активное стремление к цели и пассивность, обусловливаются работой нейронных и химических механизмов ствола мозга. Каждый механизм ствола мозга состоит из двух частей: активирующей и тормозящей; активирующая часть связана с «инстинктивными», мотивационными ощущениями, а тормозящая — с «аффективными», эмоциональными ощущениями. Однако эти инстинктивные потребности, аффекты и чувство интереса имеют более широкую неврологическую основу, чем только механизмы ствола мозга; она включает большое число контролирующих кортикальных мозговых процессов, в том числе и такие, которые контролируют аппараты ствола мозга и сенсорные системы. Здесь мы развивали «кибернетическую» теорию мотиваций и эмоций, основанную на двухпроцессном механизме функционирования мозга. В третьей части мы анализировали нейронные механизмы регуляции поведения. Мы проводили различие между движением и действием. Движение, состоящее из мышечных сокращений, контролируется двухпроцессным механизмом, сходным с тем, который контролирует сенсорные процессы. Это сходство основано на существовании в рефлекторной организации системы эфферентных волокон, которая проводит сигналы от центрального нервного аппарата к рецепторам, расположенным в мышечной ткани. Эта система волокон организована по принципу кольцевого рефлекторного сервомеханизма Т—О—Т—Е, а не по принципу дуги «стимул — ответ». В процессе контроля над сокращением мышц должны, следовательно, включаться сигналы, идущие не только от сокращающейся мышцы, но и от этих рецепторов: если информация от них не поступает, у укороченной мышцы возникает «молчащий период» в возбуждении рецепторов, что мешает плавному выполнению движения, В действительности движение может контролироваться только посредством изменений в установках, которые воздействуют на спонтанные разряды мышечных рецепторов, подобно тому как работа отопительной системы в доме контролируется регуляцией температуры в термостате. В данной части обсуждалось значение этого типа контроля над выполнением действий. Действия определяются как последовательности движений, обусловленные внешней средой. Озадачивающие результаты экспериментов, посвящённых изучению роли двигательных отделов коры мозга, нашли своё объяснение, когда были получены данные, подтвердившие важность сенсорной коры для действия и показавшие, что моторный образ (представляющий собой статическую часть двухпроцессного механизма) связан с рядом факторов, вызывающих возбуждение мышечных рецепторов, а не с Нейронная основа модификации поведения обсуждалась с точки зрения результата. Способность к модификации поведения во времени зависит от того, что элементы, лежащие в основе моторного образа, компетентности организма для выполнения того или другого Акта, распределяются в нервном субстрате точно так же, как и элементы (биты информации) — в сенсорном образе. Эти элементы комбинируются, интегрируются в различные структуры, причём возникают подвижные комбинации. Процесс подкрепления делает эту интеграцию более длительной. Можно предположить, что подкрепление «индуцирует» непрерывные изменения в нейронных соединениях. Однако эти изменения могут приводить к устойчивым модификациям поведения только тогда, когда стимулируемое у организма стремление к завершению действия не разрушается вследствие отвлечения. Существуют два защитных мозговых механизма: один — регистратор подкрепления соответствия результатов поведения замыслу. Эта функция осуществляется с помощью механизма, который позволяет «внутреннему эху» освободиться от влияния последовательности новых событий. Другой механизм оценивает результаты, которые больше не подкрепляются. Эти нервные механизмы обеспечивают организму устойчивое состояние готовности к подкреплению, благодаря чему и происходит научение. Вследствие этого прежнее поведение продолжается (хотя и остаётся способным к новым изменениям с помощью подкреплений) тогда, когда осуществление действия не даёт ничего нового, никакой новой информации. Теория, объясняющая выполнение действия с помощью результатов, исходит из этого различения эффектов подкрепления во время научения и во время выполнения действия. Эта теория подтверждается данными бихевиористов относительно возможности перестановки членов в системе «средства — цель» (например, результатами экспериментов с угашением), а также наблюдениями над наркоманами и фактами, показывающими, что частота ответа влияет на взаимоотношение между типами поведения. Все эти факты прямо подводят нас к рассмотрению того, каким образом мозг формирует значение и контролирует планы; эти два процесса существенно зависят от достижения результата. Таким образом, мы пришли к выводу, что исследование регуляции поведения должно быть сосредоточено не на изменении поведения организма в результате влияния внешних условий, а на изменении этих внешних условий посредством последовательного поведения, осуществления действий и достижения результата. Существует одно важное различие между восприятием и чувствами, с одной стороны, и действием — с другой. Восприятие без вмешательства действия имеет тенденцию к простой ассимиляции внешних условий организмом (в том смысле, в котором употреблял этот термин Пиаже); чувства же, даже если они находят внешнее выражение, имеют тенденцию быть простой проекцией организма во внешнюю среду (как это понимал Фрейд). Действие, скорее всего, представляет собой процесс достижения согласования (или аккомодации, по терминологии Пиаже) между восприятием организма и его чувствами. Действие имеет и другие последствия. Благодаря действиям достигается согласование между организмами. Именно эта коммуникационная функция действия и является предметом обсуждения в четвёртой части книги. В этой сфере особую проблему составляет проблема реализации человека в результатах его действий. Рассмотрим же теперь, каковы те нервные механизмы, которые обеспечивают коммуникационную функцию действий, а это необходимо нам, чтобы выяснить, что же делает человека Homo sapiens. РезюмеВыполнение действия состоит из двух фаз: 1) продолжение процесса научения, изменяющего компетентность организма, и 2) продолжение действия для достижения результата. Теория, объясняющая выполнение действия через результат, основана на экспериментах с угашением актов поведения, в частности на опытах с привыканием к наркотикам и опытах, показавших, что частота ответа предопределяет взаимоотношение звеньев в системе «средства — цель» в ситуации подкрепления. |
|||||
Оглавление |
|||||
---|---|---|---|---|---|
|
|||||