Необихевиоризм: как психология вернула мозг в «чёрный ящик»

Когда «стимул-реакция» перестала объяснять поведение крыс

Классический бихевиоризм Уотсона, с его чёткой формулой S-R (стимул → реакция), столкнулся с проблемой: он не мог объяснить множество наблюдаемых феноменов. Почему крыса, изучившая лабиринт, внезапно находит короткий путь, если старый блокируют? Почему поведение сохраняется, даже когда подкрепление временно отсутствует? Упрощённая модель игнорировала то, что происходило внутри организма между стимулом и реакцией. В 1930-50-е годы на смену пришёл необихевиоризм — движение, которое, сохраняя верность объективным методам и фокусу на поведении, решилось приоткрыть «чёрный ящик» психики, вводя гипотетические промежуточные переменные. Это не было возвратом к интроспекции, а попыткой научно смоделировать внутренние процессы, объясняющие сложность и целенаправленность поведения.

Эдвард Толмен: крыса с «когнитивной картой» и латентное научение

Эдвард Толмен, часто называемый «когнитивным бихевиористом», нанёс первый удар по механистической модели S-R. Его ключевой тезис: организм (O) — не пассивный передатчик стимулов, а активный обработчик информации. Поведение целенаправленно (молярное поведение), то есть направлено на достижение цели, а не является простой суммой рефлексов.

Эксперименты с лабиринтом и рождение «когнитивной карты»

В своих знаменитых экспериментах Толмен помещал голодных крыс в сложный лабиринт. Классический бихевиорист ожидал, что крыса выучит последовательность поворотов (цепочку реакций S-R), ведущую к пище. Но Толмен обнаружил нечто иное.

В одном эксперименте он разделил крыс на три группы:

  1. Группа I: Всегда получала пищу в конце лабиринта.
  2. Группа II: Никогда не получала пищу в лабиринте.
  3. Группа III (экспериментальная): Не получала пищу первые 10 дней, но начинала получать её с 11-го.

Результаты были поразительны. Как только группа III начала получать подкрепление (еду), её результаты практически мгновенно сравнялись, а затем и превзошли результаты группы I, которая тренировалась с подкреплением с самого начала. Это означало, что крысы учились латентно — они строили ментальное представление о структуре лабиринта даже в отсутствие внешней награды. Толмен назвал это представление «когнитивной картой» — своего рода внутренней схемой пространственных отношений в среде.

Когда в другом опыте привычный путь к пище блокировали, крысы часто выбирали альтернативный маршрут, ведущий к цели кратчайшим образом, демонстрируя гибкость, невозможную при простом заучивании поворотов. Они действовали не как автоматы, а как существа, оперирующие внутренней моделью окружающего мира.

Промежуточные переменные у Толмена (например, ожидание, цель, гипотеза) стали научными конструктами, объясняющими, почему один и тот же стимул может вызывать разные реакции у разных организмов или у одного организма в разное время. Его формула стала S-O-R, где «O» — это когнитивные процессы, опосредующие реакцию.

Кларк Халл: гипотетико-дедуктивная теория и движущая сила потребностей

Если Толмен делал акцент на познании, то Кларк Халл, другой титан необихевиоризма, построил строгую математизированную теорию, в центре которой стояли потребности организма. Халл стремился создать универсальную систему аксиом и теорем, предсказывающую поведение подобно физическим законам.

Его теория вращалась вокруг концепции редукции драйва (побуждения). По Халлу, поведение запускается состоянием нужды (например, голод, жажда), которое создаёт драйв. Цель поведения — удовлетворить нужду и тем самым редуцировать драйв, что само по себе является подкреплением. Сила реакции (реактивный потенциал) зависела от множества факторов: силы драйва, силы навыка (истории подкреплений), стимульных обобщений и т.д.

Хотя чрезмерная формализация и сложность системы Халла позже были подвергнуты критике, его вклад огромен. Он систематически ввёл внутренние переменные (драйв, привычка) в бихевиоральный анализ, подняв его на новый уровень теоретической сложности, и оказал огромное влияние на экспериментальную психологию середины XX века.

Беррес Скиннер: радикальный бихевиоризм и власть последствий

В то время как Толмен и Халл пытались усовершенствовать бихевиоризм, вводя гипотетические внутренние конструкты, Беррес Скиннер пошёл другим, радикальным путём. Он не отрицал существования внутренних событий (мыслей, эмоций), но настаивал, что они — такой же продукт истории взаимодействия со средой, как и открытое поведение, и подчиняются тем же законам. Его подход, радикальный бихевиоризм, стал вершиной и одновременно поворотным пунктом в развитии бихевиоральной мысли.

Оперантное поведение: действие, управляемое последствиями

Ключевым открытием Скиннера было чёткое разделение двух типов поведения:

  1. Респондентное: Ответ на предшествующий известный стимул (классический условный рефлекс по Павлову). Пример: отдергивание руки от горячего.
  2. Оперантное: Активные «испускаемые» организмом действия, на частоту которых влияют их последствия. Предшествующий стимул может отсутствовать или быть неочевидным. Пример: ребёнок плачет, чтобы получить внимание; учёный проводит эксперимент, чтобы узнать истину.

Скиннер утверждал, что именно оперантное поведение составляет львиную долю нашего поведенческого репертуара. Им движет не прошлое (стимул), а будущее (ожидаемые последствия).

Ящик Скиннера и анализ подкрепления

Для изучения оперантного поведения Скиннер изобрёл свой знаменитый прибор — оперантную камеру, или «ящик Скиннера». В нём животное (крыса или голубь) могло совершать простое действие (нажать на рычаг, клюнуть диск), а аппарат автоматически регистрировал реакцию и выдавал подкрепление (порцию пищи).

Этот метод позволил Скиннеру с невиданной точностью изучать, как режимы подкрепления (например, подкрепление каждого ответа vs. подкрепление каждого пятого) влияют на скорость научения, устойчивость поведения к угасанию и форму кривой реагирования. Он открыл, что вариативные режимы (когда подкрепление даётся после случайного числа реакций) порождают чрезвычайно устойчивое и постоянное поведение — феномен, лежащий в основе работы игровых автоматов и многих форм человеческой активности.

Четыре квадранта оперантного научения: система последствий

Скиннер разработал исчерпывающую классификацию последствий, которая до сих пор является основой поведенческого анализа. В её основе лежат два вопроса: 1) Добавляется или убирается некий стимул? 2) Увеличивает или уменьшает это вероятность поведения в будущем?

Тип последствияКак работает?Влияние на поведениеБытовой пример
Положительное подкрепление (П+)Добавление приятного стимула после поведения.Увеличивает вероятность поведения.Зарплата за работу → больше желания работать. Похвала ребёнка за уборку.
Отрицательное подкрепление (Н-)Удаление неприятного стимула после поведения.Увеличивает вероятность поведения.Принятие обезболивающего, снявшего боль → повышает вероятность принять его снова. Нажатие на «отложить» на будильнике.
Положительное наказание (П-)Добавление неприятного стимула после поведения.Уменьшает вероятность поведения.Штраф за превышение скорости. Крик на ребёнка за шалость.
Отрицательное наказание (Н-)Удаление приятного стимула после поведения.Уменьшает вероятность поведения.Лишение ребёнка гаджета за плохое поведение. «Тайм-аут» (лишение внимания).

Скиннер был ярым противником наказания, считая его неэффективным в долгосрочной перспективе (оно подавляет поведение лишь временно и вызывает побочные эффекты: страх, агрессию, уклонение). Он выступал за контроль поведения через положительное подкрепление как наиболее гуманный и эффективный метод.

От лаборатории к практике: терапия, образование и «управление поведением»

Скиннер был не просто теоретиком; он страстно верил в применение своих принципов для улучшения общества.

Запомнить