强化计划的心理学知识

如何在心理学中运用强化计划

强化计划在塑造特定行为中起着重要作用

强化计划在操作条件反射中扮演重要角色，这是一种学习过程，在这种过程中，新的行为通过与后果的关联而被习得和改变。何时以及如何强化一个行为可以极大地影响响应的强度和频率。

为什么强化计划如此重要？何时及以何种方式强化一个行为会极大地影响该行为的发生概率。

本文讨论了什么是强化计划、有哪些不同的计划可供选择，以及根据学习目标哪个计划最为有效。

什么是强化计划？

强化计划是指哪些行为实例会被强化的规则。在某些情况下，行为可能会每次发生时都被强化。在其他情况下，则可能完全不被强化。

无论是使用正向强化还是负向强化，都可能作为操作条件反射的一部分。在这两种情况下，强化的目标都是加强行为，使其在未来更有可能再次发生。

强化计划不仅在自然发生的习得情境中出现，也在更结构化的训练情境中出现。在现实世界的情境中，行为很可能不会每次都得到强化。在有意试图增强特定动作的情境下（例如在学校、体育或动物训练中），你会遵循特定的强化计划。

有些计划更适合某些类型的训练情境。在某些情况下，训练可能先采用一种计划，然后在建立所需行为后切换到另一种计划。基础形式的强化计划被称为连续强化和部分强化。

连续强化计划

在连续强化中，期望的行为每次都会被强化。这种计划最适合于学习的初期阶段，以创建行为与反应之间的强烈联系。

举个例子，假设你想教一只狗握手。在初始阶段，你需要使用连续强化来介绍和建立这个行为。这可能涉及抓住狗的爪子，握一握，说“握手”，然后每次执行这些步骤时都提供奖励。最终，狗会在没有引导的情况下自行完成这个动作。

连续强化计划在教授新行为时最有效。这些计划表示的是每次狭义定义的行为之后都跟随狭义定义的后果。

部分强化计划

一旦行为牢固建立，通常会从连续强化计划切换到部分强化计划。在部分（或间歇）强化中，只有部分行为才会被强化。通过部分强化习得的行为获得的速度较慢，但更不易消退。

想想之前的例子，在你训练狗握手时。虽然你最初使用了连续强化，但长期而言，每次行为都得到强化是不切实际的。随着时间推移，你会切换到部分强化计划，以在行为建立后或经过相当长的时间后再提供额外的强化。

有四种部分强化计划。其中两种是比率计划，即基于已发生的响应次数。另外两种是间隔计划，即基于经过的时间。

这四种强化计划有时也称为FR、VR、FI和VI，分别代表固定比率、可变比率、固定间隔和可变间隔。

固定比率计划

固定比率计划只在指定数量的响应后强化行为。这种计划会产生高且稳定的行为率，并在强化物交付后仅有短暂的暂停。

一个固定比率计划的例子是在大鼠按压杠杆五次后给它提供食物颗粒。

可变比率计划

可变比率计划发生在响应在不可预测的数量次后被强化。这种计划会产生高且稳定的行为率。

例如，在实验室环境中，这可能涉及在第一次按压杠杆后给大鼠提供食物颗粒，然后再在第四次按压后提供一次，接着在第二次按压后再次提供。赌博和彩票游戏就是基于可变比率计划的奖励示例。

固定间隔计划

固定间隔计划奖励第一个响应，仅在指定时间过去后。这种计划导致间隔末期的行为率较高，但在强化物交付后的行为率较低。

实验室环境中的一个例子是在大鼠按下杠杆后的30秒间隔后首次提供食物颗粒。

可变间隔计划

可变间隔计划发生在响应在不可预测的时间段后被强化。这种计划产生缓慢而稳定的行为率。

一个例子是当第一次按压杠杆后的30秒间隔后提供食物颗粒，第二次按压后的90秒间隔后提供第二个食物颗粒，第三次按压后的60秒间隔后提供第三个食物颗粒。

部分计划

强化时间

响应率

固定比率 (FR)

在指定数量的响应后

高且稳定

可变比率 (VR)

在不可预测数量的响应后

高且稳定

固定间隔 (FI)

在指定时间段后

间隔末期高，但立即在交付强化物后降低

可变间隔 (VI)

在不可预测时间段后

缓慢而稳定

强化计划与消退

一旦停止强化，响应开始减少。这被称为消退，指的是在停止强化后行为继续存在的时长。通常，固定强化计划更容易消退，而可变强化计划则更具抗消退性。

消退可能导致一些不良副作用。

其中之一是所谓的“反应爆发”，即在行为完全消退之前，响应暂时增加量、幅度或持续时间。
另一个是“响应变异性”，通常包括发展其他有问题的行为以达到相同的效果。

强化计划示例

强化计划可以在不同情境中应用。例如，它们可以在教育中使用，比如在完成一定数量的作业后或在一定时间内没有任何行为问题后强化学生。

在育儿场景中使用强化计划的一个例子是如厕训练孩子。你可能会开始时在孩子每次使用马桶后给予糖果（固定比率）。然后，你可能会过渡到在几天内多次使用马桶后才提供强化（要么是固定间隔，要么是可变间隔）。

强化计划也可以用于应用行为分析或ABA。在这种情况下，强化物用于改善某种行为。例如，研究表明，这些计划可能有助于帮助智力或发育障碍的人改善沟通行为。

选择适当的强化计划

决定何时强化行为可能取决于许多因素。在专门教授新行为时，连续强化计划往往是一个不错的选择。一旦行为已被掌握，切换到部分强化计划通常是更佳的选择。

在日常生活中，部分强化计划比连续强化计划更频繁地出现。例如，想象一下如果你每次准时上班都得到奖励。随着时间推移，奖励本身可能会被视为正面强化，而缺乏奖励则可能被视为负面惩罚。

相反，这些奖励通常是按照更不可预测的部分强化计划进行的。这些计划不仅更现实，而且往往能产生更高的响应率，同时也不易消退。

部分强化计划减少了行为一旦建立后因饱和而导致的问题风险。如果无休止地提供奖励，一旦来访不再需要或想要奖励，他们可能会停止执行行为。

例如，想象一下你在尝试训练一只狗坐下。如果你每次使用食物作为奖励，狗可能会在吃饱后停止执行。在这种情况下，表扬或关注可能是加强已建立行为的有效手段。

什么是二级强化物？

最后的想法

操作条件反射可以是一种强大的学习工具。强化计划在训练和维持过程中起着重要作用，影响行为的习得速度、响应强度以及响应频率。它还可以确定行为消退的速度。

为了确定哪个计划更为合适，请考虑情境的不同方面，包括正在教授的行为类型以及期望的响应类型。

社交强化如何影响行为

聚观点

聚观点