心理知识

理论

行为心理学

可变比率计划的特点和示例

可变比率计划提供部分、不可预测的强化

在操作条件反射中,可变比率计划是一种部分强化计划,其中反应在不可预知数量的反应之后得到强化。这种计划产生了稳定且高频率的反应。赌博和彩票游戏是基于可变比率计划奖励的好例子。

强化计划在操作条件反射过程中起着核心作用。强化的频率可以帮助确定反应的学习速度以及反应的强度有多强。每种强化计划都有其独特的特点。

![可变比率计划如何运作](https://www.verywellmind.com/thmb/Rzm86gqBPnRXg7pOrXBs3YK_Gqg=/1500x0/filters:no_upscale():max_bytes(150000):strip_icc():format(webp)/what-is-a-variable-ratio-schedule-2796012-5c17efb3c9e77c000183f1f9.png)

可变比率计划的特点

可变比率计划有三个常见特点:

  • 奖励是在不可预测数量的反应之后提供的:奖励的给予没有可预测性。它可能在第一次反应后,也可能在第五次,或者完全是另一个数字。
  • 导致高且稳定的反应率:当受试者不知道何时会给予奖励时,他们会继续每次反应,希望这次反应能够得到奖励。
  • 在强化后只会有短暂的暂停:在可变比率计划中,在接受强化后只有轻微的暂停。这类似于可变间隔计划,其中在强化后的暂停也是短暂的。

如何识别可变比率计划

在识别不同的强化计划时,从计划本身的名称开始查看可能会有所帮助。对于可变比率计划来说,“可变”这个词表示强化是在不可预测数量的反应之后提供的。“比率”则意味着强化是在一定数量的反应之后给予的。结合起来,这个词意味着强化是在变化数量的反应之后提供的。

对比“固定比率计划”的强化计划也会有所帮助。在固定比率计划中,强化是在一定数量的反应之后提供的。

例如,在一个VR 5的可变比率计划中,动物可能会因为每五次反应而获得奖励,平均而言。一次可能是三次反应后奖励,然后是七次反应,接着是五次反应,等等。强化计划将平均出每五次反应奖励一次,但实际交付计划仍然不可预测。

另一方面,在一个FR 5的固定比率计划中,强化计划可能设定为每五次反应后奖励一次。与可变比率计划不同的是,固定比率计划是设置好的和可预测的。

可变比率计划

  • 强化在变化数量的反应之后提供
  • 提供计划不可预测
  • 示例包括老虎机、挨家挨户销售、视频游戏

固定比率计划

  • 强化在固定数量的反应之后提供
  • 提供计划可预测
  • 示例包括生产线工作、成绩卡奖励、销售佣金

可变比率计划示例

可变比率强化在现实场景中看起来是什么样的?以下是一些可以考虑的例子。

  • 课堂学习:可以在课堂上使用可变比率计划来帮助学生学习。由于学生不知道何时会因做家庭作业而得到奖励,因此他们可能会更倾向于完成所有要求的作业。
  • 老虎机:玩家无法知道需要玩多少次才能赢。他们只知道,最终会有一局获胜。这就是老虎机如此有效并且玩家往往不愿意停止的原因。总是有可能下一次投入的硬币会是获胜的一次。
  • 社交媒体:社交媒体中有两种方式可以出现可变比率计划。一种是,当你进入社交媒体账户时,你永远不知道是否会发现任何通知、评论或点赞。然而,你会不断回去检查以看看是否有什么出现。类似地,你也不知道新闻推送中会出现什么,但你仍然不断浏览寻找你喜欢的帖子。
  • 销售奖金:呼叫中心经常提供随机的员工奖金。员工永远不知道需要打多少电话才能获得奖金,但他们知道随着更多的电话或销售,他们增加获奖的机会。
  • 挨家挨户销售:在这个可变比率的例子中,销售人员挨家挨户地走动,但永远不知道何时能找到感兴趣的买家。可能是下一个房子,或者可能需要多次拜访才能找到新客户。
  • 视频游戏:在某些游戏中,玩家收集代币或其他物品以获得奖励或达到下一关。玩家可能不知道需要收集多少代币才能获得奖励,甚至不知道奖励是什么。
回到首页