心理知识
可变比率计划的特点和示例
可变比率计划提供部分、不可预测的强化
在操作条件反射中,可变比率计划是一种部分强化计划,其中反应在不可预知数量的反应之后得到强化。这种计划产生了稳定且高频率的反应。赌博和彩票游戏是基于可变比率计划奖励的好例子。
强化计划在操作条件反射过程中起着核心作用。强化的频率可以帮助确定反应的学习速度以及反应的强度有多强。每种强化计划都有其独特的特点。
可变比率计划的特点
可变比率计划有三个常见特点:
- 奖励是在不可预测数量的反应之后提供的:奖励的给予没有可预测性。它可能在第一次反应后,也可能在第五次,或者完全是另一个数字。
- 导致高且稳定的反应率:当受试者不知道何时会给予奖励时,他们会继续每次反应,希望这次反应能够得到奖励。
- 在强化后只会有短暂的暂停:在可变比率计划中,在接受强化后只有轻微的暂停。这类似于可变间隔计划,其中在强化后的暂停也是短暂的。
如何识别可变比率计划
在识别不同的强化计划时,从计划本身的名称开始查看可能会有所帮助。对于可变比率计划来说,“可变”这个词表示强化是在不可预测数量的反应之后提供的。“比率”则意味着强化是在一定数量的反应之后给予的。结合起来,这个词意味着强化是在变化数量的反应之后提供的。
对比“固定比率计划”的强化计划也会有所帮助。在固定比率计划中,强化是在一定数量的反应之后提供的。
例如,在一个VR 5的可变比率计划中,动物可能会因为每五次反应而获得奖励,平均而言。一次可能是三次反应后奖励,然后是七次反应,接着是五次反应,等等。强化计划将平均出每五次反应奖励一次,但实际交付计划仍然不可预测。
另一方面,在一个FR 5的固定比率计划中,强化计划可能设定为每五次反应后奖励一次。与可变比率计划不同的是,固定比率计划是设置好的和可预测的。
可变比率计划
- 强化在变化数量的反应之后提供
- 提供计划不可预测
- 示例包括老虎机、挨家挨户销售、视频游戏
固定比率计划
- 强化在固定数量的反应之后提供
- 提供计划可预测
- 示例包括生产线工作、成绩卡奖励、销售佣金
可变比率计划示例
可变比率强化在现实场景中看起来是什么样的?以下是一些可以考虑的例子。
- 课堂学习:可以在课堂上使用可变比率计划来帮助学生学习。由于学生不知道何时会因做家庭作业而得到奖励,因此他们可能会更倾向于完成所有要求的作业。
- 老虎机:玩家无法知道需要玩多少次才能赢。他们只知道,最终会有一局获胜。这就是老虎机如此有效并且玩家往往不愿意停止的原因。总是有可能下一次投入的硬币会是获胜的一次。
- 社交媒体:社交媒体中有两种方式可以出现可变比率计划。一种是,当你进入社交媒体账户时,你永远不知道是否会发现任何通知、评论或点赞。然而,你会不断回去检查以看看是否有什么出现。类似地,你也不知道新闻推送中会出现什么,但你仍然不断浏览寻找你喜欢的帖子。
- 销售奖金:呼叫中心经常提供随机的员工奖金。员工永远不知道需要打多少电话才能获得奖金,但他们知道随着更多的电话或销售,他们增加获奖的机会。
- 挨家挨户销售:在这个可变比率的例子中,销售人员挨家挨户地走动,但永远不知道何时能找到感兴趣的买家。可能是下一个房子,或者可能需要多次拜访才能找到新客户。
- 视频游戏:在某些游戏中,玩家收集代币或其他物品以获得奖励或达到下一关。玩家可能不知道需要收集多少代币才能获得奖励,甚至不知道奖励是什么。