操作条件反射
操作条件反射在心理学中的作用
为什么被奖励或惩罚会影响你的行为
我们都从事一些我们知道会带来好结果的行为。我们也会避免那些我们知道会有负面后果的行为。所以,得到奖励的行为更可能被重复(受到惩罚的行为则相反)。这种学习方法被称为行为主义心理学家B.F. 斯金纳所称的“操作条件反射”,它对我们日常行为有着强大的影响。
操作条件反射,有时也称为工具性条件反射,是一种通过奖励和惩罚来学习的方法。通过操作条件反射,一个行为与其后果(无论是积极的还是消极的)之间建立了联系。
例如,当实验室的老鼠在绿灯亮时按下杠杆时,它们会得到食物作为奖励。而在红灯亮时按下杠杆,则会受到轻微的电击。因此,它们学会了在绿灯亮时按下杠杆,而在红灯亮时避免这样做。
然而,操作条件反射不仅仅是在训练实验室动物的实验环境中起作用。它还在日常生活中的学习中扮演着重要的角色。强化和惩罚在自然环境中一直存在,也在更结构化的环境中,如课堂或治疗室中发生。
继续阅读以了解更多关于操作条件反射的起源、如何运作以及如何用于教导、修改和塑造你的行为的例子。
Verywell / Joshua Seong
操作条件反射的历史
操作条件反射首先由行为学家B.F. 斯金纳描述,这就是为什么你偶尔会听到它被称为斯金纳条件反射。作为一个行为主义者,斯金纳认为,为了理解行为,没有必要去探究内部的想法和动机。相反,他认为,我们应该只关注外部的、可观察的行为原因。
华生的影响
在20世纪前半叶,行为主义成为心理学中的一个重要流派。约翰·B. 华生的思想在此期间占据主导地位。华生专注于经典条件反射的原则,并曾大胆宣称,他可以不管一个人的背景如何,都能训练他们成为任何他选择的职业。
早期的行为主义者主要关注关联学习。斯金纳对人们行为的结果更感兴趣。
斯金纳用术语“操作”来指代任何“主动行为,该行为作用于环境以产生后果。” 斯金纳的理论解释了我们展示出的各种行为是如何获得的。
托尔曼的影响
他的理论受到了心理学家爱德华·托尔曼工作的极大影响,托尔曼提出了所谓的效果法则。根据这一原则,跟随在行为之后的有利结果会使行为更有可能再次出现,而跟随在行为之后的不利结果则会使行为更不可能再次出现。
操作条件反射依赖于一个相当简单的前提:跟随在强化之后的行为会被加强,并且在未来更有可能再次出现。如果你在一个有趣的笑话后告诉同学们一个故事,大家都会笑,那么你可能会更愿意在未来再次讲述这个故事。
如何运作
如果你举手提问并且老师表扬了你的礼貌行为,那么下次你有疑问或评论时,你更有可能举手。因为这个行为后面跟着的是强化,即一种有利的结果,所以前面的行为得到了加强。
相反,导致惩罚或不利后果的行为会被削弱,并且在未来更不可能再次出现。如果你在另一个课堂上再次讲同一个故事但这次没有人笑,那么你再次重复这个故事的可能性就会降低。如果你在课堂上大声说出答案并且老师批评了你,那么你未来打断课堂的可能性就会减少。
反应型与操作型行为
斯金纳区分了两种不同类型的反应:
- 反应型行为 是那些自动发生的无意识行为,如从热炉子上缩回手或者医生敲打膝盖时抽腿。你不需要学习这些行为;它们只是自动且不可控制地发生。
- 操作型行为 则是我们有意识控制的行为。有些可能是自发的,有些则是故意的,但正是这些行为的后果影响了它们在未来是否还会发生。我们对环境的操作以及这些操作的后果构成了学习过程的重要部分。
虽然经典条件反射可以解释反应型行为,但斯金纳意识到它无法解释大量的学习。因此,斯金纳认为操作条件反射具有更大的重要性。
斯金纳在他童年的发明才能在他对操作条件反射的研究中发挥了作用。他创造了一种设备,称为操作条件反射箱,通常现在称为斯金纳箱。箱子可以容纳一只小型动物,比如老鼠或鸽子。箱子还包含一个杠杆或按键,动物可以通过按压它们来获得奖励。
为了追踪反应,斯金纳还开发了一种装置,称为累积记录器。该装置通过向上移动线条来记录反应,以便响应率可以通过线条的斜率来读取。
操作条件反射的组成部分
操作条件反射涉及几个关键概念。强化或惩罚的类型会影响个体的反应方式以及条件反射的效果。四种类型的操作条件反射可以用来改变行为:正强化、负强化、正惩罚和负惩罚。
操作条件反射中的强化
强化是任何增加或增强其后行为的事件或结果。有两种类型的强化。在这两种情况下,行为都增加了。
正强化
正强化是在行为之后呈现的有利事件或结果。在正强化的情况下,一种反应或行为由于直接奖励而得到加强。如果你在工作中表现出色,经理给了你奖金,那奖金就是一种正强化。
负强化
负强化涉及在行为展示后移除不利事件或结果。在这种情况下,一种反应由于移除了一些被认为是不愉快的东西而得到加强。例如,如果你的孩子在餐厅中间尖叫,但一旦你递给他一个糖果,他就停止了尖叫,你的行为导致了不愉快情况的移除,从而对你的行为进行了负强化(而不是孩子的行为)。
操作条件反射中的惩罚
惩罚是指呈现不利事件或结果以减弱其后行为的一种过程。有两种类型的惩罚。在这两种情况下,行为都减少了。
正惩罚
正惩罚,有时称为应用惩罚,是指在行为之后呈现不利事件或结果,以削弱该行为。听起来这似乎自相矛盾,但在这种情况下,“正”并不意味着“好”。而是表示在情境中添加了惩罚。对不良行为进行体罚就是一种应用惩罚的例子。
负惩罚
负惩罚,也称为移除惩罚,是指在行为发生后移除有利事件或结果。拿走孩子在表现不佳后手机一天的时间就是一个负惩罚的例子。
回顾
操作条件反射的五个原则是正强化、负强化、正惩罚、负惩罚和消退。消退发生在行为不再被强化或惩罚时,可能导致行为逐渐消失。
操作条件反射强化计划
强化并不总是一个简单的过程,有几个因素会影响新事物的学习速度和程度。斯金纳发现何时以及如何强化行为会影响新行为的学习速度和旧行为的改变程度。
换句话说,强化的时间和频率影响了新行为的学习和旧行为的改变。
斯金纳确定了几种影响操作条件反射的强化计划:
连续强化
连续强化是指每次行为发生时都提供强化。学习相对快速地发生,但反应速率较低。一旦停止强化,消退也非常快。
部分强化
一旦行为建立起来,通常最好过渡到部分强化。在这种强化计划中,只有部分行为才得到强化。这可以基于已经发生的反应次数或经过的时间。
- 固定比率计划 是一种部分强化。只有在一定数量的反应之后才强化行为,通常会导致相对稳定的反应速率。
- 固定间隔计划 是另一种部分强化形式。只有在经过一定时间之后才强化行为。反应速率保持相对稳定,并随着强化时间临近而增加,但在强化交付后立即减慢。
- 可变比率计划 也是斯金纳描述的部分强化形式之一。强化行为发生在变化数量的反应之后。这会导致较高的反应速率和缓慢的消退速率。
- 可变间隔计划 是斯金纳描述的部分强化形式之一。该计划涉及在经过变化量的时间后强化行为。这也倾向于导致较快的反应速率和缓慢的消退速率。
操作条件反射的例子
无论你是否意识到,你都是通过操作条件反射学到某些东西的。你也可能在没有意识到的情况下使用过它。
我们在周围到处都可以找到操作条件反射的例子。考虑以下情况:孩子们完成作业以获得家长或教师的奖励,或员工完成项目以获得表扬或晋升。操作条件反射在行动中的其他例子包括:
- 在社区剧院演出后,你获得了观众的掌声。这是一种正强化,激励你在未来尝试更多的表演角色。
- 你通过给狗狗赞美和抚摸来训练它捡球。这是一种正强化。
- 教授告诉学生,如果他们整个学期都有完美的出勤记录,就不用参加期末综合考试。通过移除一种不愉快的情况(期末考试),学生们被负强化来定期出勤。
- 如果你未能按时提交项目,老板会在同事面前批评你的表现。这是一种正惩罚,使你未来迟到提交项目的可能性降低。
- 少女没有按照要求打扫房间,她的父母没收了她一天的手机。这是一种负惩罚,涉及移除一种积极刺激。
在上述某些例子中,奖励或可能的奖励导致行为增加。
操作条件反射也可以通过移除有利结果或施加不利结果来减少行为。例如,一个青少年女孩没有按照要求打扫房间,她的父母取消了她一天的手机使用权。这是移除积极刺激的负惩罚,可能会减少她未来不遵守要求的行为。
要点
尽管行为主义在20世纪前半叶占据了主导地位,但操作条件反射仍然是学习和行为修正过程中一个重要且常用的方法。有时,自然后果会引导我们的行为发生变化。在其他情况下,奖励和惩罚可能是有意给予的,以促使行为变化。
操作条件反射是你可能立即在自己的生活中识别出来的,无论是教导孩子良好行为还是训练家庭宠物。
记住,任何类型的学习都需要时间。考虑哪种类型的强化或惩罚最适合你独特的情况,并评估哪种类型的强化计划可能会带来最佳结果。