积极强化:它是什么以及它是如何工作的?

关键要点

  • 积极强化的概念与行为主义心理学家B. F. 斯金纳的工作相关。作为他在20世纪30年代和40年代工作的一部分,斯金纳考虑了通过基于某人的行为以不同方式对待他们来改变行为的方法。这一理论被称为操作条件作用。
  • 积极强化指的是在执行某种行为后引入令人愉快或满意的刺激。这种奖励可以用来进一步鼓励该行为,或者改变一个现有的行为。
  • 有四种类型的积极强化物:自然的、具体的、社会的和代币。
  • 积极强化可以在实验中按照部分固定的计划进行交付。
  • 积极强化有许多后果,无论是在实验室还是在现实世界中,范围从学习和工作场所的行为到社交媒体使用。

负强化

积极强化是通过提供令人愉快或满意的事物来奖励期望的行为,以增加该行为在未来再次发生的可能性。

它是如何工作的?

积极强化是斯金纳操作条件作用的基本原理之一,指的是在行为之后引入令人愉快或满意的刺激,例如奖励。

这种令人满意的刺激旨在强化行为,使该行为在未来更有可能发生。这可以用于教授新行为或加强现有行为。

操作条件作用是支持斯金纳积极强化技术的理论。本质上,这个想法是通过控制跟随行为的后果来修改行为。

斯金纳认为学习是一个主动的过程。当人类和动物在环境中行动时,这些行为会产生后果。如果后果是愉快的,他们会重复该行为;但如果后果是不愉快的,他们就不会重复该行为。

斯金纳认为,内部思想和动机不是解释行为所必需的。相反,他认为这种解释可以从外部和可观察的原因中得出(Staddon & Cerutti, 2003)。

如果一种行为后面跟着一个积极的后果(即强化),那么这种行为在未来更有可能再次发生;相反,如果一种行为后面跟着一个消极的后果(即惩罚),那么这种行为再次发生的可能性就较小(Staddon & Cerutti, 2003)。

积极强化的类型

有四种类型的积极强化物可以用来鼓励行为,每种类型根据个体和情况可能更加有效或不太有效(Kamery, 2004)。

  • 自然强化物 是那些直接因行为而产生的。例如,一个人由于持续的研究和努力,在工作中创造了高收益的活动,可能会得到加薪和晋升。
  • 社会强化物 涉及对期望行为表示赞许。例如,老师或家长可能会表扬孩子,或者雇主可能会称赞员工的工作出色(Kamery, 2004)。
  • 具体强化物 涉及对期望行为给予实际的物质奖励。这些可能包括糖果、零食、玩具、金钱或其他令人满意的东西。虽然这些奖励可能非常强大,但过度使用会减少在没有这些奖励时的行为动机(Kamery, 2004)。
  • 代币强化物 是因执行某些动作而获得的积分或代币。这些可以兑换成有价值的东西。例如,老师可能会因为学生按时完成作业而给他们积分,这些积分可以兑换成奖品(Kamery, 2004)。

示例

动物训练

积极强化的经典用途之一是在动物训练和行为中。动物训练的一般格言是奖励积极行为并忽略不希望的行为。

使用积极强化作为训练动物的方式可以追溯到早期的心理学研究,特别是B. F. 斯金纳的作品。

斯金纳设计了一种奖励积极行为的方法,称为斯金纳箱(Dezfouli & Balleine, 2012)。
基本上,这个斯金纳箱包含一个强化物——一个杠杆或按钮,当以特定方式按下时,会提供食物或水等奖励——和一个追踪器。

斯金纳箱或操作条件作用室实验示意图。用于理解动物行为的小鼠或大鼠实验的标记教育实验室设备结构矢量插图

通过这种方式,动物可以学会以特定方式执行任务以获得奖励。这是一个具体的强化例子(Dezfouli & Balleine, 2012)。

在工作场所

积极强化也可以在工作场所使用,以鼓励期望的行为。例如,雇主可能会因为员工达到或超过销售目标而给予奖金。

这种类型的积极强化通常被称为“绩效相关薪酬”或“按绩效支付薪酬”系统。

另一个例子是,一名每天准时上班的员工可能在每个月底都会收到一张礼品卡,以此来强化准时的行为。

或者,雇主可能会给员工额外的带薪休假日,以强化良好的出勤率(Ackerman, 2022)。

需要注意的是,积极强化不应与贿赂混淆。贿赂是指在某人做某件他们本来不会做的事情之前给予他们某些东西。

与此同时,积极强化发生在行为已经表现之后。例如,一个已经每天准时上班的员工不能被贿赂去做这件事——他们只能在表现后获得奖励形式的积极强化(Ackerman, 2022)。

社交媒体

近年来,社交媒体的使用激增,积极强化可能是原因之一。Facebook、Twitter 和 Instagram 等平台都利用点赞、关注者和其他形式的积极强化来保持用户的参与度。

例如,一个人在 Instagram 上发布照片后,很可能会从朋友和关注者那里获得点赞。这反过来又鼓励这个人继续发布照片,因为他们因此得到了积极强化。

同样,一个经常发推特并收到大量回复和转发的人可能会继续发推特,因为他们因自己的行为而受到强化。

需要注意的是,并非所有社交媒体平台都以相同的方式使用积极强化。许多传统社交媒体平台,如 Instagram 和 Facebook,使用点赞系统来奖励用户创建帖子。

然而,Snapchat 并不使用点赞或关注者作为积极强化的形式。相反,该应用程序使用连击数——即两个人连续几天互相发送消息的数量。

这鼓励用户频繁互相发送消息以维持他们的连击数(Ackerman, 2022)。

积极强化的时间表

斯金纳研究的一个重要方面是考察不同模式和频率奖励的有效性。

一个积极的强化时间表定义了寻求使用积极强化的人如何鼓励行为。有五种不同的积极强化时间表(Ferster & Skinner, 1957)。

  1. 连续时间表,每次行为发生后都会进行强化。不幸的是,这种时间表很难维持,因为执行行为的人很少能出现在每次行为发生的时候。
  2. 固定比例强化时间表,在特定次数的行为发生后进行强化。例如,鸽子可能在啄三下后获得一粒谷物。
  3. 固定间隔,在特定时间后对行为进行强化。
  4. 可变比例,在变化次数的行为发生后进行强化。例如,行为可能在一次发生后得到强化,然后在另三次发生后,再在两次发生后得到强化。
  5. 可变间隔,在变化的时间后对行为进行强化。例如,在一分钟、30分钟和10分钟后。

强化时间表图

这些时间表取决于上下文。例如,一个希望升职的成年人可能每年都会获得一次升职,因为长期时间表对成人来说通常是有效的。

同时,对于已经理解哪些行为是期望的狗来说,固定比例时间表可能更有效。

积极强化不是负强化的对立面

积极强化和负强化都会增加行为重复的可能性。唯一的区别是用于实现这一目标的后果类型。

虽然积极强化使用令人满意的后果来增加行为重复的可能性,但负强化在行为表现后移除不愉快的条件,以增加其未来发生的可能性(Dozier, Foley, Goddard, & Jess, 2019)。

负强化是指在行为表现后移除不愉快的刺激,以增加该行为重复的可能性。

例如,吸烟者在吸完烟后可能会感到解脱,因此更有可能再次吸烟以体验那种解脱感(Cherry, 2018)。

相比之下,积极强化是指在行为后添加令人愉快的刺激,以增加其重复的可能性。

继续上述例子,如果吸烟者在吸烟后得到一根巧克力棒,他们更有可能为了得到巧克力棒而重复该行为。

有证据表明,积极强化和负强化在不同方面都是有效的。例如,最近的研究表明,虽然积极强化在短期内可能更有效,但负强化实际上可能导致更持久的行为改变(Ferguson & Beaver, 2016)。

需要注意的是,并非所有强化物都是平等的。有些人可能对一种类型的强化物反应良好,但对另一种则不然。

还值得注意的是,某些行为可能根据个人的不同,既可以通过积极强化也可以通过负强化来增强(Ferguson & Beaver, 2016)。

最终,是否使用积极强化或负强化取决于要针对的行为、表现出该行为的个体以及预期的结果。

在课堂上

积极强化是一种受欢迎的方法,用于鼓励某些行为,不仅因为它是一种有效的教学方法,而且因为它是一种即使在强化结束后也可能会保留下来的方法。

一项关于课堂上使用积极强化的研究显示,它可以显著改善学生的行为和社会技能,即使在取消强化后也是如此(Diedrick, 2010)。

例如,老师可能会给按时交作业的学生颁发金星。这反过来又鼓励学生以一致的方式返回作业。

其他人可能会慷慨地给予表扬、击掌或分发糖果或小玩具,以奖励学生适当的行为。

当结合同伴压力时,课堂上的积极强化效果甚至更好。

通常,孩子们希望做正确的事情,如果在朋友和同龄人面前被抓到做错事,他们可能会感到尴尬。

因此,当有一群学生在观看时,孩子们比平时更愿意接受奖励(Ackerman, 2022)。

效果

许多研究表明,积极强化确实有效。积极强化的技术在研究和日常生活中也广泛使用。

例如,训犬师经常通过提供零食来鼓励他们希望看到的行为。

同样,父母和老师发现,积极强化作为一种训练孩子适当行为的方法非常强大(Ackerman, 2022)。

尽管如此,有几个不同的因素控制着积极强化是否会增加行为重复的可能性。

最重要的是,普遍认为,应在期望行为完成后尽快提供令人满意的刺激。

行为与奖励之间的时间越长,行为与强化物之间的联系就越弱,其他行为被强化的可能性就越大。

积极的一面是,积极强化被认为比其他训练方法更简单,因为它不需要取消奖励或引入负面后果来应对不良行为。

这可能提高学习者的士气和动机(Kamery, 2004)。总体而言,学者们认为,鼓励行为比阻止行为更容易,这意味着强化通常比惩罚更有力的工具。

最后,伴随积极感受和联想的学习更有可能在强化时间表结束后仍被记住(Ackerman, 2022)。

进一步信息

Sprouls, K., Mathur, S. R., & Upreti, G. (2015). 积极反馈是否被遗忘的课堂实践?风险学生的发现和意义。防止学校失败:儿童和青少年的替代教育, 59(3), 153-160.

参考文献

Ackerman, C. E. (2022). 心理学中的积极强化。

Bandura, A. (1977). 社会学习理论. Englewood Cliffs, NJ: Prentice Hall.

Dezfouli, A., & Balleine, B. W. (2012). 习惯、行动序列和强化学习。欧洲 神经科学杂志, 35 (7), 1036-1051.

Chen, C., Zhang, K. Z., Gong, X., & Lee, M. (2019). 强化奖励和习惯在驱动智能手机成瘾中的双重机制:智能手机功能的作用。互联网研究.

Dad, H., Ali, R., Janjua, M. Z. Q., Shahzad, S., & Khan, M. S. (2010). 学校中积极和消极强化实践的频率和有效性比较。当代教育研究问题, 3 (1), 127-136.

Diedrich, J. L. (2010). 使用积极强化激励学生(博士论文)。

Dozier, C. L., Foley, E. A., Goddard, K. S., & Jess, R. L. (2019). 强化。儿童和青少年发展百科全书, 1-10.

Ferster, C. B., & Skinner, B. F. (1957). 强化时间表. New York: Appleton-Century-Crofts.

Gunter, P. L., & Coutinho, M. J. (1997). 课堂上的负强化:我们开始了解的内容。教师教育和特殊教育, 20 (3), 249-264.

Kamery, R. H. (2004, July). 积极强化的动机技巧:综述。I n Allied Academies International Conference. 法律、伦理和监管问题学院. 论文集 (Vol. 8, No. 2, p. 91). Jordan Whitney Enterprises, Inc.

Kohler, W. (1924). 类人猿的心智. London: Routledge & Kegan Paul.

Skinner, B. F. (1938). 有机体的行为:实验分析. New York: Appleton-Century.

Skinner, B. F. (1948). 鸽子中的“迷信”. 实验心理学杂志, 38, 168-172.

Skinner, B. F. (1951). 如何教动物. Freeman.

Skinner, B. F. (1953). 科学与人类行为. SimonandSchuster.com.

Skinner, B. F. (1963). 操作行为. 美国心理学家, 18 (8), 503.

Smith, S., Ferguson, C. J., & Beaver, K. M. (2018). 学习用玩具武器进行攻击性游戏,还是只是好玩?检查玩具武器的攻击性游戏及其与犯罪的关系。犯罪行为和心理健康, 28 (4), 313-323.

Staddon, J. E., & Cerutti, D. T. (2003). 操作条件作用. 年度心理学评论, 54 (1), 115-144.

Thorndike, E. L. (1898). 动物智力:动物联想过程的实验研究。心理学专论: 一般和应用, 2(4), i-109.

Watson, J. B. (1913). 行为主义者眼中的心理学. 心理学评论, 20, 158–177.


引用来源

本文翻译自以下网站:

simplypsychology.org

使用声明

本文仅供教育和参考用途。如需转载或引用,请注明出处和作者。

如果你有任何问题或建议,请随时联系微信公众号。

回到首页