心理学中的强化时间表(示例)
===================================================
- 强化时间表是一条规则,规定哪些行为实例(如果有)将被强化。
- 强化时间表可以分为两大类:连续时间表和部分时间表(也称为间歇时间表)。
- 在连续时间表中,每次期望的行为都会被强化,而在部分时间表中,只有偶尔会强化期望的行为。
- 部分强化时间表被描述为固定或可变,并且是间隔或比率。
- 这四个描述符的组合产生了四种部分强化时间表:固定比率、固定间隔、可变比率和可变间隔。
1957年,一本对行为科学领域具有革命性意义的书出版了:C.B. Ferster 和 B.F. Skinner 的《强化时间表》。
这本书描述了生物体可以在不同的时间表上得到强化,不同的时间表会导致不同的行为结果。
Ferster 和 Skinner 的工作确立了行为何时以及如何被强化对其强度和一致性有显著影响。
引言
强化时间表是操作条件作用(也称为工具条件作用)的一个组成部分。它包括一个安排来确定何时强化行为。例如,是否根据时间或响应次数来强化行为。
强化时间表可以分为两大类:连续强化,即每次响应都进行强化;部分强化,即偶尔进行强化。
使用的强化时间表类型显著影响响应率和行为消退的抵抗力。
对强化时间表的研究为行为科学领域带来了重要的启示,包括选择行为、行为药理学和行为经济学。
连续强化
在连续时间表中,每次期望的行为后都会提供强化。
由于每次行为都会被强化,因此关联很容易建立,学习发生得很快。然而,这也意味着一旦不再提供强化,消退就会迅速发生。
例如
我们可以通过使用糖果机作为例子更好地理解连续强化的概念。
糖果机是连续强化的例子,因为每次我们投入钱(行为),我们都会收到糖果作为回报(正向强化)。
然而,如果糖果机连续两次未能提供糖果,我们可能会停止尝试投入钱(Myers, 2011)。
我们已经习惯于每次执行行为时都会得到强化,如果得不到强化,我们会很快感到沮丧。
部分(间歇)强化时间表
与连续时间表不同,部分时间表仅在偶尔而非每次期望的行为时进行强化。这导致学习速度较慢,因为最初更难建立行为与强化之间的关联。
然而,部分时间表也会产生对消退更具抵抗力的行为。生物体会倾向于坚持其行为,希望最终会得到奖励。
例如,赌场的老虎机以部分时间表运行。它们在不可预测的次数后提供金钱(正向强化)(行为)。因此,老虎机玩家可能会持续玩老虎机,希望在下一轮中赢得金钱(Myers, 2011)。
部分强化时间表在日常生活中最常见,根据奖励的响应次数(固定或可变)或响应之间的时间间隔(间隔或比率)而变化。
固定时间表
在固定时间表中,强化之间的响应次数或时间量是设定且不变的。时间表是可预测的。
可变时间表
在可变时间表中,强化之间的响应次数或时间量随机变化。时间表是不可预测的。
比率时间表
比率时间表的强化在特定数量的响应后发生。
间隔时间表
间隔时间表涉及在一段时间后强化行为。
这四个描述符的组合产生了四种部分强化时间表:固定比率、固定间隔、可变比率和可变间隔。
固定间隔时间表
在操作条件作用中,固定间隔时间表是指
当特定(可预测的)时间过后,对期望的响应给予强化。
这种时间表导致生物体在接近预期强化时间时增加响应频率的趋势。然而,在被强化后,响应频率会立即下降。
响应率的波动意味着固定间隔时间表会产生波浪形模式,而不是稳定的响应率。
例如
固定间隔时间表的一个例子是老师每周一给学生进行一次周测。
周末时,突然出现了一阵复习周测的热潮。周一,学生参加周测并因复习而得到强化(正向强化:获得好成绩;负向强化:不挂科)。
接下来几天,他们可能会在完成紧张的经历后放松,直到下一个周测日期临近到无法忽视为止。
可变间隔时间表
在操作条件作用中,可变间隔时间表是指在特定行为执行后,经过随机(不可预测的)时间后提供强化。
这种时间表产生低而稳定的行为响应率,因为生物体不知道下次会何时得到强化。
例如
在斯金纳箱中的鸽子必须啄食一个杆以获得食物颗粒。它在2-5分钟的不同时间间隔后获得食物颗粒。
它在3分钟后获得一颗食物颗粒,然后5分钟,然后2分钟等。它会稳定地响应,因为它不知道自己的行为何时会被强化。
固定比率时间表
在操作条件作用中,固定比率时间表在指定数量的正确响应后强化行为。
这种时间表导致高而稳定的行为响应率。生物体因为希望下一次响应可能是需要的以获得强化而持续响应。这种时间表用于彩票游戏中。
例如
一个固定比率时间表的例子是,一位裁缝每制作10件衣服后获得500美元报酬。在发送了10件衣服的货物后,他们获得了500美元的奖励。在得到这种强化后,他们可能会短暂休息一下,然后再开始制作衣服。
可变比率时间表
可变比率时间表是一种强化时间表,其中行为在随机数量的反应后被强化。
这种时间表会产生高且稳定的行为反应率。由于希望下一次反应可能是获得强化所需的一次,有机体在反应上会更加持久。这种时间表用于彩票游戏中。
例如
一个固定比率时间表的例子是,一个孩子每读完3-10页书就会得到糖果。例如,他们在读完5页后得到糖果,然后是3页,接着是7页,再接着是8页等。
不可预测的强化激励他们继续阅读,即使在读完一页书后没有立即得到强化。
不同强化时间表的反应率
比率时间表——与反应次数相关的时间表——产生的反应率比间隔时间表更高。
此外,可变时间表产生的行为比固定时间表更一致;不可预测的强化导致比可预测强化更一致的反应(Myers, 2011)。
不同时间表强化行为的消退
抵抗消退是指即使行为不再被强化,该行为持续显示的时间长度。对消退高度抵抗的反应需要更长时间才能完全消退。
不同的强化时间表产生不同程度的消退抵抗。一般来说,不可预测的强化时间表比可预测的更抵抗消退。
因此,可变比率时间表比固定比率时间表更抵抗消退。只要平均间隔相似,可变间隔时间表比固定间隔时间表更抵抗消退。
在固定比率时间表中,随着比率的增加,消退抵抗也会增加。在固定间隔时间表中,随着间隔时间的延长,消退抵抗也会增加。
在四种部分强化时间表中,可变比率是最抵抗消退的时间表。这有助于解释赌博成瘾的现象。
即使赌徒可能在多次反应后仍未能获得强化,他们仍然抱有很快会被强化的希望。
对行为心理学的影响
在他的文章“强化时间表50年:回顾性评价”中,Morgan (2010) 描述了强化时间表如何被用于研究行为科学的重要领域。
选择行为
行为学家长期以来一直对有机体如何做出行为选择感兴趣——它们如何在不同选项和强化物之间进行选择。通过使用同时进行的时间表,研究人员能够研究有机体如何将其行为分配到不同的选项。
一个重要发现是匹配法则,该法则指出,有机体对某个时间表的反应率将接近于获得强化的比例。
例如,假设Joe的父亲几乎每次Joe要钱时都会给他,而Joe的母亲几乎从不在Joe要钱时给他。因为Joe向父亲要钱时得到强化的频率更高,所以他更有可能向父亲而不是母亲要钱。
研究表明,个体将试图选择能提供最大奖励的行为。还有其他因素影响有机体的行为选择:强化率、强化质量、延迟强化和反应努力。
每个人都更喜欢更高金额、更高质量和更高频率的奖励。他们更喜欢更快到来且需要较少总体努力的奖励。
行为药理学
强化时间表用于评估药物的偏好和滥用潜力。行为药理学研究中常用的一种方法是通过逐步比率时间表。
在逐步比率时间表中,每次获得强化后,反应要求会不断提高。在药理学的情况下,参与者必须表现出越来越多的反应以获得药物注射(强化)。
在逐步比率时间表下,单次注射可能需要数千次反应。参与者会在最终停止反应的点被测量,这一点被称为“中断点”。
收集关于药物中断点的数据可以对不同药物的滥用潜力进行分类。使用逐步比率时间表评估药物偏好和/或选择现在在行为药理学中很常见。
行为经济学
操作实验为研究微观经济行为提供了理想的方法;参与者可以被视为消费者,强化物则被视为商品。
通过实验不同的强化时间表,研究人员可以改变商品的可用性或价格,并跟踪由此导致的行为分配变化。
例如,改变比率时间表(增加或减少获得强化所需的反应次数)是研究弹性的方法。
另一个强化时间表发挥作用的例子是在研究替代性时,使不同的商品在同一价格(相同的时间表)下可用。通过使用操作实验室研究行为,研究人员能够操纵自变量并测量因变量。
小测验
下面是一些现实世界中强化时间表的例子。阅读这些例子,然后确定正在使用哪种类型的强化时间表。
1. Daniel是一名上门推销员,他的工作是销售保险。他有时会有成功的日子,每与5个人交谈就有1人购买保险。但也有不成功的日子,只有每与15个人交谈才有1人购买保险。
- 答案:可变比率
2. Ashraf需要服用止痛药。他的药来自一台机器,他必须按下按钮来释放一颗药片。为了防止Ashraf服用过多药物,机器只会在上次服药后4小时再次释放药片。
- 答案:固定间隔
3. Nikki周末喜欢钓鱼。她平均需要20分钟才能钓到一条鱼,但每条鱼的时间各不相同。有时只需5分钟,有时则需要40分钟才能钓到一条鱼。
- 答案:可变间隔
4. Lee最近收养了一只小狗。为了训练它在家外排便,每当小狗在后院而不是家里排便时,他会表扬小狗并给它零食。
- 答案:连续强化时间表
5. Aisha受雇于一家公司销售报纸。每卖出50份报纸,她可以获得10美元的佣金。
- 答案:固定比率
参考文献
Ferster, C. B., & Skinner, B. F. (1957). 强化时间表. New York: Appleton-Century-Crofts.
Morgan, D. L. (2010). 强化时间表50年:回顾性评价. 心理学记录; 海德堡, 60 (1), 151–172.
Myers, David G. (2011). 心理学 (第10版). Worth Publishers.
什么影响我的行为?匹配法则解释将改变你对自己的理解. (2017年8月27日). 行为絮语. https://www.behaviourbabble.com/what-influences-my-behavior/
更多信息
以上是原文内容的完整翻译,已转换为Markdown格式的中文。
强化时间表是什么?
强化时间表是控制操作条件作用中强化物交付的时间和频率的规则。它们包括固定比例、可变比例、固定间隔和可变间隔时间表,每种时间表规定了对行为的不同奖励模式。
哪种强化时间表最能抵抗学习反应的消退?
可变比例强化时间表是最能抵抗消退的。这是因为强化物是在不可预测数量的行为之后给予的,这使得行为更难以停止。例如赌博或彩票游戏,胜利是不可预测的,但随时可能发生。
引用来源
本文翻译自以下网站:
simplypsychology.org
使用声明
本文仅供教育和参考用途。如需转载或引用,请注明出处和作者。
如果你有任何问题或建议,请随时联系微信公众号。