心理学中的普雷马克原则：定义与示例

关键要点

普雷马克原则，也称为强化的相对论和差异概率假设，指出一个更令人向往的活动（例如吃巧克力）可以用来强化一个不太令人向往的活动（如写论文）。
大卫·普雷马克通过在老鼠、儿童和后来的黑猩猩上的实验建立了他的理论。
尽管普雷马克原则因多种原因受到批评，但其衍生理论——反应剥夺理论，在学习心理学中仍具有重要影响。

普雷马克原则指出，更可能的行为可以用来强化不太可能的行为。例如，如果学生知道他们完成论文后（不太可能的行为）可以吃巧克力（更可能的行为），他们更有可能完成论文。

起源

普雷马克原则指出，更可能的行为将强化不太可能的行为。行为本身可以强化行为，高概率行为的存在可以使低概率行为更可能发生。

例如，一个不爱学习的小孩可能会因为父母告诉他们之后可以去公园玩（孩子很可能自己就想做这件事）而被激励去做作业（通常是一种低概率行为）。

相反，C预测，高频率行为超过基线水平将抑制低频率行为。例如，使用家庭作业的例子，一个孩子如果过度去公园玩耍，就不太可能做作业（Knapp, 1974）。

在普雷马克原则之前，行为主义者认为强化物具有所谓的跨情境性质，即某种情境下的强化物总是强化物。例如，被训练寻找谷物的鸽子无论谷物的数量多少，总是将谷物视为强化物。

相比之下，普雷马克的观点认为动物偏好顺序反应，更强的反应会强化较弱的反应（Knapp, 1974）。

普雷马克对普雷马克原则的研究源于他1959年关于“速率差异”或“概率差异”效应的研究。

概率差异效应指出，“任何反应A将在且仅在独立的A率大于B率时强化任何反应B。”

也就是说，一个发生频率高的反应可以强化一个发生频率低的反应。例如，根据这个概率差异效应，只有当大鼠喝水的概率大于转轮的概率时，大鼠才会继续在轮子上跑步以获得水奖励（Premack, 1961）。

概率差异效应已找到应用，例如通过使游戏（高频率反应）的获取取决于锻炼，从而增加发展障碍者进行锻炼的可能性（Allen and Iwata, 1980）。

普雷马克（1965）在其关于概率差异效应的最初研究之后发现，伴随这一效应的是：当高概率行为的机会强化低概率行为时，高概率行为本身的频率降低（由于低概率活动的障碍），从而激励参与高概率行为的机会。

这被称为反应减少。任何反应A都可以在A的频率低于基线水平时强化反应B，无论哪种反应更频繁（Mazur, 1975; Timberlake and Allison, 1974）。

例如，在Eisenberger等人的一个实验中，当轮子转动的频率低于基线水平时，人们更有可能按压杠杆，无论轮子转动的频率比按压杠杆的频率高多少（1967）。

这一反应抑制的概念随后演变为反应剥夺（Timberlake and Allison, 1974），在改变人类行为方面找到了许多应用。

例如，Dougher（1983）发现，通过限制饮用首选饮料的机会，可以增加被诊断为精神分裂症的成年人的社会适当行为，前提是饮用的机会取决于这种适当的社会行为（Klatt and Morris, 2001）。

示例

黑猩猩的语言训练

大卫·普雷马克在他的1971年的开创性文章《黑猩猩的语言》中提出了一个问题：猿类是否可以被教会语言。普雷马克认为这个问题不仅在生物学上重要，而且对于语言的本质这一基本问题也很重要。

普雷马克从两个平行的角度来探讨这个问题：通过一系列例子和创建相应的训练生物的指令列表，以便教会这些例子。

普雷马克（1971）定义了范例，包括词汇、句子、问题和用语言教语言的各个方面；通过语言描述的颜色、形状和大小等类别概念；连接词，即在语言学中将主语与其补语连接起来的词语或短语（如“The cat is fluffy”中的“is”）；以及逻辑连接词if-then。

普雷马克试图通过带有金属背板的塑料片粘贴在磁化板上来教黑猩猩语言。

训练者给黑猩猩喂食并逐渐引入语言系统组件，直到黑猩猩将塑料片放在“语言板”上。

训练者根据词汇所代表的词性给黑猩猩提供不同类型的水果。普雷马克随后尝试通过两种不同的测试来检验黑猩猩是否形成了塑料对象与它们所代表的词性之间的关联。

研究人员发现，黑猩猩知道每个词对应哪种水果。研究人员改变了水果提供者，每次提供者的改变都伴随着提供给黑猩猩的第二个语言元素的变化。

例如，当玛丽在场时，黑猩猩必须发出“Mary apple”的信号才能得到苹果，而当兰迪在场时，黑猩猩必须发出“Randy apple”的信号，而不是“Mary apple”或“apple Randy”。

最终，普雷马克1971年的论文中的黑猩猩能够构建句子“Mary give apple Sarah”（这会导致黑猩猩得到苹果）和“Mary give apple Gussie”（这会导致另一只黑猩猩得到苹果）。

普雷马克（1971）然后利用他对黑猩猩的研究来检验语言习得是现有知识映射的假设。研究人员在黑猩猩面前放置了两件物品，并试图教会它们“相同”和“不同”这两个词的区别。

同样，黑猩猩基本上能够区分相同的物体和不同的物体。研究人员然后问黑猩猩是非问题，如“X是否与X不同？”黑猩猩被条件反射地回答“否”。

此外，普雷马克（1971）还通过这种强化引入了颜色、形状、大小等概念。

普雷马克1971年的论文强化了普雷马克原则，因为研究人员使用了高概率行为（黑猩猩想吃各种水果）来强化低概率行为（黑猩猩学习语言的基本要素）。

减肥

研究人员在多个临床应用中测试了Premack原则。

在一个这样的研究中，Horan和Johnson（1971）招募了96名女性本科生志愿者，并随机分配到四个治疗组之一：一个对照组和三个实验组，每个实验组有三次半小时的咨询访谈，参与者被要求识别一种特定的高概率行为（如“坐在特定椅子上”），并思考与超重相关的特定负面-正面关联对（如“寿命缩短”和“衣服更合身”）。

研究人员发现，那些被要求使用Premack原则的人比对照组或那些被要求整天思考负面-正面关联对的人减重显著更多（Horan和Johnson，1971）。

支持研究

Premack早期的大鼠研究

在早期的一项研究中，Premack（1963）控制了大鼠的基线饮水率（它们舔饮水计的频率）和跑步率（轮子旋转次数）。

Premack发现，饮水时间越长会强化跑步时间越长，反之亦然。Premack在饮水溶液中使用了三种不同浓度的糖（64%，32%，和16%），以及两种不同难度级别的活动轮（分别加有18克或80克的重量）。

在他的观察中，大鼠在“自由选择”情况下表现出以下偏好顺序（Allison，2019）：16%的饮水 > 32%的饮水 > 负重18克的跑步 > 64%的饮水 > 负重80克的跑步。

总体而言，Premack进行了五组大鼠的实验，其中一种先前的行为作为杠杆按压的强化物。

根据Premack原则，结果表明，大鼠每10分钟内平均杠杆按压次数取决于哪种反应被用作强化物。

随着第二种反应偏好的增加，学习反应的表现也随之增加。那些在重负重轮上短暂跑步的大鼠每会话大约按压杠杆20次，而那些喝16%蔗糖溶液的大鼠每会话大约按压杠杆37次（Allison，2019）。

这一理论同样适用于惩罚。Premack声称，惩罚涉及一种情况，即更受偏好的反应之后要求某人进行较少偏好的反应。

例如，如果一只大鼠喝了16%的蔗糖溶液后被迫在重负重轮上跑步，这将是一种惩罚。Premack在其他研究中确定，惩罚系统减少了动物做出偏好反应的时间。因此，任何反应都可以强化较弱的反应，但也可以惩罚较强的反应（Allison，2019）。

然而，研究人员后来批评了Premack的方法。例如，实验设计要么测量跑步反应是否独立于饮水发生，要么这是另一种行为的效果，或者是否有相关反应，如接近饮水计。

这导致了Premack研究中的一个反复出现的问题，即虽然剥夺似乎是较少可能行为发生的必要条件，但这种效果往往未被测量（Klatt和Morris，2001）。

Premack对一年级学生的研究

Premack观察了一年级学生在必须选择糖果分发机和弹球机的情况下的行为。

研究人员确定了每个孩子的偏好，并随后将他们识别为玩家或吃货。

然后，研究人员将孩子们分为四组，建立了一个糖果分发机和弹球反应之间的联系，试图确定是否可以修改孩子们的行为。

研究人员预测，根据Premack原则，对于吃货来说，吃应该是强化物，而对于玩家来说，玩应该是强化物，但不是相反（Allison，2019）。

组别	偏好	学习任务
1a	玩家	糖果分发机后有机会使用弹球机
1b	玩家	弹球机后有机会使用糖果分发机
2a	吃货	糖果分发机后有机会使用弹球机
2b	吃货	弹球机后有机会使用糖果分发机

研究人员发现，这些预测与Premack原则一致，两种类型的孩子的学习成功存在一致性效应。

只有1a组和2b组的孩子更有可能参与他们的非偏好行为，而其他两组在第一台机器上的反应量与学习前相同（Allison，2019）。

批判性评价

尽管Premack原则在教育等领域具有广泛的吸引力（Allison，2019），但由于一些显然不一致的预测，学者们已经用其他理论取而代之。

通常，Premack原则可以以与实验数据相矛盾的方式预测学习。例如，Timberlake和Allison（1974）指出，较弱的反应偶尔似乎可以强化较强的反应，而较强的反应偶尔不会强化较弱的反应。

此外，Premack原则没有涵盖的情况特征也可能影响学习类型，这取决于每种反应必须执行的相对速度，以便能够进行另一种反应。

最后，一些本身不符合反应定义的事件也可以调节后续行为。例如，电击可以惩罚行为，但它们不是动物从事的工具性反应（Staddon和Ettinger，1989）。

反应剥夺理论

针对这些反对意见，Timberlake和Allison（1974）提出了反应剥夺假设。反应剥夺是建立操作的一部分。

根据反应剥夺假设，通过剥夺，较弱的反应可以成为较强反应的强化物，许多Premack进行的工具学习研究都包含剥夺元素。

例如，在弹球机和糖果分发机的实验中，一组偏好吃糖果的玩家首先被迫玩耍。

考虑另一个反应剥夺假设的例子，研究人员可以剥夺大鼠跑步的能力。即使跑步不是大鼠的首选反应，当它能够再次跑步时，其跑步速率也会超过基线水平。

修改后的Premack原则，反应剥夺假设概括地说，动物会进行非剥夺或较少剥夺的活动，以便能够进行更多剥夺的活动。

Allison和Timberlake（1974）方法的观点是，处于自由选择情况下的动物处于平衡状态，能够以偏好水平进行活动，学者称之为幸福点。

高于或低于幸福点可能会触发吸引性或厌恶性反应。在Allison和Timberlake的一项大鼠实验中，当处于自由选择情况下时，大鼠倾向于60%的时间饮用甜溶液，40%的时间饮用干溶液。

然而，当研究人员将大鼠置于必须以干燥溶液的十倍速率饮用甜溶液的情况下时，实际上将大鼠置于低于其幸福点的水平，这给了大鼠动机去做那些允许它饮用更多干燥溶液的事情，即使这在自由选择情况下不是首选（Allison，2019）。

参考文献

Allen, L. D., & Iwata, B. A. (1980). 强化锻炼维持：利用现有的高频率活动。Behavior Modification, 4(3), 337-354.

Allison, J. (2019). 强化的本质。当代学习理论, 13-40.

Cooper, J. O., Heron, T. E., & Heward, W. L. (2007). 应用行为分析。

Dougher, M. J. (1983). 反应剥夺和反应饱和程序的临床效果。Behavior Therapy, 14(2), 286-298.

Eisenberger, R., Karpman, M., & Trattner, J. (1967). 在条件情境中强化的必要和充分条件是什么？Journal of Experimental Psychology, 74(3), 342.

Horan, J. J., & Johnson, R. G. (1971). 通过自我管理应用Premack原则的共变条件作用：其对减肥的影响。Journal of Behavior Therapy and Experimental Psychiatry, 2(4), 243-249.

Klatt, K. P., & Morris, E. K. (2001). Premack原则、反应剥夺和建立操作。The Behavior Analyst, 24(2), 173-180.

Knapp, T. J. (1976). Premack原则在人类实验和应用环境中的应用。Behaviour Research and Therapy, 14(2), 133-147.

Mazur, J. E. (1975). 匹配定律及相关于Premack原则的量化。Journal of Experimental Psychology: Animal Behavior Processes, 1(4), 374.

Premack, D. (1959). 朝向经验行为法则：I. 正强化。_Psychological review, 66(_4), 219.

Premack, D. (1961). 从独立反应率预测工具表现。Journal of Experimental Psychology, 61(2), 163.

Premack, D. (1965). 强化理论。在Nebraska动机研讨会上的论文。

Premack, D. (1971). 黑猩猩的语言？Science, 172(3985), 808-822.

Staddon, J. E., & Ettinger, R. H. (1989). 学习：适应性行为原则导论。Harcourt Brace Jovanovich.

Timberlake, W., & Allison, J. (1974). 反应剥夺：一种工具表现的经验方法。

进一步信息

引用来源

本文翻译自以下网站：

simplypsychology.org

使用声明

本文仅供教育和参考用途。如需转载或引用，请注明出处和作者。

如果你有任何问题或建议，请随时联系微信公众号。

聚观点

聚观点