内部效度与外部效度在心理学中的对比
============================================
内部效度集中在证明特定研究范围内的明确因果关系,而外部效度则涉及证明研究结果超出原始研究情境或人群的适用性。
研究人员在设计方法严谨且可推广的研究时必须权衡这些考虑因素。
内部效度
外部效度
定义
研究中关于因果关系的结论是否有效
研究结果在多大程度上适用于原始研究之外的情境
主要关注点
观察到的效果是否确实由自变量引起,还是研究设计/实施中的缺陷导致了这一结果?
结果是否可以预期适用于其他设置、人群、时间?
关键因素
随机化、控制条件、消除混淆变量
具有代表性的样本、测试不同情境下的变异性
威胁示例
选择偏差、流失、历史效应
设置和治疗的交互效应、有限的参与者样本
如何改进
使用对照组、随机化、盲法、考虑混杂因素
从异质性更强、更具代表性的样本中抽取,跨不同情境进行复制
平衡考量
控制内部效度通常意味着更人工化的研究环境
更广泛的推广性需要灵活、适用于现实世界的范式
内部效度与研究的进行方式(其实验设计和方法)有关,而外部效度则与研究发现对整个世界的应用性和推广性有关。
内部效度
内部效度是指对测试的因果关系存在的信心程度。
它测试的是你的治疗导致你观察到的结果差异的可能性。内部效度在很大程度上取决于研究的实验设计和方法。
具有高内部效度的研究提供了强有力的因果证据,因此可以排除对某一发现的替代解释。
内部效度低的研究提供的因果证据较弱。混杂因素或外变量的机会越少,内部效度越高,我们对研究结果的信心就越强。
为了在研究中假设因果关系,原因必须在时间上先于结果,原因和结果必须一起变化,并且必须没有其他解释所观察到的关系。如果这三个标准都得到满足,你可以确信研究是内部有效的。
示例
一个具有高内部效度的研究示例是,如果你想进行一项实验,看看使用某种减肥药是否能帮助人们减肥。
为了测试这个假设,你会随机分配一组参与者到两个组之一:服用减肥药的组和服用安慰剂药的组。
通过使研究助手盲化,确保他们在实验过程中不知道参与者属于哪一组,从而确保参与者分配没有偏见。参与者也被盲化,因此他们不知道自己是否接受了干预。
如果参与者退出研究,会检查他们的特征,以确保没有人因系统性偏见而离开。
有一个周密的研究程序来减轻内部效度的威胁是很重要的。
外部效度
外部效度是指研究结果可以应用于或推广到另一个情境的程度。
这很重要,因为如果建立了外部效度,研究的发现就可以推广到更大的人群中,而不仅仅是参与研究的相对少数主体。与内部效度不同,外部效度不评估因果关系或排除混杂因素。
外部效度有两种类型:生态效度和人口效度。
- 生态效度指的是研究的发现是否可以推广到其他情况或设置。高生态效度意味着实验设置与其他设置之间的相似度很高,因此我们可以确信结果将推广到其他设置。
- 人口效度指的是实验样本在多大程度上代表其他人群或群体。使用随机抽样技术,如分层抽样或集群抽样,显著有助于提高人口效度。
示例
一个具有高外部效度的研究示例是,如果你假设每周练习两次正念可以改善被诊断为抑郁症的人的心理健康。
你招募了至少一年被诊断为抑郁症且年龄在18至29岁之间的人。选择这个具有明确定义的兴趣人群的代表性样本有助于确保外部效度。
你让参与者接受前测和后测,测量他们在过去一周内经历抑郁症状的频率。
在研究期间,所有参与者都接受了个人正念训练,并要求他们每天早上花15分钟练习正念。
你还可以使用不同的正念方法或不同样本的参与者复制研究结果。
内部效度与外部效度之间的权衡
实验研究中内部效度与外部效度之间往往存在负相关。这意味着具有高内部效度的实验很可能具有低外部效度,反之亦然。
这是因为产生更高内部效度的实验条件(例如,人工实验室)往往不太可能匹配真实世界条件。因此,外部效度较弱,因为实验室环境与现实世界有很大不同。
另一方面,要产生更高的外部效度,希望实验条件能够匹配现实世界设置(例如,观察研究)。
然而,这以牺牲内部效度为代价,因为这些类型的研究增加了混杂变量和结果差异的替代解释的可能性。
解决这种权衡的方法是复制!希望在多种环境和设置中进行研究——首先在受控的人工环境中建立因果关系的存在,然后在“现实世界”设置中分析结果是否具有推广性。
内部效度的威胁
...(此处省略了原文中未完成的部分)
流失
流失指的是研究参与者随时间的减少。参与者可能会退出或离开研究,这意味着结果仅基于未选择离开的人的偏差样本。
不同治疗组和对照组之间的流失率差异可以通过影响自变量和因变量之间的关系来扭曲结果,从而影响研究的内部效度。
混杂因素
混杂变量是指未测量的第三个变量,它影响或“混淆”了自变量和因变量之间的关系,暗示存在虚假的相关性。
混杂因素是对内部效度的威胁,因为您无法确定预测的自变量是否导致了结果,或者混杂变量是否导致了结果。
参与者选择偏差
这是由于选择或分配研究组的方式未能实现适当的随机化而可能导致的偏差。
如果参与者没有被随机分配到各组,所获得的样本可能不代表打算研究的人群。例如,某些人群成员可能由于动机、愿意参与研究或人口统计特征而比其他人更不可能被包括在内。
实验者偏差
实验者偏差发生在实验者在研究中以不同的方式对待不同的组时,这会影响结果并威胁内部效度。这可以通过盲法消除。
社会互动(扩散)
扩散指的是研究中的治疗在治疗组之间或之内传播。当组间有互动或观察时,这种情况可能发生。
扩散对内部效度构成威胁,因为它可能导致怨恨的士气低落。这是指控制组的成员因为对自己所在组感到不满而失去动力。
历史事件
历史事件可能影响持续较长时间的研究的结果。例如,政治领导的变化、自然灾害或其他不可预见的事件可能会改变研究条件并影响结果。
仪器
仪器指的是研究中因测量工具的变化而导致的因变量的任何变化。当预测试和后测试阶段使用不同的测量方法时,这种情况会发生。
成熟
成熟指的是时间对研究的影响。如果研究结果的差异是时间的自然结果,那么可能无法确定研究中看到的效果是由于研究治疗还是仅仅由于时间的影响。
统计回归
均值回归指的是如果一个随机变量的一个样本极端,下一个对该相同随机变量的抽样很可能更接近其均值。
这是对内部效度的威胁,因为处于治疗极端的参与者可能会因时间的推移而自然地朝某个方向发展,而不是直接由干预措施引起的。
重复测试
用相同的测量方法反复测试您的研究参与者会影响您的研究结果,因为参与者会对测试变得更加熟悉。由于熟悉或了解研究的目的,许多参与者随着时间的推移可能会取得更好的成绩。
对外部效度的威胁
样本特征
如果使用的样本的某些特征导致了效果,这可能会导致发现的普遍性有限。
历史事件
历史事件可能影响持续较长时间的研究的结果。例如,政治领导的变化、自然灾害或其他不可预见的事件可能会改变研究条件并影响结果。
参与者选择偏差
这是由于选择或分配研究组的方式未能实现适当的随机化而可能导致的偏差。如果参与者没有被随机分配到各组,所获得的样本可能不代表打算研究的人群。
例如,某些人群成员可能由于动机、愿意参与研究或人口统计特征而比其他人更不可能被包括在内。
情境因素
诸如环境、一天中的时间、地点、研究人员的特征、噪音或测量数量等因素可能影响发现的普遍性。
重复测试
用相同的测量方法反复测试您的研究参与者会影响您的研究结果,因为参与者会对测试变得更加熟悉。由于熟悉或了解研究的目的,许多参与者随着时间的推移可能会取得更好的成绩。
能力-治疗交互作用 → 能力-治疗交互作用是指某些治疗方法对于具有特定能力或特征的个体来说可能更有效或更无效。
霍桑效应
霍桑效应指的是参与者因为知道自己正在被研究而改变行为的倾向。
实验者效应
实验者偏差发生在实验者在研究中以不同的方式对待不同的组时,这会影响结果并威胁外部效度。
约翰·亨利效应
约翰·亨利效应指的是控制组的参与者因为知道自己在实验中而更加努力工作,因为他们想克服作为控制组的“劣势”。
提高内部效度的因素
盲法
盲法是指参与者(有时还包括研究人员)不知道他们接受的是哪种干预措施的做法。
这减少了额外因素的影响,并最小化了偏差,因为任何结果差异都可以归因于干预措施,而不是参与者是否知道他们是否接受了新治疗。
随机抽样
使用随机抽样来获取代表您希望研究的人群的样本可以提高内部效度。
随机分配
使用随机分配将参与者分配到控制组和治疗组,确保研究组之间没有系统性的偏差。
严格的实验协议
高度受控的实验倾向于提高内部效度。在实验室环境中进行的实验通常具有更高的有效性,因为这减少了来自治疗以外来源的变异性。
实验操作
在研究中操纵自变量,而不仅仅是观察关联而不进行干预,可以提高内部效度。
提高外部效度的因素
重复
在同一主题上进行多次研究,使用不同的样本或在不同的环境中进行,以查看结果是否可以复制,可以帮助提高外部效度。
如果对同一主题进行了多项研究,可以使用元分析来确定自变量的效果是否可以复制,从而使结果更加可靠。
重复是通过增强对其他环境、人群和条件的普遍性来对抗外部效度威胁的最强方法。
现场实验
在实验室外,在自然、真实的世界环境中进行研究可以提高外部效度(然而,这会威胁内部效度)。
概率抽样
使用概率抽样可以通过确保人群中每个人都有平等的机会被选入研究样本,来对抗选择偏差。
重新校准
重新校准是使用统计方法来保持测量的准确性、标准化和可重复性,以确保可靠的结果。
如果研究中某特定特征(如年龄)的组不均匀,重新加权组是校准的一个例子。
纳入和排除标准
设定谁可以参与研究以及谁不能参与的标准,可以确保所研究的人群被明确定义,并且样本能够代表总体。
心理现实主义
心理现实主义是指确保参与者将实验操作视为真实事件的过程,以避免揭示研究的目的,从而使参与者不会因为知道研究目标而在行为上与现实生活中有所不同。
引用来源
本文翻译自以下网站:
simplypsychology.org
使用声明
本文仅供教育和参考用途。如需转载或引用,请注明出处和作者。
如果你有任何问题或建议,请随时联系微信公众号。