心理知识
内部效度与外部效度在研究中的作用
它们告诉我们关于研究结果的意义和可信度
如何判断一个心理学研究是否值得信赖且有意义?两个可以评估研究发现的特征是内部效度和外部效度。
- 内部效度衡量研究的执行程度(其结构)以及其结果反映所研究群体的准确性。
- 外部效度与研究结果在现实世界中的适用性有关。
这两个概念帮助研究人员评估研究结果的可信性和意义。
内部效度
- 结论合理
- 控制外源变量
- 消除其他解释的可能性
- 侧重于准确性和强研究方法
外部效度
- 研究结果可以推广
- 结果适用于实际情况
- 结果适用于更大的世界
- 结果可以转换到另一个情境
什么是研究中的内部效度?
内部效度是指一项研究建立可靠因果关系的程度。这种效度主要取决于研究的程序和其执行的严谨性。
内部效度很重要,因为一旦建立,它使得我们能够排除研究结果的其他解释。例如,如果你实施了一个戒烟计划,内部效度确保任何对受试者的改善都是由于所施加的治疗,而不是其他原因。
内部效度不是一个“是或否”的概念。相反,我们根据研究避免可能导致这些发现可疑的陷阱的程度来考虑我们对研究结果的信心。干扰越少,内部效度越高,我们对研究结果的信心也越大。
干扰指的是未被控制的变量进入研究并可能混淆研究结果的情况,使我们无法确定我们是否已经识别出因果关系。
简而言之,只有当你能够排除研究结果的其他解释时,才能确信研究是内部有效的。假设因果关系需要三个标准:
- 因先于果发生。
- 因和果一起变化。
- 没有其他可能的解释来说明观察到的关系。
提高内部效度的因素
为了确保研究的内部效度,你需要考虑研究设计中能增加排除替代假设可能性的方面。许多因素可以提高研究的内部效度,包括:
- 盲法:参与者——有时还有研究人员——不知道他们接受的是什么干预(例如,在药物研究中对某些受试者使用安慰剂)以避免这种知识影响他们的感知和行为,从而影响研究结果。
- 实验操作:在研究中操纵自变量(例如,给吸烟者提供戒烟计划)而不是仅仅观察关联而不进行任何干预(检查运动与吸烟行为之间的关系)。
- 随机选择:以随机或代表希望研究的人群的方式选择参与者。
- 随机化或随机分配:随机分配参与者到治疗组和对照组,确保研究组之间没有系统性偏差。
- 严格的实验协议:遵循研究期间的具体程序,以防止引入任何意外效果;例如,以不同的方式对待不同组的研究参与者。
内部效度威胁
正如有许多方法可以确保内部效度一样,在规划研究时应考虑一系列潜在威胁。
- 流失:参与者退出或离开研究,这意味着结果基于一个仅由不愿离开的人组成的偏见样本(并且这些人可能有共同点,比如更高的动机)。
- 干扰:结果变量的变化可以归因于未在研究中测量或操纵的外部变量。
- 扩散:这指的是一组的结果通过组间的互动、交谈或观察转移到另一组,这也可能导致另一种称为怨恨去激励的问题,即对照组因为自己所在的组而努力更少。
- 实验者偏差:实验者以不同方式对待研究的不同组,这可能影响结果(通过盲法消除)。
- 历史事件:可能影响跨越一段时间的研究结果,例如政治领导人的变化或发生的自然灾害,这会影响研究参与者的感受和行为。
- 仪器效应:涉及在研究中以某种方式“引导”参与者,导致他们以不同于原本反应的方式作出反应。
- 成熟效应:时间作为变量在研究中的影响;例如,如果研究在一个时间段内进行,在这段时间内参与者自然发生变化(例如,他们长大或变得疲惫),则很难排除看到的效果仅仅是由于时间的影响。
- 统计回归:由于时间流逝,处于测量极端端的参与者自然会向某个方向移动,而不是干预的直接效果。
- 测试效应:反复使用相同的措施测试参与者会影响结果;例如,如果你给一个人同一个测试三次,他们可能会做得更好,因为他们学会了测试或习惯了测试过程,从而改变了回答方式。
什么是研究中的外部效度?
外部效度是指研究结果可以在多大程度上预期应用于其他环境。这一点很重要,因为如果建立了外部效度,意味着研究结果可以推广到相似的个体或人群。
外部效度肯定地回答了这个问题:研究结果是否适用于类似的个体、设置、情况和时间段?
人口效度和生态效度是外部效度的两种类型。人口效度指的是你能否将研究结果推广到其他人群或群体。生态效度指的是研究结果能否推广到其他情境或设置。
另一个术语叫可转移性,指的是结果是否能在具有类似特征的情境中转移。可转移性与外部效度相关,指的是定性研究的设计。
提高外部效度的因素
如果你想提高研究的外部效度,有很多方法可以实现这一目标。提高外部效度的因素包括:
- 实地实验:在实验室外、自然环境中进行研究。
- 纳入和排除标准:设定标准以决定谁可以参与研究,确保所研究的人群得到明确界定。
- 心理现实性:确保参与者体验到研究事件的真实性,通过讲述“封面故事”或关于研究目的的不同故事,使他们不会因为知道预期或研究目的而以不同于现实生活的方式行事。
- 复制:用不同的样本或在不同的环境中重复研究,看看是否能得到相同的结果;当关于同一主题进行了许多研究时,也可以使用元分析来确定自变量的效果是否可以复制,因此使其更可靠。
- 重新处理或校准:使用统计方法来调整外部效度问题,例如,如果研究中某一特征的群体分布不均,则重新加权这些群体(如年龄)。
外部效度威胁
当研究未能考虑到现实世界中变量的相互作用时,外部效度就会受到威胁。外部效度的威胁包括:
- 前测和后测效应:当前测或后测在某种程度上与研究中看到的效果相关,以至于没有这些附加测试,因果关系就消失了。
- 样本特征:用于研究的样本的某些特征导致了效果(或部分效果),导致研究结果的推广有限。
- 选择偏差:也被视为内部效度的威胁,选择偏差描述了研究中各组之间的差异,这些差异可能与自变量有关——例如,动机或愿意参加研究,或特定的人口统计学特征使个人更有可能参加在线调查。
虽然严格的研究方法可以确保内部效度,但这些方法可能会限制外部效度。
内部效度与外部效度的区别
内部效度和外部效度是两个共享一些相似性的研究概念,但也存在几个不同之处。
相似之处
内部效度和外部效度的一个相似之处在于,在设计研究时应同时考虑这两个因素。这是因为两者都影响研究结果的意义。
内部效度和外部效度都不是“非此即彼”的概念。因此,你总是需要决定每种效度的研究表现程度。
这些概念中的每一个通常也会在发表在学术期刊上的研究文章中报告。这样,其他研究人员可以评估研究,并决定结果是否有用和有效。
不同之处
内部效度和外部效度之间的核心区别在于,内部效度指的是研究的结构(及其变量),而外部效度指的是结果的普遍性。但两者之间还存在其他区别。
例如,内部效度侧重于展示一个仅由自变量引起的差异。相反,外部效度的结果可以应用于更广泛的世界。
内部效度和外部效度并不是互斥的。你可以有一个内部效度良好的研究,但总的来说对现实世界并不相关。你也可以进行一项高度相关的实地研究,但在了解哪些变量导致结果方面缺乏可信的结果。
示例
也许最好的理解内部效度和外部效度的方法是通过例子。
内部效度示例
一个具有良好内部效度的研究示例是,如果研究人员假设使用特定的心理动力学疗法应用程序可以减少负面情绪。为了测试这一假设,研究人员随机分配了一组参与者到两组中的一组:一组使用应用程序,另一组进行控制任务。
研究人员确保参与者被分配到组别时没有任何系统性偏差。他们通过让研究助理蒙蔽双眼,使他们不知道哪些组的受试者在实验中属于哪一组来实现这一点。
还使用了严格的实验协议来概述研究的程序。除了测量情绪(如参与者的社会经济地位、性别、年龄等),还测量了潜在的干扰变量。如果参与者退出研究,将检查其特征,以确保没有系统性偏差。
外部效度示例
一个具有良好外部效度的研究示例是,如果在上述示例中,参与者在家里使用心理动力学疗法应用程序,而不是在实验室里。这表明结果出现在真实环境中。
为了进一步确保外部效度,研究人员清楚地定义了感兴趣的人群,并选择了一个具有代表性的样本。他们还可以使用不同的技术设备来复制研究结果。
要点
设置一个既有良好内部效度又有良好外部效度的实验,从一开始就需要注意影响你研究各个方面的因素。
最好花额外的时间设计一个结构健全的研究,以产生深远的影响,而不是匆匆完成设计阶段,后来才发现问题。只有当内部效度和外部效度都很高时,才能对你的结果得出有力的结论。