内部效度在研究中是什么?

内部效度

内部效度是指研究的设计和实施是否能够支持独立变量和因变量之间存在因果关系。

它确保除了独立变量外,没有其他变量导致了对因变量观察到的影响。

进行具有强内部效度和外部效度的研究需要从一开始就仔细规划和设计。

与其匆忙完成设计过程,不如明智地投入足够的时间来构建一个方法论上稳健且广泛适用的研究。

通过在设计阶段仔细考虑可能损害内部效度和外部效度的因素,可以避免以后不得不解决这些问题。

展示出高内部效度和外部效度的研究允许对研究结果做出有力的结论。虽然这可能需要更多的初始努力,但确保研究具有可靠的内部效度和外部效度对于产生有意义和有影响力的研究是必要的。

内部效度对于能够从研究中得出可信的结论至关重要。它使研究人员能够排除除测试因素之外的其他解释研究结果的可能性。

例如,如果您实施了一个戒烟计划并看到参与者有所改善,高内部效度意味着您可以确信这是由于该计划本身而不是其他影响因素。

内部效度不是非黑即白的——它是基于研究如何控制可能削弱研究结果的变量,我们对结果的信心水平。

研究越能避免潜在的“混淆因素”,其内部效度就越高,我们对研究揭示的因果关系的信任度也就越高。

对于公众来说,内部效度很重要,因为它意味着给定研究的结果和结论可以被信任和应用。

损害内部效度的因素

混淆变量

混淆变量是在实验中影响因变量的额外因素,导致误导性的关联,并使难以隔离独立变量的真实效应。

它们威胁内部效度,因为它们为研究结果提供了替代解释,使得不清楚因变量的变化是否真正由于独立变量的操纵或由于混淆变量。

未能控制额外变量削弱了研究人员逻辑上创建因果推断的能力。然而,不幸的是,实验室环境之外很难控制混淆变量。

尽管如此,坎贝尔(1957)确定了几种可能威胁内部效度的混淆变量。

参与者因素

参与者反应偏差威胁内部效度,因为当参与者知道他们正在被观察时,他们的行为可能会不同。这些偏差包括参与者的期望、参与者反抗和评估焦虑。

参与者的期望发生在参与者有意或无意地试图按照实验者期望的方式行事。过度合作的参与者可能经常根据研究设置和指导来决定自己的行为。

参与者的期望也可能出现在参与者筛选过程中。例如,希望参加抑郁症研究的参与者可能会夸大他们在筛选问卷中的症状,以显得更有资格参加研究。

参与者反抗发生在参与者故意尝试以与实验者假设相反的方式行事。

例如,在研究日光暴露对睡眠习惯的影响时,参与者可能会故意在同一时间睡觉,无论是否暴露于日光下。这种故意不合作可能是出于对自主或独立的渴望(Brehm, 1966)。

评估焦虑发生在希望与社会或群体信念一致的愿望影响参与者回应时。

这种回应方式可能导致反应两极化并导致不适当的结论。例如,在小组中询问参与者对政治问题的意见时,他们可能会感到压力,以符合其他小组成员的回应。

总的来说,研究人员可以通过保证参与者匿名、使用掩护故事、隐蔽观察和间接测量来减少这些偏差。

抽样偏差

抽样偏差发生在选择研究参与者的过程导致组间关键差异,从而扭曲结果。这威胁内部效度,因为它在实验组和对照组之间的比较中引入了系统误差。

例如,假设一项研究正在测试一个新的数学辅导计划,学生被随机分配到参加该计划(实验组)或继续正常教学(对照组)。

然而,研究人员不知情地从高级数学班中抽取了实验组的学生,而对照组则从普通数学班中抽取。

在这种情况下,引入了抽样偏差,因为实验组的学生可能从一开始就有更高的数学能力和动机水平,而对照组则不然。

任何从辅导计划中观察到的积极效果可能仅仅是由于这些预先存在的差异,而不是该计划本身的真正结果。

流失

根据坎贝尔(1957),流失,也称为实验死亡率,指的是实验组和对照组中研究参与者的差异性流失。

如果实验组和对照组之间的流失率显著不同,这会威胁内部效度。

例如,想象一项临床试验测试一种新疗法对抑郁症的有效性。参与者被随机分配到接受疗法(实验组)或不接受疗法(对照组)8周。

在研究过程中,两组的一些参与者退出并失去随访。然而,对照组的退出人数是实验组的两倍。

这种差异性流失引入了偏差,因为每组中剩余的参与者不再等同——实验组现在包含更多原始参与者,而对照组中剩下的子集较小。

研究结束时观察到的抑郁水平差异可能是由于这种系统性不平衡,而不是新疗法的实际效果。

实验者偏差

实验者偏差是指研究者的期望、感知或动机以无意识的方式影响实验结果。这威胁内部效度,因为它为结果提供了独立变量之外的替代解释。

例如,一位心理学家正在进行一项关于表扬对儿童任务表现影响的实验。她假设表扬儿童会提高他们的任务表现。

在实验过程中,她无意识地在与表扬组互动时提供了更多的鼓励和积极的身体语言,而对中立组则没有这样做。

因此,表扬组表现出更好的任务表现。然而,尚不清楚这是否真正是由于预期的表扬,还是无意的实验者偏差,即儿童捕捉到了研究者微妙的支持信号。

这表明,研究者的认知偏差可能在不知情的情况下影响参与者的反应和行为,从而扭曲变量之间的因果关系。

历史

历史包括研究参与者在实验过程中经历的具体事件,这些事件本身不是实验的一部分。

具体来说,它威胁到持续时间较长的实验的内部效度。例如,想象一个为期12个月的临床试验,测试一种新的心理疗法以减少焦虑。参与者被随机分配接受新疗法或现有疗法。

然而,在试验进行到8个月时,COVID-19大流行开始。这一外部事件增加了每个人的压力水平。

到试验结束时,重新评估了焦虑水平。新疗法组显示出比现有疗法组更大的焦虑减少。

然而,尚不清楚这种差异是否真正归因于新疗法的有效性,还是由于COVID-19作为混淆变量提高了对照组的焦虑水平。

也许如果没有疫情,两个组的焦虑水平都会同样下降。这表明历史如何引入混淆因素和替代解释,从而削弱内部效度。

仪器

仪器是指实验仪器在整个研究过程中提供一致结果的能力。

当用于收集数据的工具、调查或测量方法在研究过程中的校准或管理发生变化时,就会出现仪器威胁。

这可能会引入系统性测量误差,并为任何观察到的差异提供除自变量之外的替代解释。

例如,研究人员使用电池供电设备在实验中测量血压,旨在调查药物降低高血压的效果,可能会发现电池的逐渐衰减导致这些读数在后测中比前测低。

仪器不仅限于电子或机械仪器。例如,一位新聘的研究员被要求在一个月内对参与者的心理健康状况进行评级,随着经验的积累,他可能在后测中比前测更准确地对参与者进行评级(Flannelly等人,2018)。

参与者之间的信息扩散

参与者之间的信息和治疗的扩散会质疑内部效度。后者描述了一种情况,即研究参与者采用不同于他们被分配的干预措施,因为他们认为不同的干预措施更有效。

例如,体重减轻研究中的对照组参与者了解到治疗组的成员比他们减重更多,可能会采用治疗组的干预措施。

信息的差异扩散也会发生,当参与者被给予不同的指示或指示可以被研究执行者误解时。

例如,被要求每两周服用一次药物的参与者可能会每周服用两次或每两周服用一次(Flannelly等人,2018;Campbell,1957)。

成熟

成熟包括与年龄相关的任何生物学变化,或随着时间的推移发生的其他变化。这可能包括饥饿、疲劳、伤口愈合、手术恢复和疾病进展。

成熟威胁内部效度,因为自然的变化可以为研究结果提供除自变量本身之外的替代解释。

例如,在一项为期一年的新阅读计划的儿童研究中,学生在一年内可能表现出阅读能力的提高。然而,部分改善可能是由于与年龄相关的神经发育和阅读技能的增长。

成熟效应也可以在持续时间较短的研究中起作用——例如,给儿童一个重复的计算机任务,他们可能在一个小时内失去注意力,导致表现恶化(Flannelly等人,2018)。

测试

测试是指参与者在参加测试或评估时,仅仅因为之前经历过而表现更好。对测试的熟悉会影响结果,而不是正在研究的任何干预或自变量。

例如,假设研究人员正在测试一种新方法来提高老年人的记忆力。参与者在完成新的记忆训练计划前后进行记忆力评估。

然而,参与者在后测中可能表现出记忆力的提高,部分原因只是因为他们第二次参加同一测试。他们对问题和格式的先前经验使他们的得分受益。

这表明重复测试相同的测量方法如何威胁内部效度。它提供了另一种解释,即改进是由于练习效应,而不是干预的实际结果。

如何防止内部效度的威胁?

一些增加实验内部效度的方法包括:

随机分配

随机分配 是一种技术,选择个体进入治疗组时不考虑研究者的意愿或患者的情况和偏好。这通过减少实验者和选择偏差来提高内部效度(Kim & Shin, 2014)。

随机分配

随机选择

随机选择参与者有助于防止可能导致替代解释的群体之间的系统性差异。

它确保任何现有的因素都通过机会均等地分布,增强将结果归因于自变量而非混淆因素的能力。

盲法

盲法 (也称为掩蔽)是指让试验参与者、医疗保健提供者和数据收集者不知道分配的干预措施,以免受到知识的影响。

这最小化了仪器、退出率(流失率)和参与者偏差中的偏见。

对照组

对照组是没有应用实验条件的群体。它们显示是否存在与自变量应用相关的明确结果差异。

对照组与随机分配结合使用构成随机对照试验,学者认为这是心理研究的“金标准”(Kim & Shin, 2014)。

研究方案

研究方案是预先定义的计划,详细说明研究的所有方面:实验设计、方法、数据收集和分析程序等。

这有助于确保整个研究的一致性,减少仪器和信息差异扩散对内部效度的影响(Kim & Shin, 2014)。

分配隐藏

在比较两种治疗方法的研究中,参与者必须随机分配,以便研究人员和参与者事先不知道他们将接受哪种治疗。

这个隐藏即将分配的过程称为分配隐藏。这一点至关重要,因为如果研究人员或参与者知道或影响某人将接受哪种治疗,就会破坏随机性。

例如,如果研究人员认为一种治疗方法更好,他们可能会引导病情更严重的参与者接受该治疗,而不是公平地按机会分配。

适当的分配隐藏通过隐藏即将分配的信息来防止这种情况,确保无偏见的随机分组。

内部效度示例

研究人员假设一种新的认知训练计划将提高老年人的记忆力和注意力。为了测试这一点,研究人员从同一个退休社区随机分配老年人,让他们参加为期8周的新训练计划(实验组)或一般健康教育计划(对照组)。

研究人员对实验进行了双盲处理,因此参与者和测试管理员都不知道谁在每个组。参与者在8周前后接受记忆力和注意力测试。研究人员通过收集参与者的基线认知功能、健康状况、年龄、教育水平和性别数据来控制任何潜在的混淆变量。

严格协议用于相同地交付认知和健康教育计划,以最小化讲师偏差。统计分析检查任何退出者是否不会对各组产生差异影响。通过这些控制,研究人员可以有强大的内部效度来确定观察到的改进是否是由于新的认知训练,而不是其他变量。

常见问题解答


什么是内部效度和外部效度的区别?

效度是指测试测量其声称要测量的内容的准确性。内部效度是因果关系的陈述,表明没有外来因素的干扰,而外部效度则是实验在不同情况或群体中的可推广性的陈述。

为什么在真实实验中内部效度比外部效度更重要?

内部效度关注的是实验本身的稳健性。一个只有外部效度但没有内部效度的实验不能用于得出因果关系。因此,它通常不可靠,无法做出任何科学推论。相反,一个只有内部效度的实验至少可以在狭窄的背景下用来推断因果关系。

参考文献

美国心理学会. 内部效度. 美国心理学会词典.

Blasco-Fontecilla, H., Delgado-Gomez, D., Legido-Gil, T., De Leon, J., Perez-Rodriguez, M. M., & Baca-Garcia, E. (2012). Holmes-Rahe 社会适应评定量表(SRRS)能否用作自杀风险量表?一项探索性研究. 自杀研究档案, 16(1), 13-28.

Brehm, J. W. (1966). 心理反应理论.

Campbell, D. T. (1957). 社会环境中实验效度的相关因素. 心理公报, 54(4), 297.

Gerst, M. S., Grant, I., Yager, J., & Sweetwood, H. (1978). 社会适应评定量表的可靠性:中长期稳定性. 心身医学杂志, 22(6), 519-523.

Holmes, T. H., & Rahe, R. H. (1967). 社会适应评定量表. 心身医学杂志, 11(2), 213-218.

Kevin J. Flannelly, Laura T. Flannelly & Katherine R. B. Jankowski (2018): 医疗保健中实验和准实验研究内部效度的威胁, 健康照护牧灵杂志, DOI: 10.1080/08854726.2017.1421019

Kim, J., & Shin, W. (2014). 如何进行随机分配(随机化). 骨科手术诊所, 6(1), 103-109.

Morse, G., & Graves, D. F. (2009). 内部效度. 美国咨询协会百科全书, 292-294.


引用来源

本文翻译自以下网站:

simplypsychology.org

使用声明

本文仅供教育和参考用途。如需转载或引用,请注明出处和作者。

如果你有任何问题或建议,请随时联系微信公众号。

回到首页