并行效度在心理学中的应用
=================================
要点总结
- 并行效度指的是测试结果准确反映现实或“与外部标准的一致性”的程度。
- 并行效度是一种效标效度。
- 这种效度类型评估一个测量工具是否与另一个已经被确认为有效的测量工具相一致,例如医学诊断或教育成就测试。
- 并行效度有广泛的应用范围,从幸福感测量到智商和教育评估测试。
什么是并行效度?
并行效度衡量的是一个测量结果被相关测量所证实的程度。它是一种与效标相关的效度,通过将测试结果与其他测试、调查或评估的观察或测量结果进行比较来实现(美国心理学会)。
并行效度的一个例子是将人格问卷的调查回答与工作中的主管评价进行比较。
如果两个来源的结果相似,则被测试的测量工具具有较强的并行效度。
此外,使用新的面试流程,并查看其结果是否与已建立的旧流程相似,也可以帮助证明并行效度。
一般来说,任何相关性都可以用来证明并行效度,只要是在同一时间点对两个相关测量进行的。
并行效度在测量随时间变化或难以直接观察的变量时尤为重要。
例如,人格评估可以与人们喜欢接受测试的人的程度或他们与他人合作的能力等标准进行比较,以确定其并行效度。
此外,当与已建立的测量工具进行比较时,它还可以提供有关新测量工具准确性的有用信息。
如何测量并行效度
测量并行效度涉及在几乎相同的时间点对两个相关测量之间的相关性进行分析。
由此产生的相关系数称为并行效度系数。例如,教师可以创建一个数学测试,学生可以用这个测试代替相应的课程。
换句话说,如果测试成绩能够准确预测学生在课程中的当前表现,学生就可以通过测试而不是参加课程。
为了确定并行效度,完成数学课程的学生会参加一个算术成就测试。
如果算术成就测试的成绩与数学课程的成绩之间有强烈的联系,那么这个测试就是可接受的(Gregory, 2000)。
并行效度的例子
抑郁症问卷
抑郁症是一种常见的心理健康问题,影响许多人,因此准确评估其严重程度非常重要。
一种方法是使用抑郁症问卷。在这种情况下,并行效度涉及将问卷得分与应相关的其他测量得分进行比较,例如临床医生评定的症状量表或基于DSM标准的诊断访谈。
这使研究人员能够确定问卷得分是否与这些其他测量得分呈正相关,反之亦然,从而为问卷的并行效度提供证据(Bowers, 2004)。
智商测试
智商测试被广泛用于测量智力,但在依赖其准确性之前必须首先证明其并行效度。
许多情况会影响智商测试的准确性。例如,研究人员已经确定,测试者的平均智商每十年增加三分。
由于智商设计为本质上是曲线分布的,使用并行效度作为确认新均值的方法对于其可用性至关重要。研究人员可以通过多种方式确保智商测试的并行效度。
例如,研究人员可以测量学生在智商测试中的得分是否与其在学校的成绩呈正相关。否则,他们可以测试其评估计算出的智商得分是否与他人的计算出的智商得分相关(Hays et al., 2002)。
生活质量研究
并行效度的一个例子可能涉及生活质量的自我报告测量,即癌症生活质量满意度量表(SLDS-C),通过其得分与另一个癌症特异性生活质量测量——功能评估癌症疗法量表-通用版(FACT-G)的相关性为0.76来验证。
这两个量表都测量功能性福祉、情感福祉和身体福祉。
由于这些子量表之间存在强烈的相关性,研究人员可以更好地假设生活满意度较高的人更可能表达更积极的情绪并具有更高的健康状况水平(Baker et al., 2007)。
常见问题
并行效度是内部效度还是外部效度?
内部效度是指研究设计的质量,而外部效度是指研究结果在特定收集背景之外的泛化程度。
并行效度是指一个测量工具(如测试)的得分与另一个测量工具(如观察)的得分相似的程度。通常通过查看不同测量在同一时间点的得分相关性来测量。
因此,并行效度被认为是内部效度,因为它涉及在同一背景和时间框架内的测量(Gregory, 2000)。
并行效度和聚合效度是一样的吗?
聚合效度和并行效度相似但不同。聚合效度是指两个不同测量工具对同一构念的一致性程度。
另一方面,并行效度是指一个测量工具与已经确立为有效的现有标准的一致性。这种类型的效度用于评估新测量工具相对于已建立的测量工具的准确性和可靠性。
虽然聚合效度主要是在不同测量工具之间进行比较,但并行效度将测量工具与构念的“金标准”进行比较。因此,聚合效度是一种构念效度,而并行效度是一种效标效度(Gregory, 2000)。
并行效度比预测效度更好吗?
并行效度与预测效度相似,因为两者都是测试与相关标准之间的相关性。它们的区别在于这两个测试的测量时间(McIntire & Miller, 2005)。
并行效度和预测效度在效用上处于相似的水平,其使用主要取决于具体情况。
为了测量并行效度,研究人员同时获取测试分数和标准分数,以证明测试分数在多大程度上正确估计了个体在相关测量上的当前状态。
如何测量问卷的并行效度?
研究人员可以通过将结果与已经确立为可靠标准的同一构念或特质的现有测量工具进行比较来测量问卷的并行效度。
例如,如果研究人员构建了一个旨在测量自尊的问卷,他们可以将问卷的结果与一个非常成熟的自尊测量工具的得分进行比较。
如果两个测量工具之间存在显著相关性,这表明新的问卷具有并行效度。此外,研究人员可以通过检查受访者在同一量表内不同项目的回答是否一致来评估并行效度。
这种分析可以揭示问题是否测量了预期的内容,并为进一步证明并行效度作为效标效度的一部分提供证据(Lin & Yao, 2014)。
如何提高并行效度?
可以通过实施一些最佳实践来提高研究中的并行效度。
首先,研究人员可以确保用于并行审查的数据完整且最新。
其次,研究人员可以使用减少来自不同来源冲突更新的设计技术。
第三,研究人员可以在适当的情况下考虑实施自动冲突解决协议。
第四,他们可以创建一致遵循并定期审查的标准操作程序,以最小化并行审查中的错误。
最后,记录每次并行审查的结果可以帮助识别可以改进或避免冲突的领域。
通过遵守这些原则,组织可以确保其并行审查准确可靠(Lin & Yao, 2014)。
参考文献
==========
American Psychological Association. (n.D.) 并行效度. 美国心理学会词典.
Baker, F., Denniston, M., Hann, D., Gesme, D., Reding, D. J., Flynn, T., & Kennedy, J. S. (2007). 癌症生活质量满意度量表(SLDS-C)的因素结构和并行效度. 《心理社会肿瘤学杂志》,25(2),1–17.
Bowers, A. (2004). 临床抑郁评估与贝克抑郁量表的并行效度研究. 肯塔基大学.
Gregory, R. J. (2000). 心理测验:历史、原理及应用(第4版)。Allyn & Bacon.
Hays, J. R., Reas, D. L., & Shaw, J. B. (2002). 韦氏简化智能量表和考夫曼简短智能测试在精神科住院患者中的并行效度. 《心理报告》,90(2),355-359.
Drake, R. D., Rao, G. G., McIntire, D. D., Miller, D. S., & Schorge, J. O. (2005). 帕克兰纪念医院20年经验中西班牙裔妇女GTD的发病率. 《妇产科学》,105(4),119S.
Lin, W. & Yao, G. 并行效度. 在Michalos, A. C. (编). (2014). 《生活质量与幸福感研究百科全书》 (第311-1页). Springer Netherlands.
引用来源
本文翻译自以下网站:
simplypsychology.org
使用声明
本文仅供教育和参考用途。如需转载或引用,请注明出处和作者。
如果你有任何问题或建议,请随时联系微信公众号。