收敛效度:定义和例子
要点
- 收敛效度是一种准则相关效度,展示了某个测量与同一构念的其他测量之间的相关性。
- 收敛效度通过显示不同变量在预期方式上测量相同概念的相关性来验证研究结果。
- 收敛效度的例子包括自我报告与绩效评估或调查响应与行为观察之间的相关性。
什么是收敛效度?
收敛效度,有时也称为一致效度,是指测试或工具的反应与概念相似的测试或工具的反应之间表现出强相关性的程度。不仅一个构念应与相关变量相关,而且不应与不相关和无关的变量相关(Krabbe, 2017)。
这与区分效度一起是构念效度的两个方面之一(美国心理学会)。
具体例子
例如,基于表现的游泳测量应与参与者自报的游泳能力相关。
在心理学领域,研究幸福的研究人员可能会使用调查工具来测量生活满意度、积极情绪的频率和快乐水平等变量。
为了证明调查工具的收敛效度,研究人员可能会比较乐观和满足感等相关的测量。
如果两个测试的结果相似——即它们高度相关——则表明该工具测量的是相同的构念,因此具有收敛效度(Krabbe, 2017)。
收敛效度也可以通过观察单一测试或设备中的不同变量如何相互关联来证明。例如,如果调查中有两个变量测量自信心——一个询问对挑战的反应,另一个询问积极的自我感知——它们应该高度相关。
收敛效度之所以有用,是因为它可以提供证据证明给定测量的可靠性和准确性。在建立构念效度时,尤其是在研究人员使用参与观察和调查等两种不同的数据收集方法时,这是一个重要的考虑因素。
构念效度是研究的关键组成部分,提供了研究结果基于准确反映所研究构念的测量的证据(Krabbe, 2017)。
如何测量收敛效度
收敛效度测试假设所研究的测量彼此相关。它是通过检查同一构念的两个或多个测量之间的相关性来测量的。
这样做可以确定不同的工具是否以可比的方式测量相同的概念。然而,重要的是要确定这种相关性背后是否存在因果关系。
例如,Poole 和 Rosenthal(1991)根据议员的投票记录测量了美国国会议员的意识形态。
这与议员在投票记录上的政党团结度测量高度相关。立法党中最自由和最保守的成员往往强烈支持他们的政党,而处于意识形态中心的成员偶尔会跨越并支持另一方。
同时效度测试将回答这些测量是否捕捉到相同的意识形态概念,一个是否导致另一个,或者两者是否由相同的因素引起(McDonald, 2005)。
数学上,测量同时效度的一种方法是通过克隆巴赫α系数测试。这是最常用的内部一致性测量方法,它提供了给定量表中各个项目之间相关性的度量(Cronbach, 1951)。
克隆巴赫α系数值越高,被测测量的收敛效度越好。然而,需要注意的是,这一统计量并未提供有关整个构念效度或测量预测能力的信息(McDonald, 2005)。
评估收敛效度的其他方法包括使用皮尔逊相关系数和因子分析。皮尔逊相关系数用于确定两个或多个变量是否相互关联,通过测量它们的一致性水平。
因子分析涉及从一组观测数据中提取因子,并测量它们相对于彼此的重要性。这种方法可以用来确定测量的潜在结构,以及它是否测量一个构念或多个构念(McDonald, 2005)。
收敛效度的例子
抑郁问卷
如果心理学家试图使用两种不同的测试来测量人群中抑郁的程度,他们可以检查这两种测试的反应之间的相关性。
如果发现两种测试的结果彼此高度相关,则建立了收敛效度;然而,如果测试结果之间没有显著相关性,则可能需要进一步调查这种缺乏对应的原因(Krefetz 等,2002)。
智商测试
研究人员通过将智商测试分数与其他评估相关心理能力的测量进行比较来建立智商测试的同时效度。
例如,如果一个人接受了一次智商测试,然后又完成了一次口头技能测试,研究人员可以比较两次测试的结果,以确定这两组结果之间是否存在相关性。
在 Firmin 等人(2008)的研究中,研究人员通过将已建立的智商测试——综合智力指数——的分数与其网络管理测试的分数进行相关来评估智商测试的同时效度。
这种类型的比较有助于证明智商测试确实测量了它声称要测量的内容——智力,从而帮助建立构念效度。
教育
同时效度对于建立教育方法和实践的有效性很重要。具体来说,评估的同时效度衡量了给定任务或测试的表现与实际工作绩效或学生成就等现实世界结果之间的相关性。
通过检查这种相关性,研究人员可以确定评估是否捕捉到了关于学生知识、技能和能力的有意义信息。
例如,教师可以通过比较学生在测试中的得分与他们在与主题相关的实际期末项目或实习的不同维度上的表现来评估其评估的同时效度。
常见问题
收敛效度是内部效度还是外部效度?
收敛效度是外部效度的一个例子,因为它关注的是给定构念的不同测量之间的关联程度。
这决定了通用性、在更广泛的实际情境中的适用性,以及测量结果是否可以转化为其他情境。
收敛效度和区分效度有什么区别?
区分效度表明,仪器获得的结果与类似但不同的特质的测量结果不会太强相关。例如,假设一家公司向潜在的软件工程师发送测试,以测量他们在编码方面的熟练程度。
编码测试的高分不应与智商测试的分数高度相关,因为这会使编码测试成为另一种智商测试。
另一方面,收敛效度表明,测试与已建立的测试对同一构念的测量结果相关。区分效度和收敛效度都是测量构念效度的重要指标(Hubley & Zumbo, 2013)。
收敛效度和发散效度有什么区别?
发散效度是区分效度的另一个名称,甚至被一些测量领域的知名作家使用(例如,Nunnally & Bernstein, 1994),尽管这不是普遍接受的术语(Hubley & Zumbo, 2013)。
因此,收敛效度和发散效度之间的差异与收敛效度和区分效度之间的差异相同。
参考文献
American Psychological Association. (2010). Standards for educational and psychological testing. Retrieved from http://www.apa.org/education/k12/testing-standards.pdf
Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. psychometrika, 16(3), 297-334.
Firmin, Michael W., et al. “Evaluating the concurrent validity of three web-based IQ tests and the Reynolds Intellectual Assessment Scales (RIAS).” Eastern Education Journal 37.1 (2008): 20.
Hubley, A. M., & Zumbo, B. D. (2013). Psychometric characteristics of assessment procedures: An overview.
Krabbe, E. C. W. (2017). Validity in quantitative research: A practical guide to interpreting validity coefficients in scientific studies. Routledge Academic US Division: New York, NY 10017 USA. doi: 10.4324/9781315677620
Krefetz, D. G., Steer, R. A., Gulab, N. A., & Beck, A. T. (2002). Convergent validity of the Beck Depression Inventory-II with the Reynolds Adolescent Depression Scale in psychiatric inpatients. Journal of Personality Assessment, 78(3), 451-460.
MacDonald III, A. W., Goghari, V. M., Hicks, B. M., Flory, J. D., Carter, C. S., & Manuck, S. B. (2005). A convergent-divergent approach to context processing, general intellectual functioning, and the genetic liability to schizophrenia. Neuropsychology, 19(6), 814.
Nunnally, J. C., & Bernstein, I. H. (1994). Psychometric theory (3rd ed.). New York: McGraw-Hill.
Poole, K. T., & Rosenthal, H. (1991). Patterns of congressional voting. American journal of political science, 228-278.
引用来源
本文翻译自以下网站:
simplypsychology.org
使用声明
本文仅供教育和参考用途。如需转载或引用,请注明出处和作者。
如果你有任何问题或建议,请随时联系微信公众号。