什么是统计学中的ANOVA检验:方差分析
=========================================================
ANOVA检验是一种统计检验方法,用于确定两个或多个分类组之间是否存在统计显著差异,通过使用方差测试均值之间的差异。
ANOVA的另一个关键部分是它将自变量分为两个或更多组。
例如,一个或多个组可能预期会影响因变量,而另一组作为对照组,不预期影响因变量。
ANOVA的假设
ANOVA检验的假设与任何参数检验的一般假设相同:
- 只有当各样本中的受试者没有关系时,才能进行ANOVA检验。这意味着第一组中的受试者不能同时在第二组中(例如,独立样本/组间设计)。
- 不同的组/水平必须具有相等的样本量。
- 只有当因变量正态分布时,才能进行ANOVA检验,即中间分数最频繁,极端分数最不频繁。
- 总体方差必须相等(即,同质性)。方差同质性意味着得分的偏差(通过范围或标准差等测量)在总体之间相似。
ANOVA检验的类型
有不同类型的ANOVA检验。最常见的两种是“单因素”和“双因素”。
这两种类型的区别在于您的检验中包含的自变量数量。
单因素ANOVA
单因素ANOVA(方差分析)有一个分类自变量(也称为因子)和一个正态分布的连续(即,区间或比率水平)因变量。
自变量将案例分为两个或更多互斥的水平、类别或组。
单因素ANOVA检验将因变量均值的差异按自变量的水平分解。
单因素ANOVA的一个例子包括测试一种治疗干预(认知行为疗法、药物、安慰剂)对临床样本中抑郁症发病率的影响。
注意:单因素ANOVA和独立样本t检验都可以比较两组的均值。然而,只有单因素ANOVA可以比较三组或更多组的均值。
双因素(因子)ANOVA
双因素ANOVA(方差分析)有两个或更多分类自变量(也称为因子)和一个正态分布的连续(即,区间或比率水平)因变量。
自变量将案例分为两个或更多互斥的水平、类别或组。双因素ANOVA也称为因子ANOVA。
双因素ANOVA的一个例子包括测试社交接触(高、中、低)、工作状态(雇用、自营、失业、退休)和家族史(无家族史、有家族史)对人群中抑郁症发病率的影响。
“组”或“水平”是什么?
在ANOVA中,“组”或“水平”指的是正在比较的自变量的不同类别。
例如,如果自变量是“鸡蛋”,水平可能是非有机、有机和自由放养有机。因变量可以是每打鸡蛋的价格。
ANOVA F 值
ANOVA的检验统计量记为 F。ANOVA的公式为 F = 治疗引起的方差/随机机会引起的方差。
当 p < .05时,ANOVA F 值可以告诉你自变量的水平之间是否存在显著差异。因此,较高的F值表明治疗变量是显著的。
注意,单独的ANOVA并不能告诉我们具体哪些均值有所不同。为了确定这一点,我们需要进行多重比较(或事后)检验。
当初始F检验表明组间均值存在显著差异时,事后检验有助于确定哪些特定均值显著不同,特别是当你没有特定的假设需要测试时。
事后检验比较每对均值(类似于t检验),但与t检验不同的是,它们修正了显著性的估计以考虑多重比较。
“重复”是什么意思?
重复要求研究由不同的受试者和实验者重复进行。这使统计分析师能够通过使用新样本测试相同的假设来确认先前的研究。
如何运行ANOVA?
对于大型数据集,最好在R或Stata等统计软件中运行ANOVA。让我们参考上面的鸡蛋例子。
非有机、有机和自由放养有机鸡蛋将被分配数值(1,2,3)。它们将作为我们的独立治疗变量,而每打鸡蛋的价格将作为因变量。其他错误变量可能包括“品牌名称”或“产蛋日期”。
使用数据和R中的aov()命令,我们可以确定鸡蛋类型对每打鸡蛋价格的影响。
ANOVA与t检验?
t检验和ANOVA检验都是用于比较不同人群之间均值和分布差异的统计技术。
t检验确定两个总体是否在统计上存在显著差异,而ANOVA检验用于当个体希望测试自变量中超过两个水平时。
回到我们的鸡蛋例子,测试非有机与有机需要t检验,而加入自由放养作为第三个选项则需要ANOVA。
ANOVA结果产生f统计量以确定统计显著性,而不是生成t统计量。
常见问题
ANOVA代表什么?
ANOVA代表方差分析。这是一种用于分析样本中各组均值差异的统计方法。ANOVA检验假设两个或多个总体的均值相等,将t检验推广到超过两个组。
它通常用于比较各种因素效应的实验中。它还可以处理具有不同水平数目的复杂实验。
何时使用ANOVA?
当一个自变量有三个或更多水平(类别或组)时,应使用ANOVA。它旨在比较这些多组的均值。
ANOVA检验能告诉你什么?
ANOVA检验可以告诉你三个或更多组的均值之间是否存在显著差异。如果检验结果显著,它表明至少有一组的均值与其他组不同。然而,它并没有具体说明哪些组不同。
为什么使用卡方检验而不是ANOVA?
当处理分类数据以测试两个分类变量之间的关联或独立性时,使用卡方检验,而不是ANOVA。相比之下,ANOVA用于连续数据,以比较三个或更多组的均值。
引用来源
本文翻译自以下网站:
simplypsychology.org
使用声明
本文仅供教育和参考用途。如需转载或引用,请注明出处和作者。
如果你有任何问题或建议,请随时联系微信公众号。