什么是方差分析(ANOVA)?
方差分析(ANOVA)是一种用于统计的分析工具,可将在数据集中发现的观察到的聚集变异性分为两个部分:系统因素和随机因素。 系统因素对给定的数据集具有统计影响,而随机因素则没有。 分析师使用ANOVA检验来确定回归研究中自变量对因变量的影响。
直到1918年Ronald Fisher创建方差分析方法之前,一直使用20世纪开发的t检验和z检验方法进行统计分析。 方差分析也称为方差的Fisher分析,它是t检验和z检验的扩展。 在费舍尔(Fisher)的书《研究人员的统计方法》(Statistical Methods for Research Workers)中出现后,该术语在1925年变得众所周知。 它被用在实验心理学中,后来扩展到更复杂的学科。
方差分析的公式是:
</ s> </ s> </ s> F = MSEMST其中:F =方差系数MST =由于处理导致的平方均值MSE =由于误差导致的平方均值
方差分析显示什么?
ANOVA测试是分析影响给定数据集的因素的第一步。 测试完成后,分析师将对可衡量地导致数据集不一致的方法性因素进行其他测试。 分析人员在f检验中利用ANOVA测试结果来生成与建议的回归模型相符的其他数据。
ANOVA测试允许同时比较两个以上的组,以确定它们之间是否存在关系。 ANOVA公式的结果为F统计量(也称为F比率),可以分析多组数据以确定样品之间以及样品内部的变异性。
如果被测组之间没有真正的差异(称为零假设),则ANOVA F比率统计的结果将接近1。其样本的波动可能会遵循Fisher F分布。 这实际上是一组具有两个特征数的分布函数,分别称为分子自由度和分母自由度。
重要要点
- 方差分析(ANOVA)是一种统计方法,可将观察到的方差数据分为不同的成分以用于其他检验。单向方差分析用于三组或更多组数据,以获取有关因变量和相关变量之间关系的信息。如果各组之间不存在真正的方差,则ANOVA的F比率应等于1。
如何使用方差分析的示例
例如,研究人员可以测试来自多所大学的学生,以查看其中一所大学的学生是否始终胜过其他大学的学生。 在业务应用程序中,研发研究人员可能会测试创建产品的两个不同过程,以查看一个过程是否在成本效率方面优于另一个过程。
使用的ANOVA测试类型取决于许多因素。 当数据需要实验时适用。 如果无法访问统计软件导致手工计算方差分析,则采用方差分析。 它使用简单,最适合小样本。 在许多实验设计中,各种因子水平组合的样本大小必须相同。
方差分析有助于测试三个或更多变量。 它类似于多个两次样本t检验。 但是,它会减少I类错误,并且适合一系列问题。 方差分析通过比较每个组的均值来对差异进行分组,包括将方差扩展到不同的来源。 它与对象,测试组,组之间和组内一起使用。
单向方差分析与双向方差分析
方差分析有两种类型:单向(或单向)和双向。 单向或双向是指方差分析中自变量的数量。 单向方差分析评估唯一因素对唯一响应变量的影响。 它确定所有样本是否都相同。 单向方差分析用于确定三个或更多独立(不相关)组的均值之间在统计上是否存在显着差异。
双向ANOVA是单向ANOVA的扩展。 对于单向,您将拥有一个影响因变量的自变量。 使用双向ANOVA,有两个独立变量。 例如,双向方差分析允许公司根据两个独立变量(例如工资和技能集)比较工人的生产率。 它用于观察两个因素之间的相互作用并同时测试两个因素的影响。