什么是同方?
同方的(也拼写为“同方的”)是指条件,其中回归模型中残差或误差项的方差是恒定的。 也就是说,误差项不会随着预测变量值的变化而变化很大。 但是,由于缺乏同方差,因此回归模型可能需要包括其他预测变量以解释因变量的性能。
重要要点
- 当回归模型中误差项的方差恒定时,会发生同方差。 如果误差项的方差是同方差的,则该模型定义良好。 如果方差太大,则可能无法很好地定义模型。 添加附加的预测变量可以帮助解释因变量的性能。相反,当误差项的方差不恒定时,会发生异方差。
同方体如何运作
同方性是线性回归建模的一种假设。 如果围绕回归线的误差方差变化很大,则回归模型的定义可能较差。 同方差的相反是异方差,就像“同质”的相反是“异质”一样。 异方差(也称为“异方差”)是指回归方程中误差项的方差不是恒定的情况。
当考虑方差是给定情况的预测结果与实际结果之间的测量差异时,确定同方差可以帮助确定需要针对准确性调整哪些因素。
特别注意事项
一个简单的回归模型或方程式由四个项组成。 左侧是因变量。 它代表了模型试图“解释”的现象。 右侧是常数,预测变量和残差或误差项。 误差项显示了因变量中的可变性量,预测变量未对此进行解释。
同方的例子
例如,假设您想使用每个学生花费的学习时间来解释学生的考试成绩。 在这种情况下,测试分数将是因变量,而花费的学习时间将是预测变量。
错误项将显示测试分数的方差量,而学习时间量并未解释该方差量。 如果该差异是均匀的或同方差的,则表明该模型可能是测试性能的充分解释-从研究时间上进行解释。
但是差异可能是异方差的。 错误项数据的图表可能显示大量的学习时间与高测试分数非常接近,但是低学习时间测试分数变化很大,甚至包括一些非常高的分数。 因此,仅通过一个预测变量(学习时间)就无法很好地解释分数的变化。 在这种情况下,可能还有其他因素在起作用,并且可能需要增强模型以识别它或它们。 进一步的调查可能会发现一些学生已经提前看到了该考试的答案,或者他们以前参加过类似的考试,因此不需要为该特定考试而学习。
因此,为了改进回归模型,研究人员将添加另一个解释变量,指示学生在测试之前是否已查看答案。 然后,回归模型将具有两个解释变量-时间学习和学生是否具有答案的先验知识。 使用这两个变量,将解释更多的测试分数方差,然后误差项的方差可能是同方差的,这表明该模型定义明确。