什么是方差通胀因子?
方差膨胀f方差膨胀因子(VIF)是一组多个回归变量中多重共线性量的度量。 在数学上,回归模型变量的VIF等于整个模型方差与仅包含该独立变量的模型方差之比。 为每个自变量计算该比率。 高VIF表示关联的自变量与模型中的其他变量高度共线。
重要要点
- 方差膨胀因子(VIF)提供了对多元回归模型中自变量之间的多重共线性的一种度量。检测多重共线性很重要,因为虽然它不会降低模型的解释能力,但会降低独立变量的统计显着性。 自变量上的大VIF表示与模型结构和自变量选择中应考虑或调整的其他变量高度共线关系。
了解方差通胀因素
当一个人想要测试多个变量对特定结果的影响时,使用多元回归。 因变量是由自变量作用的结果,自变量是模型的输入。 当一个或多个自变量或输入之间存在线性关系或相关性时,存在多重共线性。 多重共线性在多重回归中产生了一个问题,因为由于输入都相互影响,因此它们实际上并不是独立的,并且很难测试独立变量的组合在回归模型中对因变量或结果的影响程度。 。 用统计术语来说,多重共线性高的多元回归模型将使估计每个自变量和因变量之间的关系更加困难。 所使用的数据或模型方程式的结构中的细微变化会导致自变量上的估计系数产生大而不稳定的变化。
为确保正确指定模型并正常运行,可以针对多重共线性进行测试。 方差膨胀系数就是这样一种测量工具。 使用方差膨胀因子有助于确定任何多重共线性问题的严重性,以便可以调整模型。 方差膨胀因子衡量一个自变量的行为(方差)受其与其他自变量的相互作用/相关性影响或膨胀的程度。 方差膨胀因子可以快速衡量变量对回归中的标准误差的贡献程度。 当存在显着的多重共线性问题时,所涉及变量的方差膨胀因子将非常大。 在确定了这些变量之后,可以使用几种方法来消除或合并共线性变量,从而解决多重共线性问题。
虽然多重共线性不会降低模型的整体预测能力,但可以产生对回归系数的估计,这些估计在统计上并不重要。 从某种意义上讲,可以将其视为模型中的一种重复计算。 当两个或多个自变量紧密相关或测量几乎相同的事物时,则它们所测量的潜在影响在整个变量中占了两倍(或更多),因此很难或不可能说出哪个变量确实在影响变量。自变量。 这是一个问题,因为许多计量经济学模型的目标是精确测试自变量和因变量之间的这种统计关系。
例如,如果经济学家想要检验失业率(作为自变量)和通货膨胀率(作为因变量)之间是否存在统计上显着的关系。 包括与失业率有关的其他自变量,例如新的初请失业金人数,可能会在模型中引入多重共线性。 总体模型可能显示出强大的,统计学上足够的解释力,但无法确定这种影响是否主要是由于失业率或新的首次申请失业救济人数造成的。 这就是VIF所能检测到的,并且可能暗示可能要从模型中删除一个变量,或者找到某种方法来合并它们以捕获其共同影响,这取决于研究人员对检验的特定假设有多大。