什么是过度拟合?
过度拟合是一种建模错误,当函数过于适合有限的一组数据点时会发生。 过度拟合模型通常采取制作过于复杂的模型的形式,以解释所研究数据中的特质。
实际上,经常研究的数据内部存在一定程度的误差或随机噪声。 因此,试图使模型过于接近于稍微不准确的数据可能会给模型造成实质性错误并降低其预测能力。
重要要点
- 过度拟合是当函数过于适合有限的一组数据点时发生的建模错误。财务专业人员必须始终意识到基于有限数据过度拟合模型的危险。
了解过度拟合
例如,一个常见的问题是使用计算机算法来搜索历史市场数据的广泛数据库,以便找到模式。 经过足够的研究,通常有可能开发出详尽的定理,这些定理似乎可以非常精确地预测诸如股票市场收益之类的东西。
但是,当将这些定理应用于样本之外的数据时,很可能仅是模型对实际偶然事件的过度拟合。 在所有情况下,针对用于开发模型的样本之外的数据测试模型都是很重要的。
金融专业人员必须始终意识到基于有限数据过度拟合模型的危险。