什么是最合适的线
最佳拟合线是指通过数据点散点图最能表示这些点之间关系的线。 统计人员通常使用最小二乘法通过直线计算或回归分析软件得出直线的几何方程。 一条直线将由对两个或多个自变量的简单线性回归分析得出。 在某些情况下,涉及多个相关变量的回归可能会产生一条曲线。
最佳拟合线
最合适的产品线基础
最佳拟合线是回归分析最重要的输出之一。 回归是指一个或多个自变量与所得因变量之间关系的定量度量。 回归适用于从科学和公共服务到财务分析等广泛领域的专业人员。
为了执行回归分析,统计学家会收集一组数据点,每个数据点都包括一组完整的因变量和自变量。 例如,假设变量未包括在标准普尔500指数中,则因变量可以是公司的股价,而自变量可以是标准普尔500指数和国家失业率。样本集可以是每个过去20年的三个数据集。
在图表上,这些数据点将显示为散点图,一组点可能会或可能不会沿任何直线组织。 如果有明显的线性图案,则可以绘制一条最佳拟合线,以使这些点与该线的距离最小。 如果在视觉上看不到任何组织轴,则回归分析可以基于最小二乘法生成一条线。 此方法构建的线使每个点与最佳拟合线的平方距离最小化。
为了确定这条线的公式,统计学家将过去20年的这三个结果输入到回归软件应用程序中。 该软件生成一个线性公式,该公式表示标准普尔500指数,失业率和相关公司的股价之间的因果关系。 该方程式是最佳拟合线的公式。 它是一种预测工具,为分析师和交易员提供了基于这两个独立变量来预测公司未来股价的机制。
最佳拟合线及其组成
具有两个自变量的回归(例如上面讨论的示例)将产生具有以下基本结构的公式:
y = c + b 1 (x 1 )+ b 2 (x 2 )
在此等式中,y是因变量,c是常数,b 1是第一回归系数,x 1是第一自变量。 第二系数和第二自变量是b 2和x 2 。 从以上示例中可以得出,股票价格为y,标准普尔500指数为x 1 ,失业率则为x 2 。 每个独立变量的系数表示该变量中每个其他单位的y变化程度。 如果标普500指数增加1,则所得的y或股价将上涨系数的数量。 第二个独立变量,即失业率也是如此。 在具有一个自变量的简单回归中,该系数是最佳拟合线的斜率。 在此示例中或具有两个自变量的任何回归中,斜率是两个系数的混合。 常数c是最佳拟合线的y轴截距。
重要要点
- 最佳拟合线用于表示不同数据点的散点图中的关系,它是回归分析的输出,可用作指标和价格变动的预测工具。