什么是描述统计?
描述性统计信息是概括给定数据集的简短描述性系数,该数据集可以表示总体或样本总体。 描述性统计数据分为集中趋势的度量和变异性(扩展)的度量。 集中趋势的度量包括均值,中位数和众数,而变异性的度量包括标准偏差,方差,最小和最大变量以及峰度和偏度。
什么是描述统计?
了解描述统计
简而言之,描述性统计通过提供有关数据样本和度量的简短摘要,有助于描述和理解特定数据集的特征。 描述统计的最公认类型是中心的度量:均值,中位数和众数,几乎用于所有数学和统计水平。 通过将数据集中的所有图形相加,然后除以该组中图形的数目,可以计算出平均值或平均值。 例如,以下数据集的总和为20:(2、3、4、5、6)。 平均值是4(20/5)。 数据集的模式是最常出现的值,中位数是位于数据集中间的数字。 它是将数据集中较高数字与较低数字分开的数字。 但是,描述性统计的类型很少见,但仍然非常重要。
人们使用描述性统计数据将难以理解的定量见解重新利用到大数据集中,变成一口大小的描述。 例如,学生的平均成绩(GPA)可以很好地理解描述性统计数据。 GPA的想法是,它从广泛的考试,班级和年级中获取数据点,并将它们平均化,以大致了解学生的整体学习能力。 学生的个人GPA反映了他的平均学习成绩。
重要要点
- 描述性统计数据总结或描述了数据集的特征。描述性统计数据包括两类基本度量:集中趋势度量和变异性或分布度量。集中趋势度量描述数据集的中心。变异性或分布度量描述数据在集合中的分散。
描述统计量度
所有描述性统计数据要么是集中趋势的度量,要么是变异性的度量,也称为离散度量。 集中趋势的度量集中在数据集的平均值或中间值; 相反,可变性的测量重点在于数据的分散性。 这两种方法使用图形,表格和一般性讨论来帮助人们理解所分析数据的含义。
集中趋势的度量描述数据集分布的中心位置。 一个人会分析分布中每个数据点的频率,并使用均值,中位数或众数来描述它,该均值会衡量所分析数据集的最常见模式。
可变性度量或散布度量有助于分析分布对于一组数据的分布程度。 例如,尽管集中趋势的度量可以给一个人一个数据集的平均值,但是它没有描述数据如何在数据集中分布。 因此,虽然数据的平均值可能是100中的65,但仍然有1和100处的数据点。可变性度量通过描述数据集的形状和分布来帮助传达这一点。 范围,四分位数,绝对偏差和方差都是变异性度量的示例。 考虑以下数据集:5、19、24、62、91、100。该数据集的范围是95,该范围是通过从最高值(100)减去数据集中的最低数(5)来计算的。