什么是四分位数?
四分位数是一个统计术语,它描述了根据数据的值以及如何将它们与整个观测值集进行比较,将观测值划分为四个定义的区间。
了解四分位数
要了解四分位数,重要的是要了解中位数作为集中趋势的度量。 统计的中位数是一组数字的中间值。 在这一点上,恰好一半的数据位于中心值之下和之上。
因此,给定一组13个数字,中位数将是第七个数字。 该值之前的六个数字是数据中的最低数字,中位数之后的六个数字是给定数据集中的最高数字。 因为中位数不受分布中的极值或离群值的影响,所以有时它优于均值。
中位数是位置的可靠估计器,但没有说明其值两边的数据如何散布或散布。 这就是四分位数介入的地方。四分位数通过将分布分为四组来衡量均值上下的值的分布。
重要要点
- 四分位数通过将分布分为四组来测量均值上下的值分布。四分位数将数据分为三个点(下四分位数,中位数和上四分位数)以形成数据集的四组。计算四分位数范围,这是中位数附近变化的量度。
四分位数的工作方式
就像中位数将数据分成两半,以使50%的度量值位于中位数以下,而50%的度量值位于中位数之上,四分位数将数据分解为四分之一,以使25%的度量值小于下四分位数50 %小于平均值,小于上四分位数的75%。
四分位数将数据分为三个点(低四分位数,中位数和高四分位数),以形成数据集的四组。 下四分位数或第一个四分位数表示为Q1,是介于数据集的最小值和中位数之间的中间数。 第二个四分位数Q2也是中位数。 上四分位数或第三四分位数表示为Q3,是位于分布的中位数和最高数之间的中心点。
现在,我们可以绘制出四分位数组成的四个组。 第一组值包含的数量最小,直到Q1。 第二组包括Q1至中位数; 第三组是Q3的中位数; 第四类包括Q3到整个集合的最高数据点。
每个四分位数包含总观测值的25%。 通常,数据从最小到最大排列:
- 第一个四分位数:最低的25%第二个四分位数:介于25.1%和50%(最高为中位数)第三个四分位数:51%至75%(高于中位数)第四个四分位数:最高的25%
四分位数示例
让我们来看一个例子。 假设按19个学生的升序排列的数学分数分布为:
59,60,65,65,68,69,70,72,75,75,76,77,81,82,84,87,90,95,98
首先,记下中位数Q2,在本例中为第十个值:75。
Q1是最小分数和中位数之间的中心点。 在这种情况下,Q1介于第一和第五得分之间:68。
Q3是Q2和最高分数之间的中间值:84。
现在我们有了四分位数,让我们解释一下它们的数量。 分数68(Q1)表示第一个四分位数,是第25 个百分点。 68是可用数据中得分下半部分的中位数,即得分的中位数从59到75。
Q1告诉我们25%的分数低于68,而75%的课堂分数更高。 Q2(中位数)是第50 个百分点,表明50%的分数低于75,而50%的分数高于75。最后,Q3,第75 个百分点,表明25%的分数是大于75%小于84。
特别注意事项
如果Q1的数据点比Q3的距离中位数更远,则可以说,数据集的较小值之间的分散度大于较大值之间的分散度。 如果Q3离Q2的距离比Q1离中位数的距离更远,则适用相同的逻辑。
或者,如果有偶数个数据点,则中位数将是中间两个数字的平均值。 在上面的示例中,如果我们有20名学生而不是19名学生,则他们的分数中位数将是第十和第十一位数字的算术平均值。
四分位数用于计算四分位数范围,该范围是中位数周围变化的度量。 四分位间距简单计算为第一和第三四分位数之间的差:Q3-Q1。 实际上,正是数据中间一半的范围显示了数据的分散程度。
对于大型数据集,Microsoft Excel具有QUARTILE函数来计算四分位数。