简单随机样本与分层随机样本:概述
简单随机样本和分层随机样本都是统计测量工具。 一个简单的随机样本用于表示整个数据总体。 分层的随机样本根据共有的特征将总体分为较小的组或阶层。
总体是观测值或数据的总集合。 样本是来自人群的一组观察结果。 抽样方法是用于从总体中抽取样本的过程。
简单随机样本
简单随机抽样是一种统计工具,用于描述从数据总体中获取的非常基本的样本。 该样本代表整个人口。
当数据种群的可用信息很少,数据种群之间的差异太大而无法划分为多个子集时,或者数据种群中只有一个独特的特征时,通常会使用简单的随机样本。
例如,一家糖果公司可能想研究其客户的购买习惯,以确定其产品线的未来。 如果有10, 000个客户,则可以使用其中的100个客户作为随机样本。 然后,它可以将从这100个客户那里找到的东西应用到其他客户群中。
统计人员将设计出详尽的数据总体列表,然后在该大群体中选择一个随机样本。 在此样本中,人口中的每个成员都有相等的机会被选为样本的一部分。 可以通过两种方式选择它们:
- 通过手工彩票,其中给人口的每个成员一个号码。 然后,有人随机抽取数字以包括在样本中。 这是在小组观察时使用的最佳方法。 通过使用计算机而不是人类来选择样本,此方法最适合较大的数据集。
使用简单的随机抽样可以使研究人员对特定人群进行概括,并排除任何偏见。 这可以帮助确定如何做出未来的决定。 因此,上例中的糖果公司可以使用此工具根据100个客户的当前口味来开发新的糖果口味。 但是请记住,这些是概括,因此存在错误的余地。 毕竟,这是一个简单的示例。 这100个客户可能无法准确反映整个人群的口味。
分层随机抽样
与简单的随机样本不同,分层随机样本与可轻易分为不同子组或子集的总体一起使用。 这些组基于某些标准,然后根据组的大小与人口的比例从每个组中随机选择元素。
这种抽样方法意味着可以从每个不同的组中进行选择-其规模取决于其在整个人口中所占的比例。 但是研究人员必须确保地层不重叠。 总体中的每个点都只能属于一个阶层,因此每个点都是互斥的。 重叠的层会增加包含某些数据的可能性,从而使样本倾斜。
糖果公司可能决定使用随机分层抽样方法,将其100个客户划分为不同的年龄段,以帮助确定其生产的未来。
投资组合经理可以通过复制债券指数等指数,使用分层随机抽样来创建投资组合。
与简单随机抽样相比,分层抽样具有一些优点和缺点。 由于它具有特定的特征,因此可以根据将人口分为不同子集的方式,提供更准确的人口表示。 这通常需要较小的样本量,可以节省资源和时间。 此外,通过在每个层次中包含足够的采样点,研究人员可以对每个单独的层次进行单独的分析。
但是,抽取分层样本需要比随机样本更多的工作。 研究人员必须单独跟踪和验证每个层次的数据以将其包括在内,与随机抽样相比可能要花费更多的时间。
重要要点
- 简单的随机样本和分层的随机样本是统计测量工具,简单的随机样本需要整个总体的一小部分基本部分来代表整个数据集。 总体分为具有相似特征的不同组,然后从中抽取分层随机样本。