什么是系统抽样?
系统抽样是一种概率抽样方法,其中根据随机起始点但以固定的周期性间隔选择来自较大总体的抽样成员。 这个间隔称为采样间隔,是通过将总体大小除以所需的样本大小来计算的。
尽管预先选择了样本种群,但是如果预先确定周期性间隔并且起点是随机的,系统采样仍被认为是随机的。
有几种对总体进行抽样以进行统计推断的方法。 系统抽样是随机抽样的一种形式。
系统采样
系统采样的工作方式
由于对人口进行简单的随机抽样可能效率低下且耗时,因此统计学家转向其他方法,例如系统抽样。 通过系统的方法选择样本数量可以很快完成。 一旦确定了固定的起点,就选择一个恒定的时间间隔以方便参与者的选择。
当数据操作的风险较低时,系统抽样优于简单随机抽样。 如果研究人员可以操纵间隔长度以获得期望的结果时,这种风险很高,那么简单的随机采样技术将更为合适。
系统采样由于其简单性而在研究人员和分析师中很受欢迎。 研究人员通常假设结果代表大多数正常人群,除非每个“第 n 个”数据样本不成比例地存在随机特征(这不太可能)。 换句话说,总体需要沿着所选指标展现自然的随机度。 如果人群具有某种标准化的模式,那么意外选择非常常见的病例的风险就会更加明显。
在系统抽样中,与其他抽样方法一样,必须在选择参与者之前选择目标人群。 可以根据适合正在进行的研究目的的任意数量的所需特征来识别种群。 一些选择标准可能包括年龄,性别,种族,位置,教育程度和/或专业。
- 系统抽样是一种概率抽样方法,其中根据随机起始点选择一个较大种群的样本成员,但是具有固定的周期性间隔(抽样间隔)。由于其简单性,系统抽样受到研究人员的欢迎。这种方法的其他优点包括消除了簇选择现象和污染数据的可能性低。缺点包括特定模式的过多或不足表示以及更大的数据操纵风险。
系统采样的例子
作为系统抽样的假设示例,假设在10, 000人的人口中,统计学家每100人选择一次抽样。 采样间隔也可以是系统的,例如每12小时选择一个新样本进行抽取。
再举一个例子,如果您想使用系统抽样从50, 000个人口中随机选择一个1, 000人的小组,那么所有潜在的参与者都必须放在列表中,然后选择一个起点。 列表形成后,列表中的第50个人(从选定的起点开始计数)将被选为参与者,因为50, 000 / 1, 000 = 50。
例如,如果选择的起点是20,则将选择列表中的第70个人,然后选择第120,依此类推。 一旦到达列表的末尾,并且如果需要其他参与者,则计数将循环到列表的开头以完成计数。
系统抽样与聚类抽样
系统抽样和聚类抽样在如何从样本中包括的总体中抽取样本点方面有所不同。 整群抽样将总体分解为多个总体,而系统抽样则使用较大总体中的固定间隔来创建样本。
系统采样从总体中选择一个随机的起点,然后根据总体的固定间隔从样本中获取样本。 聚类抽样将总体划分为多个聚类,然后从每个聚类中抽取一个简单的随机样本。
群集抽样被认为不如其他抽样方法精确。 但是,它可以节省获取样本的成本。 整群抽样是一个两步抽样程序。 当难以完成整个人口清单时,可以使用它。 例如,可能难以构造一家杂货店的所有顾客来进行采访。
但是,一个人可以创建一个随机的商店子集,这是该过程的第一步。 第二步是访问这些商店的顾客的随机样本。 这是一个简单的手动过程,可以节省时间和金钱。
系统采样的局限性
统计人员在进行系统抽样时必须考虑的一项风险涉及如何组织抽样间隔使用的清单。 如果放置在列表中的总体以与采样间隔匹配的周期性模式进行组织,则所选样本可能会有偏差。
例如,公司的人力资源部门想要选择一个员工样本,并询问他们对公司政策的看法。 员工分为20人一组,每个团队由一名经理领导。 如果用于选择样本数量的列表是由聚集在一起的团队组织的,则统计学家有可能根据采样间隔仅选择经理(或根本没有经理)。