在进行调查人群的研究时,使用系统抽样作为统计抽样方法有明显的优缺点。
系统采样:概述
系统采样比随机采样更简单明了。 它也可能更有利于覆盖广阔的研究领域。 另一方面,系统采样会在数据中引入某些任意参数。 这可能导致特定模式的过多或不足表示。
系统采样由于其简单性而在研究人员中很受欢迎。 研究人员通常假定结果代表大多数正常人群,除非每个“第n个”数据样本不成比例地存在随机特征(这不太可能)。
首先,研究人员选择一个作为系统基础的起始整数。 这个数字必须小于总体人口(例如,他们不会每500码选一个100码足球场进行采样)。 选择一个数字后,研究人员将选择总体中样本之间的间隔或间隔。
重要要点
- 由于其简单性,系统的抽样方法受到研究人员的欢迎。该方法的其他优点包括消除了聚类选择的现象以及污染数据的可能性低;缺点包括特定模式的过多或不足表示以及数据操纵的更大风险。
系统采样示例
在系统样本中,选择的数据均匀分布。 例如,在10, 000人的人口中,统计学家可能会每100个人中选择一位进行抽样。 采样间隔也可以是系统的,例如每12小时选择一个新样本。
系统采样的优势
系统采样的优点包括:
易于执行和理解
系统样本相对容易构建,执行,比较和理解。 这对于预算紧张的研究或调查尤为重要。
控制与过程意识
一种系统的方法还为研究人员和统计人员提供一定程度的控制权和过程意识。 假设采样被合理构造为适合某些参数,这对于使用严格参数或狭义假设进行的研究可能特别有益。
消除了聚类选择
聚类选择是一种在系统抽样中消除的现象,在这种现象中,随机选择的样本在人群中很少见并排在一起。 随机样本只能通过增加样本数量或运行多个调查来解决此问题。 这些可能是昂贵的选择。
低风险因素
系统方法的最大优势也许是其低风险因素。 该系统的主要潜在缺点是污染数据的可能性极低。
系统采样的缺点
这种研究方法也有缺点:
假设人口规模可以确定
该系统方法假定人口规模可用或可以合理估算。 例如,假设研究人员想研究给定区域中老鼠的体型。 如果他们不知道有多少只老鼠,他们将无法系统地选择起点或间隔大小。
需要自然随机度
总体需要沿着所选指标展现出自然的随机度。 如果人群具有某种标准化的模式,那么意外选择非常常见的病例的风险就会更加明显。
对于一个简单的假设情况,考虑一下一个喜欢的犬种列表,其中(有意或无意)列表中每条均匀编号的狗都很小,每只奇数狗都很大。 如果系统的采样器从第四只狗开始,并选择六个间隔,则调查将跳过大型狗。
更高的数据处理风险
使用系统采样进行数据处理的风险更大,因为研究人员可能能够构建自己的系统以增加实现目标结果的可能性,而不是让随机数据产生具有代表性的答案。 任何结果统计信息均不可信。