什么是非采样错误?
非采样错误是一个统计术语,是指在数据收集期间导致数据与真实值不同的错误。 非采样误差与采样误差不同。 采样误差仅限于由于样本量有限而引起的样本值与Universe值之间的任何差异。 (无法在调查或人口普查中对整个宇宙进行抽样。)
重要要点
- 非采样错误是统计中使用的术语,是指在数据收集期间发生的错误,导致数据与真实值不同。 非抽样误差是指随机误差或系统误差,这些误差可能难以在调查,样本或普查中发现。 系统性非抽样误差比随机性非抽样误差更严重,因为系统性误差可能导致必须放弃研究,调查或人口普查。 错误数越高,信息越不可靠。当发生非抽样错误时,研究或调查中的偏见率会上升。
即使没有发生任何类型的错误,也可能导致采样错误。 “错误”仅是因为样本中的数据不可能与样本来源中的数据完全匹配。 可以通过增加样本大小来最大程度地减少这种“错误”。
非采样错误涵盖了所有其他差异,包括由于不良采样技术而导致的那些差异。
非采样错误的工作原理
在对整个人口进行调查的样本和普查中,都可能出现非抽样误差。 非抽样误差分为两类:随机误差和系统误差。
随机误差被认为可以相互抵消,因此,大多数情况下,它们无关紧要。 另一方面,系统误差会影响整个样本,因此会带来更严重的问题。 通常,随机错误不会导致报废样本或普查,而系统性错误很可能使收集的数据无法使用。
非抽样误差是由外部因素引起的,而不是由调查,研究或普查中的问题引起的。
发生非采样错误的方式有很多。 例如,非抽样错误可以包括但不限于数据输入错误,有偏见的调查问题,有偏见的处理/决策,无答复,不适当的分析结论以及受访者提供的虚假信息。
特别注意事项
虽然增加样本数量可以最大程度地减少采样误差,但对减少非采样误差没有任何影响。 这是因为非采样错误通常很难检测,并且几乎不可能消除它们。
非抽样错误包括不答复错误,覆盖范围错误,采访错误和处理错误。 例如,如果某人在调查中被计数两次或在调查中重复了他们的答案,则会发生覆盖错误。 如果访问员的抽样有偏差,则非抽样错误将被视为访问员错误。
此外,很难证明调查中的受访者提供了错误的信息,无论是出于错误还是有意。 无论哪种方式,受访者提供的错误信息都被视为非抽样错误,并被描述为响应错误。
技术错误属于另一个类别。 如果存在任何与数据相关的条目,例如编码,收集,条目或编辑,则将其视为处理错误。