从技术上讲,有代表性的样本仅需要统计种群的任何百分比即可尽可能接近地复制所研究或分析的质量或特征。 例如,在按性别分析购买趋势的1000名人口中,由600名男性和400名女性组成,代表性样本只能由5名成员,3名男性和2名女性组成,或占总人口的0.5%。人口。 但是,尽管此样本名义上可以代表较大的总体,但由于推断的数量太少,因此在推断较大的总体时可能会导致高度的抽样误差或偏差。
抽样偏差是采用样本分析更大的群体所不可避免的结果。 从它们那里获取数据是一个过程,从本质上来说是有限且不完整的。 但是,由于在资源有限的情况下经常需要这样做,因此经济分析师采用的方法可以将抽样偏差降低到统计上可以忽略的水平。 尽管代表性采样是减少偏差的最有效方法之一,但通常不足以做到这一点。
与代表性采样结合使用的一种策略是确保样本足够大以最佳地减少误差。 通常,虽然子组越大,误差减少的可能性就越大,但在某个点上,减少量变得如此之小,以致于无法证明增加样本量所需的额外费用是合理的。
就像使用技术上具有代表性的小样本不足以单独减少采样偏差一样,仅选择一个较大的组而不考虑其代表性可能会导致比使用小样本具有更大的错误结果。 回到上面的例子,在分析购买趋势中的性别差异时,由600名男性组成的小组在统计上本身就毫无用处。