什么是样本量忽略?
样本量忽略是一种认知偏见,由Amos Tversky和Daniel Kahneman研究。 当统计信息的用户由于不考虑相关数据的样本大小而做出错误结论时,就会发生这种情况。
忽略样本数量的根本原因是人们常常不了解小样本中更有可能发生高水平的方差。 因此,确定用于产生给定统计量的样本量是否足够大以得出有意义的结论至关重要。
对于那些对统计方法没有很好理解的人来说,知道什么时候样本量足够大可能具有挑战性。
重要要点
- 样本量忽略是Amos Tversky和Daniel Kahneman研究的一种认知偏见,包括由于没有考虑样本量的影响而从统计信息中得出错误的结论,那些希望降低样本量忽略的风险的人应该记住样本数量与更不稳定的统计结果相关,反之亦然。
了解忽略样本量
如果样本量太小,则无法得出准确和可信赖的结论。 在金融方面,这可能以各种方式误导投资者。
例如,投资者可能会为新的投资基金而看,因为自成立以来就产生了15%的年化收益。 投资者可能很快就会认为这笔资金是他们快速产生财富的门票。 但是,如果基金投资时间不长,此结论可能会被误导。 在那种情况下,结果可能是由于短期异常,与基金的实际投资方法无关。
样本量忽略经常与基本费率忽略混淆,后者是一种单独的认知偏见。 样本量忽略是指未能考虑样本量在确定统计声明的可信度中的作用,而基准费率忽略则是指人们在评估新信息时倾向于忽略有关现象的现有知识。
样本量忽略的实际示例
为了更好地理解样本大小忽略,请考虑以下示例,该示例摘自Amos Tversky和Daniel Kahneman的研究:
一个人被要求从五个球的样本中抽奖,发现四个是红色,一个是绿色。
一个人从20个球的样本中抽奖,发现12个是红色,八个是绿色。
哪个样本可以提供更好的证据证明这些球主要是红色的?
大多数人说,第一个较小的样本提供了更充分的证据,因为红色与绿色的比率比较大的样本高得多。 但是,实际上,较高的比率被较小的样本量所抵消。 20个样本实际上提供了更有力的证据。
来自Amos Tversky和Daniel Kahneman的另一个示例如下:
一个镇有两家医院。 在较大的医院中,平均每天出生45个婴儿,在较小的医院中,每天大约出生15个婴儿。 尽管所有婴儿中有50%是男孩,但确切的百分比每天都在波动。
在一年中,每家医院记录了60%以上的婴儿恰好是男孩的日子。 哪家医院记录了更多这样的日子?
当被问到这个问题时,有22%的受访者说较大的医院会报告更多这样的日子,而有56%的受访者说两家医院的结果相同。 实际上,正确的答案是较小的医院会记录更多这样的日子,因为较小的医院会产生较大的可变性。
正如我们前面提到的,“样本数量忽略”的根源是人们常常不了解小样本中更有可能发生高水平的方差。 在投资中,这确实是非常昂贵的。