什么是非参数统计?
非参数统计是指不需要数据适合正态分布的统计方法。 非参数统计使用的数据通常是有序的,这意味着它不依赖于数字,而是依赖于排序或排序顺序。 例如,传达消费者喜好程度从喜欢到不喜欢的调查将被视为有序数据。
非参数统计包括非参数描述性统计,统计模型,推断和统计检验。 非参数模型的模型结构不是 先验 指定 的, 而是根据数据确定的。 术语“ 非参数” 并不意味着这些模型完全缺乏参数,而是参数的数量和性质是灵活的,并且事先没有固定。 直方图是概率分布的非参数估计的示例。
了解非参数统计
在统计中,参数统计包括诸如平均值,中位数,标准差,方差等参数。这种形式的统计使用观察到的数据来估计分布的参数。 在参数统计下,假定数据适合具有未知参数μ(种群平均值)和σ2(种群方差)的正态分布,然后使用样本均值和样本方差进行估算。
非参数统计不假设样本量或观察到的数据是否是定量的。
非参数统计不假定数据是从正态分布中提取的。 取而代之的是,在这种统计测量形式下估计分布的形状。 尽管在许多情况下可以假设正态分布,但在某些情况下将无法确定数据是否将以正态分布。
非参数统计的例子
在第一个示例中,假设有一个研究人员想要估计北美棕眼睛出生的婴儿数量,则可以决定对15万个婴儿进行抽样,然后对数据集进行分析。 他们得出的测量结果将用于估计次年出生的棕色眼睛婴儿的总数。
再举一个例子,考虑另一位研究人员,他想知道早睡还是晚睡与生病的频率有关。 假设样本是从人群中随机选择的,则疾病频率的样本大小分布可以认为是正常的。 但是,不能认为测量人体对细菌菌株的抵抗力的实验具有正态分布。
这是因为随机选择的样本数据可能会对应变产生抵抗力。 另一方面,如果研究人员考虑遗传构成和种族等因素,他可能会发现使用这些特征选择的样本量可能无法抵抗该菌株。 因此,不能假设正态分布。
当数据没有明确的数值解释时,此方法很有用,并且最好与具有排序等级的数据一起使用。 例如,人格评估测试可能会将其指标的等级设置为强烈不同意,不同意,冷漠,同意和强烈同意。 在这种情况下,应使用非参数方法。
特别注意事项
非参数统计因其易于使用而获得赞赏。 由于减少了对参数的需求,因此数据变得更适用于各种测试。 如果没有可用的统计信息,则无需均值,样本量,标准差或任何其他相关参数的估计值。
由于非参数统计对样本数据的假设较少,因此它的应用范围比参数统计要广。 如果参数测试更合适,则非参数方法的效率会降低。 这是因为与使用参数统计获得的结果相比,从非参数统计获得的结果具有较低的置信度。
重要要点
- 非参数统计易于使用,但无法提供其他统计模型的精确度。这种分析最适合考虑事物的顺序,即使数值数据发生变化,结果也可能保持不变。