什么是二项分布?
二项式分布是一种概率分布,它总结了在给定的一组参数或假设下某个值将采用两个独立值之一的可能性。 二项式分布的基本假设是,每个试验只有一个结果,每个试验具有相同的成功概率,并且每个试验是互斥的或彼此独立的。
二项分布是统计中常用的离散分布,与连续分布(例如正态分布)相反。 这是因为在数据中进行了多次试验后,二项式分布只计算两个状态,通常表示为1(表示成功)或0(表示失败)。 因此,给定每个试验的成功概率p,二项分布表示n次试验中x次成功的概率。
二项式分布通常在社会科学统计中用作构建二元结果变量模型的基础,例如共和党或民主党是否将赢得即将举行的选举,个人是否将在指定的时间内死亡等。
了解二项分布
二项式分布总结了每次试验具有相同概率获得一个特定值时的试验次数或观察次数。 二项式分布确定在指定数量的试验中观察到指定数量成功结果的可能性。
通过将试验次数乘以成功概率,可以计算出二项式分布的期望值或均值。 例如,在100次试验中,预期的总人数数为50,即(100 * 0.5)。 二项式分布的另一个常见示例是估算篮球中罚球手的成功机会,其中1 =篮筐,0 =未命中。
二项式分布的平均值为np,二项式分布的方差为np(1- p)。 当p = 0.5时,分布在均值周围对称。 当p> 0.5时,分布向左倾斜。 当p <0.5时,分布向右倾斜。
二项分布是一系列多个独立且分布均匀的伯努利试验的总和。 在伯努利试验中,该实验被认为是随机的,只能产生两种可能的结果:成功或失败。 例如,掷硬币被认为是伯努利的一次审判。 每个试验只能采用两个值(正面或反面)之一,每次成功都具有相同的概率(翻转正面的概率为0.5),并且一个试验的结果不会影响另一个试验的结果。 伯努利分布是二项分布的特例,其中试验次数n = 1。
二项式分布示例
二项式分布是通过将成功概率提高到成功次数的幂与失败概率提高到成功次数和试验次数之间的差的幂来计算的。 然后,将乘积乘以试验次数和成功次数之间的乘积。
例如,假设赌场创建了一个新游戏,参与者可以在指定数量的硬币翻转中对正面或反面的数目进行投注。 假设一位参与者想下注10美元,即在20次硬币翻转中将有6个正头。 参与者想要计算这种情况发生的可能性,因此,他将计算结果用于二项式分布。 概率计算为:(20!/(6!*(20-6)))*(0.50)^(6)*(1-0.50)^(20-6)。 因此,在20次硬币掷出中恰好有6个头出现的概率为0.037,即3.7%。 在这种情况下,预期值为10头,因此参与者下注不佳。
重要要点
- 二项式分布是一种概率分布,它总结了在给定的一组参数或假设下一个值将采用两个独立值之一的可能性。二项式分布的基本假设是每个试验只有一个结果,每个试验只有一个结果具有相同的成功概率,并且每个试验是互斥或彼此独立的。二项分布是统计中使用的常见离散分布,与连续分布(例如正态分布)相对。