什么是概率分布?
概率分布是一种统计函数,描述了随机变量在给定范围内可以采用的所有可能值和可能性。 该范围将限制在最小和最大可能值之间,但恰恰在可能性分布上可能绘制可能值的位置取决于许多因素。 这些因素包括分布的平均值(平均值),标准差,偏度和峰度。
概率分布如何工作
尽管存在几种常用的分布,但也许最常见的概率分布是正态分布或“钟形曲线”。 通常,某种现象的数据生成过程将决定其概率分布。 该过程称为概率密度函数。
概率分布还可以用于创建累积分布函数(CDF),该函数可以累积发生的概率,并且始终从零开始并以100%结束。
学术界,金融分析师和基金经理都可以确定特定股票的概率分布,以评估该股票将来可能产生的预期预期收益。 可以从任何时间间隔测量的股票收益历史可能仅由股票收益的一小部分组成,这会使分析受到抽样误差的影响。 通过增加样本数量,可以大大减少该误差。
重要要点
- 概率分布描述了给定数据生成过程的可能值的预期结果,概率分布有多种形式,具有不同的特征,这些特征由均值,标准差,偏度和峰度定义。投资者使用概率分布来预测资产收益例如随着时间的流逝而对冲股票的风险。
概率分布的类型
概率分布有许多不同的分类。 其中一些包括正态分布,卡方分布,二项式分布和泊松分布。 不同的概率分布用于不同的目的并代表不同的数据生成过程。 例如,二项分布评估在给定数量的试验中几次发生事件的概率,并在每次试验中给出事件的概率。 可以通过跟踪篮球运动员在一场比赛中罚球数来生成,其中1 =篮筐,0 =未击球。 另一个典型的例子是使用一个公平的硬币,并计算该硬币连续10次翻转出现正面的概率。 二项式分布是 离散的 ,而不是连续的,因为只有1或0是有效响应。
最常用的分布是正态分布,它在金融,投资,科学和工程中经常使用。 正态分布的均值和标准偏差完全可以表征,这意味着该分布不会偏斜并且确实会出现峰度。 这使得分布对称,并且在绘制时将其描绘为钟形曲线。 正态分布由零的平均值(平均值)和1.0的标准偏差定义,偏斜为零且峰度=3。在正态分布中,大约68%的数据收集将落在+/-一个标准内均值偏差 在+/-两个标准偏差内大约95%; 在三个标准差之内达到99.7%。 与二项式分布不同,正态分布是连续的,这表示所有可能的值都被表示出来(与之相对的是0和1,中间没有任何值)。
投资中使用的概率分布
通常假定股票收益率是正态分布的,但实际上,它们表现出峰态,负收益率和正收益率似乎比正态分布所预测的要大。 实际上,由于股票价格为零,但是潜在的无限上涨空间,因此股票收益的分布被描述为对数正态。 这显示在股票收益图上,分布的尾部具有更大的厚度。
概率分布通常也用于风险管理中,以根据历史收益的分布来评估投资组合可能招致的损失的概率和数量。 投资中使用的一种流行的风险管理指标是风险价值(VaR)。 在给定投资组合的概率和时间范围的情况下,VaR会产生可能发生的最小损失。 或者,投资者可以使用VaR在一定数量的损失和时间范围内获得损失的可能性。 滥用和过度依赖VaR被认为是2008年金融危机的主要原因之一。
概率分布示例
作为概率分布的简单示例,让我们看一下滚动两个标准的六面骰子时观察到的数字。 每个骰子都有1/6的概率滚动任意一个数字,从1到6,但是两个骰子的总和将形成下图所示的概率分布。 七是最常见的结局(1 + 6、6 + 1、5 + 2、2 + 5、3 + 4、4 + 3)。 另一方面,2和12的可能性很小(1 + 1和6 + 6)。
两个骰子的和的概率分布。 泰勒