正态分布公式基于两个简单参数-均值和标准偏差-量化给定数据集的特征。 平均值表示整个数据集的“中心”或平均值,而标准偏差表示该平均值附近的数据点的“扩展”或变化。
考虑以下两个数据集:
数据集1 = {10,10,10,10,10,10,10,10,10,10}
数据集2 = {6、8、10、12、14、14、12、10、8、6}
对于数据集1,均值= 10,标准差(stddev)= 0
对于Dataset2,平均值= 10,标准差(stddev)= 2.83
让我们为DataSet1绘制这些值:
对于DataSet2同样:
上面两个图中的红色水平线表示每个数据集的“平均值”或平均值(在两种情况下均为10)。 第二幅图中的粉红色箭头指示数据值相对于平均值的分布或变化。 对于DataSet2,这由2.83的标准偏差值表示。 由于DataSet1的所有值相同(每个值为10)且没有变化,因此stddev值为零,因此没有粉红色箭头适用。
stddev值具有一些重要且有用的特征,这些特征对数据分析非常有帮助。 对于正态分布,数据值对称分布在平均值的两侧。 对于任何正态分布的数据集,在水平轴上绘制带有stddev的图形,而不是。 纵轴上的数据值的关系,得到下图。
正态分布的性质
- 正态曲线关于均值对称;均值在中间并将面积分成两半;均值= 0和stdev = 1时曲线下的总面积等于1;其均值完全描述了分布和stddev
从上图可以看出,stddev表示以下内容:
- 68.3%的数据值在平均值的1个标准偏差内(-1至+1) 95.4%的数据值在平均值的2个标准偏差内(-2至+2)在99.7%的数据值在3个标准偏差内均值的(-3至+3)
在测量时,钟形曲线下方的区域表示给定范围内的期望概率:
- 小于X:–例如,数据值小于X的概率大于70 –例如,数据值在X 1和X 2之间的概率大于95 –例如,数据值在65和85之间的概率
其中X是关注值(以下示例)。
绘制和计算面积并不总是很方便,因为不同的数据集将具有不同的均值和标准差值。 为了便于采用统一的标准方法进行简便的计算并适用于现实世界中的问题,引入了标准值到Z值的转换,这构成了正态分布表的一部分。
Z =(X –平均值)/ stddev,其中X是随机变量。
基本上,此转换强制将平均值和标准差分别标准化为0和1,这使得可以使用一组标准定义的Z值(来自正态分布表 )进行简便的计算。 包含概率值的标准z值表的快照如下:
ž |
0.00 |
0.01 |
0.02 |
0.03 |
0.04 |
0.05 |
0.06 |
0.0 |
0.00000 |
0.00399 |
0.00798 |
0.01197 |
0.01595 |
0.01994 |
… |
0.1 |
0.0398 |
0.04380 |
0.04776 |
0.05172 |
0.05567 |
0.05966 |
… |
0.2 |
0.0793 |
0.08317 |
0.08706 |
0.09095 |
0.09483 |
0.09871 |
… |
0.3 |
0.11791 |
0.12172 |
0.12552 |
0.12930 |
0.13307 |
0.13683 |
… |
0.4 |
0.15542 |
0.15910 |
0.16276 |
0.16640 |
0.17003 |
0.17364 |
… |
0.5 |
0.19146 |
0.19497 |
0.19847 |
0.20194 |
0.20540 |
0.20884 |
… |
0.6 |
0.22575 |
0.22907 |
0.23237 |
0.23565 |
0.23891 |
0.24215 |
… |
0.7 |
0.25804 |
0.26115 |
0.26424 |
0.26730 |
0.27035 |
0.27337 |
… |
… |
… |
… |
… |
… |
… |
… |
… |
要找到与z值0.239865相关的概率,请先将其四舍五入到小数点后两位(即0.24)。 然后,检查行中的前2位有效数字(0.2)和列中的最低有效数字(保留0.04)。 这将导致值为0.09483。
可在此处找到完整的正态分布表,其概率值(包括负值)的精度最高为小数点后5位。
让我们看一些现实生活中的例子。 一大群人的身高遵循正态分布模式。 假设我们有一组100个人,其身高被记录下来,并且均值和标准差分别计算为66英寸和6英寸。
以下是一些示例问题,可以使用z值表轻松解决:
- 小组中的某个人小于等于70英寸的概率是多少?
问题是要找到P(X <= 70)的累积值,即在整个100数据集中,有多少个值将介于0和70之间。
首先,将70的X值转换为等效的Z值。
Z =(X –平均值)/ stddev =(70-66)/ 6 = 4/6 = 0.66667 = 0.67(四舍五入到小数点后两位)
现在,我们需要找到P(Z <= 0.67)=0。24857(来自上面的z表)
也就是说,该小组中的某人小于或等于70英寸的概率为24.857%。
但是请稍等-以上内容还不完整。 请记住,我们正在寻找所有可能的高度达到70(即从0到70)的概率。以上只是给出了从平均值到期望值(即66到70)的比例。 我们需要包括另一半-从0到66-以获得正确的答案。
由于0到66代表一半(即一个极端到中间平均值),因此其概率仅为0.5。
因此,一个人小于等于70英寸的正确概率= 0.24857 + 0.5 =0。74857 = 74.857%
以图形方式(通过计算面积),这是代表解决方案的两个求和区域:
- 一个人身高75英寸或更高的概率是多少?
即找到互补 累积 P(X> = 75)。
Z =(X-平均值)/ stddev =(75-66)/ 6 = 9/6 = 1.5
P(Z> = 1.5)= 1- P(Z <= 1.5)= 1 –(0.5 + 0.43319)= 0.06681 = 6.681%
- 一个人处于52英寸到67英寸之间的概率是多少?
求P(52 <= X <= 67)。
P(52 <= X <= 67)= P = P(-2.33 <= Z <= 0.17)
= P(Z <= 0.17)–P(Z <= -0.233)=(0.5 + 0.56749)-(.40905)=
该正态分布表 (和z值)通常可用于对股票和指数在股票市场中预期价格变动的任何概率计算。 它们用于基于范围的交易,基于均值和标准差的正态分布概念识别上升趋势或下降趋势,支撑或阻力水平以及其他技术指标。
比较投资帐户×下表中显示的报价来自Investopedia从其获得补偿的合伙企业。 提供商名称说明相关文章
交易基础教育
金融中的假设检验:概念和示例
风险管理
使用正态分布优化您的投资组合
技术分析基础教育
时间和价格的线性回归
风险管理
波动率的用途和局限性
财务分析
如何在Excel中计算风险价值(VaR)
基础分析工具