什么是T分布?
T分布(也称为学生t分布)是一种概率分布,其类似于钟形的正态分布,但尾部较重。 与正态分布相比,T分布具有更大的极值机会,因此尾部更胖。
重要要点
- 当在分母中使用估计的标准偏差而不是真实的标准偏差时,T分布是z分数的连续概率分布.T分布与正态分布一样呈钟形和对称,但具有较重的分布尾巴,这意味着它倾向于产生远离均值的值。统计中使用T检验来估计显着性。
T分布告诉您什么?
尾部的重量由T分布的参数(称为自由度)决定,较小的值表示较重的尾部,较高的值使T分布类似于平均值为0且标准偏差为1的标准正态分布。 T分布也称为“学生的T分布”。
蓝色区域说明了两尾假设检验。 泰勒
当从具有均值M和标准差D的正态分布总体中获取n个观察值样本时,由于样本的随机性,样本均值m和样本标准差d将不同于M和D。
可以使用总体标准偏差为Z =(m – M)/ {D / sqrt(n)}来计算z得分,并且该值具有均值为0和标准偏差为1的正态分布。使用估计的标准偏差计算分数,得出T =(m – M)/ {d / sqrt(n)},d和D之差使分布成为具有(n-1)个自由度的T分布,而不是正态分布,平均值为0,标准差为1。
如何使用T分布的示例
下面的示例说明如何在统计分析中使用t分布。 首先,请记住,均值的置信区间是根据数据计算得出的一系列值,旨在捕获“总体”均值。 此间隔为m +-t * d / sqrt(n),其中t是来自T分布的临界值。
例如,在2001年9月11日之前的27个交易日中,道琼斯工业平均指数的平均收益的95%置信区间为-0.33%(+/- 2.055)* 1.07 / sqrt(27),给出(持续的)平均回报,介于-0.75%和+ 0.09%之间。 从T分布中可以找到要调整的标准误差数量2.055。
由于T分布的尾部比正态分布更胖,因此可以将其用作呈现出峰度过高的财务收益的模型,从而在这种情况下可以更现实地计算风险价值(VaR)。
T分布与正态分布之间的差异
当假定人口分布为正态时,使用正态分布。 T分布类似于正态分布,只是尾巴更胖。 两者都假设人口呈正态分布。 T分布的峰度高于正态分布。 对于T分布,与正态分布相比,获得远离平均值的值的可能性更大。
使用T分布的局限性
T分布可能会相对于正态分布歪曲准确性。 它的缺点仅在需要完美常态时出现。 但是,使用正态分布和T分布之间的差异相对较小。