目录
- 什么是T检验?
- 解释T检验
- 测试结果不明确
- T检验假设
- 计算T检验
- 相关(或配对)T检验
- 等方差(合并)T检验
- 方差不平等T检验
- 确定要使用的T检验
- 方差不相等的T检验示例
什么是T检验?
t检验是一种推论统计量,用于确定两组平均值之间是否存在显着差异,这可能与某些特征有关。 当数据集(如记录为掷硬币100次的结果的数据集)遵循正态分布并且可能具有未知的方差时,通常使用它。 t检验用作假设检验工具,可以检验适用于总体的假设。
t检验检查t统计量,t分布值和自由度,以确定两组数据之间的差异概率。 要使用三个或更多变量进行测试,必须使用方差分析。
T检验
解释T检验
本质上,t检验使我们可以比较两个数据集的平均值,并确定它们是否来自相同的总体。 在上面的示例中,如果我们要抽样A类学生和B类学生的另一个样本,则我们不希望他们具有完全相同的均值和标准差。 同样,从安慰剂喂养的对照组和处方药的对照组抽取的样品的均值和标准偏差应略有不同。
在数学上,t检验从两组中的每组中抽取一个样本,并通过假设两个均值相等的零假设来建立问题陈述。 基于适用的公式,可以计算某些值并将其与标准值进行比较,并相应地接受或拒绝假定的零假设。
如果原假设符合被拒绝的条件,则表明数据读数强并且不是偶然的。 t检验只是为此目的使用的许多检验之一。 统计人员还必须使用t检验以外的其他检验来检查更多变量,并使用更大样本量进行检验。 对于大样本量,统计学家使用z检验。 其他测试选项包括卡方检验和f检验。
T检验共有三种类型,它们分为从属和独立T检验。
重要要点
- t检验是一种推论统计量,用于确定两组平均值之间是否存在显着差异,这可能与某些特征有关.t检验是用于假设检验的众多检验之一计算t检验需要三个关键数据值。 它们包括每个数据集的平均值之间的差(称为均值差),每组的标准差和每组的数据值的数量。根据需要执行的t检验有几种不同类型所需的数据和分析类型。
测试结果不明确
考虑一家药品制造商想要测试一种新发明的药品。 它遵循的标准程序是在一组患者上试用该药物,然后将安慰剂给予另一组,即对照组。 给予对照组的安慰剂是没有预期治疗价值的物质,并用作衡量给予实际药物的另一组反应的基准。
药物试验后,安慰剂对照组的成员平均预期寿命增加了三年,而服用新药的对照组成员的平均预期寿命增加了四年。 即时观察可能表明该药物确实在起作用,因为使用该药物的小组的结果更好。 但是,观察也可能是由于偶然发生,尤其是意外的运气。 t检验有助于得出结论是否正确并适用于整个人群。
在学校中,A级的100名学生平均得分为85%,标准差为3%。 属于B类的另外100名学生平均得分为87%,标准差为4%。 尽管B类的平均水平比A类的平均水平好,但可能无法得出这样的结论,即B类学生的总体表现优于A类学生的结论。这是因为,平均而言,B类的标准偏差也高于A类。这表明,与A类相比,它们的极端百分比(在较高和较低的方面)分布更大。t检验可以帮助确定哪个班表现更好。
T检验假设
- 关于t检验的第一个假设与测量规模有关。 t检验的假设是应用于收集的数据的测量规模遵循连续或有序的规模,例如IQ检验的分数。第二个假设是简单随机样本的数据从总人口中有代表性的随机选择部分收集数据。第三个假设是数据,在绘制时会形成正态分布的钟形分布曲线。第四个假设是使用了相当大的样本量。 样本量较大意味着结果的分布应接近正钟形曲线。最终假设是方差的均质性。 当样本的标准偏差近似相等时,存在同质或相等的方差。
计算T检验
计算t检验需要三个关键数据值。 它们包括每个数据集的平均值之间的差异(称为均值差异),每个组的标准偏差以及每个组的数据值数量。
t检验的结果产生t值。 然后将该计算出的t值与从临界值表(称为T分布表)获得的值进行比较。 该比较有助于确定偶然发生的均值之间差异的可能性或数据集是否真正具有内在差异。 t检验质疑两组之间的差异是否代表研究中的真正差异,或者这是否可能是无意义的统计学差异。
T分布表
T分布表有尾部和尾部两种格式。 前者用于评估具有固定值或范围且方向明确(正或负)的案例。 例如,掷骰子时输出值保持低于-3或大于7的概率是多少? 后者用于范围限制分析,例如询问坐标是否在-2和+2之间。
可以使用支持必要的统计功能的标准软件程序来执行计算,例如MS Excel中的功能。
T值和自由度
t检验产生两个值作为其输出:t值和自由度。 t值是两个样本集的平均值之间的差与样本集中存在的差之比。 尽管分子值(两个样本集的平均值之间的差)易于计算,但分母(样本集内存在的差)可能会变得有些复杂,具体取决于所涉及的数据值的类型。 该比率的分母是对离散度或可变性的度量。 t值的较高值(也称为t分数)表示两个样本集之间存在较大差异。 t值越小,两个样本集之间的相似度越高。
- t分数大表示组不同; t分数小的表示组相似。
自由度是指研究中具有变化自由度的值,并且对于评估无效假设的重要性和有效性至关重要。 这些值的计算通常取决于样本集中可用的数据记录数。
相关(或配对)T检验
当样本通常由相似单元的匹配对组成时,或存在重复测量的情况时,执行相关的t检验。 例如,在接受特定治疗之前和之后,可能会有重复检查相同患者的情况。 在这种情况下,每个患者都被用作针对自己的对照样本。
该方法还适用于样品以某种方式相关或具有匹配特征的情况,例如涉及儿童,父母或兄弟姐妹的比较分析。 相关或成对的t检验属于从属类型,因为这涉及两组样本相关的情况。
配对t检验的t值和自由度的计算公式为:
- Mean1 和 mean2 是每个样本集的平均值,而 var1 和 var2 表示每个样本集的方差。
其余两种类型属于独立的t检验。 选择这些类型的样本是彼此独立的-也就是说,两组中的数据集没有引用相同的值。 它们包括将一组100位患者分成两组,每组50位患者的案例。 一组成为对照组并接受安慰剂治疗,另一组接受处方治疗。 这构成了彼此不配对的两个独立的样本组。
等方差(或合并)T检验
当每组中的样本数相同或两个数据集的方差相似时,使用等方差t检验。 以下公式用于计算等方差t检验的t值和自由度:
</ s> </ s> </ s> T值= n1 + n2−2(n1−1)×var12 +(n2-1)×var22×n11 + n21mean1−mean2其中:mean1和mean2 =每个样本集的平均值var1和var2 =每个样本集的方差n1和n2 =每个样本集中的记录数
和,
</ s> </ s> </ s> 自由度= n1 + n2−2其中:n1和n2 =每个样本集中的记录数
方差不平等T检验
当每组中的样本数量不同且两个数据集的方差也不同时,使用不等方差t检验。 该测试也称为韦尔奇t检验。 以下公式用于计算不等方差t检验的t值和自由度:
</ s> </ s> </ s> T-value = n1var12 + n2var22mean1-mean2其中:mean1和mean2 =每个样本集的平均值var1和var2 =每个样本集的方差n1和n2 =每个样本集中的记录数
和,
</ s> </ s> </ s> 自由度= n1-1(n1var12)2 + n2-1(n2var22)2(n1var12 + n2var22)2其中:var1和var2 =每个样本集的方差n1和n2 =数字每个样本集中的记录数量
确定要使用的正确T检验
以下流程图可用于基于样本集的特征来确定应使用哪个t检验。 要考虑的关键项目包括样本记录是否相似,每个样本集中的数据记录数量以及每个样本集的差异。
方差不相等的T检验示例
假设我们正在对美术馆中收到的绘画进行对角线测量。 一组样本包含10幅画,另一组样本包含20幅画。 数据集以及相应的平均值和方差值如下:
套装1 | 套装2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21.95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18岁 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
意思 | 19.4 | 21.6 |
方差 | 1.4 | 17.1 |
尽管第2组的平均值高于第1组的平均值,但由于第2组的方差明显高于第1组,因此我们不能得出所有画作的平均长度约为21.6个单位的结论。这是偶然的,还是真的存在差异?画廊收到的所有绘画的总人口中有多少? 我们通过假设两个样本集的均值相同的零假设建立问题,然后进行t检验以确认假设是否成立。
由于数据记录的数量不同(n1 = 10,n2 = 20)并且方差也不同,因此使用不等方差T检验中提到的公式为上述数据集计算t值和自由度部分。
t值为-2.24787。 由于在比较两个t值时可以忽略减号,因此计算出的值为2.24787。
自由度值是24.38,由于公式定义需要将该值舍入为最小可能的整数值,因此自由度值减小为24。
只要假定正态分布,就可以指定概率级别(alpha级别,重要性级别 p )作为接受标准。 在大多数情况下,可以假定为5%。
使用自由度值为24和5%的显着性水平,看一下t值分布表,得出的值为2.064。 将该值与2.247的计算值进行比较,表明在5%的显着性水平下,计算出的t值大于表值。 因此,可以安全地拒绝均值之间没有差异的零假设。 人口集合具有内在差异,而并非偶然。
比较投资帐户×下表中显示的报价来自Investopedia从其获得补偿的合伙企业。 提供商名称说明相关条款
方差分析(ANOVA)的工作原理方差分析(ANOVA)是一种统计分析工具,可将数据集中发现的总可变性分为两个部分:随机因素和系统因素。 更多Z检验定义Z检验是一种统计检验,用于确定方差已知且样本量较大时两个总体均值是否不同。 更多自由度定义自由度是指数据样本中逻辑上独立的值(即可以自由变化的值)的最大数量。 更多了解T分布AT分布是一种概率函数,适用于估计样本量较小或方差未知的总体参数。 更多半偏差量度的方法半偏差量是一种评估投资回报率低于均值波动的方法。 它用作标准偏差的替代方法。 更多Bonferroni检验Bonferroni检验是一种用于统计分析的多重比较检验。 更多合作伙伴链接相关文章
经济学
进行t检验时有什么假设?
风险管理
利用历史波动率来衡量未来风险
股票交易策略与教育
如何使用Excel模拟股票价格
财务比率
如何在Excel中计算IRR?
数学与统计学
什么是相对标准误差
财务比率