什么是样品?
样本是指较大的组的较小的,可管理的版本。 它是包含较大人群特征的子集。 当总体规模太大而无法包含所有可能的成员或观察值时,样本将用于统计测试。 样本应代表整体人口,而不应反映对特定属性的任何偏见。
重要要点
- 样本是指较大群体中较大群体或子集的较小,易于管理的版本,使用样本可使研究人员轻松,及时地进行研究。为了获得公正的样本,选择必须是随机的,因此人口中的每个人都有被加入样本组的机会均等,在简单的随机抽样中,人口中的每个实体都是相同的,而分层随机抽样则将整体人口分为较小的组。
了解样本
样本是从总体中获得的无偏见的数量。 从根本上讲,人口是任何给定受试者的个体,动物,物品,观察,数据等的总数。 换句话说,样本就是整个群体的一部分,一部分或一部分,并作为总体的子集。 样本用于进行研究的各种环境中。 科学家,营销人员,政府机构,经济学家和研究小组都在使用样本进行研究和衡量。
使用整个人群进行研究会带来挑战,这就是使用样本的原因。 研究人员可能难以获得全面的访问权限。 而且由于某些研究的性质,研究人员可能难以及时获得所需的结果。 这就是进行研究的人使用样本的原因。 使用较少的代表整个人口的人员仍然可以产生有效的结果,同时减少时间和资源。
研究人员使用的样本应与人群非常相似。 样本中的所有参与者应具有相同的特征和品质。 因此,如果有关男性大学新生的研究,则样本应为符合这一描述的一小部分男性。 同样,如果研究小组对50岁以上的单身女性的睡眠模式进行研究,则样本应仅包括该人群中的女性。
考虑一个由学术研究人员组成的团队,他们想知道有多少学生学习了少于40个小时的CFA考试并仍通过了考试。 由于每年全球有200, 000多人参加考试,因此与每位参加考试的人接触可能会非常繁琐且耗时。 实际上,到收集和分析来自人群的数据时,已经过去了几年时间,由于出现了新的人群,分析变得毫无价值。 研究人员可以做的是取一个人口样本并从该样本中获取数据。
为了获得无偏见的样本,选择必须是随机的,以便总体中的每个人都有被加入该组的平等机会。
为了获得不偏不倚的样本,选择必须是随机的,以便从总体中获得的每个人都有平等且可能的机会被添加到样本组中。 这类似于抽奖,是简单随机抽样的基础。
抽样类型
简单随机抽样
如果总体中的每个实体都相同,则简单随机抽样是理想的选择。 如果研究人员不在乎他们的样本对象是男性还是女性,还是某种形式的性别组合,那么简单的随机抽样可能是一种很好的选择技术。
假设2016年有200, 000名应试者参加了CFA考试,其中女性占40%,男性占60%。 因此,从总体中抽取的随机样本应有400名女性和600名男性,总共1000名应试者。
但是,在学习少于40小时的情况下,知道通过测试的男女比例很重要的情况又如何呢? 这里,分层随机样本将比简单随机样本更好。
分层随机抽样
这种类型的抽样(也称为比例随机抽样或配额随机抽样)将整个总体分为较小的组。 这些被称为地层。 阶层中的人具有相似的特征。
如果年龄是研究人员希望纳入数据的重要因素,该怎么办? 使用分层随机抽样技术,他们可以为每个年龄组创建图层或分层。 每个分层的选择必须是随机的,以便括号中的每个人都有可能被包括在样本中。 例如,两个参与者Alex和David分别为22岁和24岁。 样本选择不能基于某种优先机制来选择一个。 他们应该有同等的年龄被选中的机会。 阶层可能看起来像这样:
年龄层 | 人口总数 | 样品中要包括的数量 |
20-24 | 30, 000 | 150 |
25-29 | 70, 000 | 350 |
30-34 | 40, 000 | 200 |
35-39 | 30, 000 | 150 |
40-44 | 20, 000 | 100 |
> 44 | 10, 000 | 50 |
总 | 200, 000 | 1, 000 |
从表中,人口已分为年龄组。 例如,2016年,年龄在20至24岁之间的30, 000人参加了CFA考试。使用相同的比例,样本组中的(30, 000÷200, 000)x 1, 000 = 150个应试者。 样本的150名随机考试参与者中可能包括Alex或David(或两者或都不是)。
在决定样本量时,还有更多的层次可以编译。 在确定如何创建样本时,一些研究人员可能会填充测试人员的工作职能,国家/地区,婚姻状况等。
样品范例
截至2017年,世界人口为75亿,其中女性占49.6%,男性占50.4%。 任何给定国家/地区的总人数也可以是人口数量。 可以将城市中的学生总数作为人口,而城市中的狗总数也是人口规模。 可以从这些人群中取样以进行研究。
以我们的CFA考试示例为例,研究人员可以从200, 000名应试者(即总人口)中抽取1, 000名CFA参与者的样本,并以此数字运行所需的数据。 该样本的平均值将用于估计通过CFA考试的平均水平,即使他们只学习了不到40个小时。
所取的样本组不应有偏见。 这意味着,如果1, 000名CFA考试参与者的样本平均值为50,则200, 000名应试者的总体平均值也应约为50。
比较投资帐户×下表中显示的报价来自Investopedia从其获得补偿的合伙企业。 提供商名称说明相关条款
读入分层随机抽样分层随机抽样是一种抽样方法,涉及将总体划分为称为“阶层”的较小群体。 更多内容简单随机样本的工作原理简单随机样本是统计总体的一个子集,其中子集的每个成员被选择的概率均等。 一个简单的随机样本意味着该组的无偏表示。 更多采样定义采样是统计分析中使用的过程,其中从较大的总体中提取一组观察值。 更多代表性样本通常用于推断广泛的情绪。代表性样本是反映整个人群特征的人群子集。 更多Z检验定义Z检验是一种统计检验,用于确定方差已知且样本量较大时两个总体均值是否不同。 更多什么是死亡率表? 死亡率表显示了在选定的时间间隔内,从出生到任何给定年龄的特定人群中发生的死亡率。 更多合作伙伴链接相关文章
财务分析
分层随机抽样的工作原理
营销要点
简单随机与分层随机样本:有什么区别?
财务分析
分层随机抽样的利与弊
经济学
代表性样本与随机样本:有什么区别?
经济学
简单随机样本:优点和缺点
经济学