统计公式统计处理数据的分析;统计方法是用来分析大量数据及其特性的。各种组织和政府使用统计方法来计算雇员或人员的协作属性;这些财产然后影响组织和政府作出的决定。例如,政府可能想知道该国平均有多少12岁以下的儿童营养不良,就像一个组织可能想知道平均有多少工作人员患有压力障碍症一样。根据贫困儿童的数量,政府可能会提出一个新政策来帮助政府解决营养不良问题。统计学在研究中也有很多实际用途,你可以在我们的课程中了解到这一主题。

现在,如果一个国家有1000名公民,那么它可能有一个完整的所有居民的数据库,统计计算可能很容易,但当这个数字是数十亿时,收集完整的数据可能会有点乏味,甚至在很多方面都不可能。在这种情况下,从总体中选取一个随机样本作为总体的代表,并据此进行统计计算。

在本文中,我们将探讨统计分析的一些基本概念,这些概念是所有复杂统计问题的基础。平均数、中位数、模态、方差和标准差的基本概念是几乎所有统计计算的垫脚石。让我们一个一个地来探索。

意味着或平均

均值或平均值,在理论上,是集合中所有元素的和除以集合中元素的数量。平均值可以被看作是一整套价值观的一种协作属性。通过计算其均值,你可以对整个数据集有一个很好的概念。因此,平均值的公式将变成。

Mean =集合中所有元素的总和/元素的个数

均值的重要性在于它能够用单个值概括整个数据集。例如,您可能想比较县1和县2的平均家庭收入。要比较这两个县的家庭收入,你不能把一个县的每个家庭收入都和另一个县的每个家庭收入进行比较。最好的解决办法是找出这两个县的平均家庭收入,然后相互比较。通过比较这两种方法,我们可以假设哪个县比另一个县更繁荣。

中位数

简单地说:中值是一个集合的中间值。所以,如果一个集合由奇数个集合组成,那么中值就是这个集合的中值,如果这个集合由偶数个集合组成,那么中值就是两个中值的平均值。中位数可以用来把一组数据分成两部分。

要找到一个集合的中值,我们需要做的就是把集合中的元素按递增顺序写出来,然后找出元素的个数,最后找到中值。在数据集中任何异常值的情况下,中值可以被证明是一个非常有用的属性。离群值只是集合中指定值的一个非常大的偏差。例如,如果一个集合包含值:1、2、3、4、10000,那么10000就是离群值。离群值可能使平均值存在严重缺陷。例如,上述集合的平均值是10010/5=2002,中位数是3。因此,我们可以肯定地说,中位数比平均值更能恰当地总结集合。你可以学到一些更多关于各种统计公式并且熟悉这个话题。

模式

数据集中的模式是数据集中最常见的值。就像平均值和中位数一样,众数也被用来总结包含一条信息的集合。例如,数据集S = 1,2,3,3,3,3,3, 3,4,4,4,5,5,6,7的模式为3,因为它在集合S中出现的次数最多。

模态的一个重要性质是它等于正态分布的均值和中值。在其他分布或偏态分布中,模态的值可能与两者不同。在正态分布中,数据与一个中心值对称。正态分布曲线是一条与轴对称的曲线。正态分布的另一个重要性质是集合中的值有一半大于均值,一半小于均值。

方差

您可能想测量一组数据与平均值的偏差。例如,一个国家的家庭收入数据的巨大差异可以解释为一个经济的高度不平等。通过分析数据的方差可以得到许多有用的解释。方差由:

  1. 求出平均值和集合中所有值的差值。
  2. 这些差异的棱角。
  3. 添加的差异。

因此,可以观察到特定数据集的方差总是正的。方差最恰当的用法是在计算标准差时使用,标准差是统计学中最重要的概念之一。此外,方差的计算可能很长;你可能想学习吠陀数学的课程这将教会你如何更快地计算。

标准偏差

标准偏差是通过数据方差的平方根计算的。标准偏差更准确地说明了数据集中值的离散度。由于方差是通过平方的值获得的,它不能应用于现实世界的计算。标准差是通过获得方差的平方根来计算的,该方差的单位与集合的元素相同。因此,可以使用标准差作为可信的统计量进行适当的统计计算。标准差在很多方面和概率有关,你可能喜欢参加一个关于概率和统计学的研讨会进一步探讨这两个主题之间的关系。

偏差的标准用法是找出数据集的值与平均值的差异有多大。让我们通过一个例子来理解标准差:

假设一个国家声称其人民的平均工资是5000美元/月,因此这个国家非常繁荣。这是统计学家的一个经典问题,他们可能会问索赔人他的国家人民的工资分配的标准偏差。如果标准偏差非常大,那么统计学家可能会声称工资的差异非常大,因此应该用怀疑的眼光来看待这个国家的繁荣。如果标准偏差较小,那么这个国家的说法可能真的可信,因为个人工资与平均工资的差距较小。

标准偏差的经验法则是,通常68%的数据值总是在均值的一个标准差范围内,95%在两个标准差范围内,99.7%在三个标准差范围内。因此,如果有人说该州95%的人口年龄在4到84岁之间,并要求你求其均值。然后,你可以很容易地计算出总体的平均年龄是4+84/2=22。因此,人口的平均年龄是22岁。因此,我们可以假设人口非常年轻。

在上面的例子中,平均数可能不能提供一个非常正确的国家的索赔,因此偏差介入,以挽救统计员的日子。你应该了解更多关于介绍性统计的信息对这些主题有一个深入的了解。

特色课程

选择合适的分布

最后更新2020年7月

  • 2小时
  • 30的讲座
  • 初学者水平
4.8 (3)

@RISK和其他蒙特卡罗模拟软件用户通过知道如何选择适当的分布而受益。|在费尔南多·埃尔南德斯

探索课程

统计建模的学生也学习

让你的团队。领导行业。

使用Udemy for Business订阅在线课程库和数字学习工具。

请求一个演示