相关系数公式数据分析构成了统计的基础。数据分析在今天的商业世界中是必不可少的,因为数据公司从市场上收集了每个和他们所做的每一个决定。相关系数公式是基于统计数据形成意见的最佳方式之一。

排序数据

通过研究获得的数据通常转换为数字形式,因此可以对数据进行进一步的计算,并且变得容易处理。某些处理和分析数据的常用方法包括排序数据变量,在图表和图表上组织它们,将它们分类为不同的类别并计算收集数据变量的平均值,模式和中位数。

了解数据变量

我们继续提及的这些数据变量是什么?它们可以是任何东西,就像一个人的高度,一个人的年龄或商品等糖果,或篮球。为什么这些数据变量相关?很明显,孩子会比长大的人消耗更多的糖果。然而,一个孩子可能不会像少年或成年人那样玩篮球。数据变量与人的年龄之间的反向(负)关系和糖果消耗 - 随着年龄的增长,他消耗了更少的糖果。然而,在篮球的人和时间花费的年龄之间存在直接(积极的)关系 - 一个人在年龄较大时扮演更多的篮球。

如果您是一家制作糖果或篮球的公司,您将想知道这些数据变量之间的关系,因此您可以将您的产品朝向群体的特定范围。

使用相关系数公式:找到数据变量之间的关系

相关系数公式是统计中非常有用的公式。它可以帮助您计算-1至+1的两个数据变量之间的关系。如果您的结果是+1,这意味着您的两个变量是一个完美的积极匹配(很少发生)。如果您的结果为0,则变量根本不匹配。如果您的结果是-1,则变量是负匹配。

让我们继续使用我们的糖果和篮球示例。在这种情况下,我们将有三个工作变量:年龄,糖果消耗和篮球。如果我们计算了随相关系数公式消耗的年龄和糖果之间的关系,则相关系数的值将在0到-1的范围内。为什么?因为这两个变量之间存在反比关系!一个人得到的,他或她消耗的糖果越少。如果在图中绘制这两个点并绘制一条线,则它将具有负斜率。

如果我们要计算年龄和篮球的相关系数,那将是积极的 - 在0到1之间。在图表上,您将从(0,0)中绘制的线将具有正斜率。

相关系数(也称为Pearson Product-Morey Constelation系数)只不过是两个变量X和Y之间的依赖的度量。在我们的示例中,变量X将是年龄,变量Y将是糖果(或篮球)。如果你切换围绕的值可能是y,糖果或篮球可能是x无关紧要。相关系数仍然具有相同的值(它仍将在图表上占用相同的位置)。

相关系数公式解释

相关系数公式如下:

(r)= [nΣxy - (σx)(σy)/ sqrt([nΣx2 - (σx)2] [nΣy2 - (σy)2])]

看起来很复杂吗?让我们打破:

R:相关系数由字母r表示。

n:值数。如果我们有五个人,我们正在计算相关系数,n的值为5。

x:这是第一个数据变量。

y:这是第二个数据变量。

σ:Sigma符号(希腊语)告诉我们计算它旁边的“总和”。

例子:让我们来计算一组数据的相关系数,以帮助您更好地理解公式。通常,大多数计算器(科学版)如果输入数据变量,则会自动计算系数,但您应该在纸上尝试几次 - 它可以帮助您更好地掌握概念。让我们担任x变量和消耗的糖果作为y变量的糖果。让我们假设在研究之后,我们发现当孩子们变老时,他们吃了更少的糖果。以下是我们为三个孩子(或他生命中三个阶段的单个孩子收到的数据变量的价值。

x(儿童年龄)

Y(糖果消耗)

6.

10.

7.

9.

8.

8.

第1步:找到我们需要的所有值

这里,n(x和y中的变量数)为3。

X

y

XY.

X2

Y2.

6.

10.

60.

36.

100.

7.

9.

63.

49.

81.

8.

8.

64.

64.

64.

我们需要的其他值是:

Σx= 6 + 7 + 8 = 21

ΣY= 10 + 9 + 8 = 27

Σxy= 60 + 63 + 64 = 187

Σx2= 36 + 49 + 64 = 149

ΣY2= 100 + 81 + 64 = 245

步骤2:输入值进入公式

(r)= [nΣxy - (σx)(σy)/ sqrt([nΣx2 - (σx)2] [nΣy2 - (σy)2])]

r = [3(187) - (21)(27)/ sqRT([3(149) - (21)2] [3(245) - (27)2])]]

R = [561-567 / sqrt([447-441] [735-729])]]

r = [-6 / sqrt([6] [6])]

r = [ - 6 / sqrt(36)]

r = -6 / 6

r = -1

解释

我们获得的相关系数是一个完美的减号1.这表明我们的两个变量之间存在完美的否定(逆)匹配。随着一个变量的值增加,其他变量的值下降。实际上,当他们年轻的孩子时,有些孩子在年轻时,孩子们没有吃多少糖果,当他们年轻的孩子和不同年龄段吃不同数量的糖果时,他们就没有吃了很多糖果。因此,系数的值可能几乎永远不会是-1 - 而是将在0到1之间。

当然,我们拍了一个相对简单的例子来告诉你数据分析并不像它看起来那么难!!您可以应用相同的原则分析各种业务情况的数据

特色课程

选择适当的分配

上次更新于7月2020年7月

  • 2个小时
  • 30讲座
  • 初级水平
4.9 (4)

@RISK和其他Monte Carlo仿真软件用户通过了解如何选择适当的发行版来获益。|由Fernando Hernandez.

探索课程

统计建模学生也会学习

赋予你的团队。引领行业。

通过Udemy为Business获取组织的在线课程和数字学习工具库的订阅。

请求演示