相关系数解释数据分析在当今世界比以往任何时候都更加重要。数据分析技术是所有领域的重要组成部分,从研究和科学研究到商业和市场营销。大公司往往依靠数据分析技术来超越竞争对手,销售更多的产品或服务。数据分析的主要目标是从可用的数据源中得出有用的结论,然后用这些结论做出逻辑决策。这不是一项容易的工作——不是每个人都能做——因此,数据分析师和统计人员永远都不缺工作。要成为一名统计学家,你需要熟悉统计分析的主要技术,并对数字和数字总体上很好。然而,你并不需要想成为一名统计学家才能学习统计和数学。学习统计学总是有用的,无论你在什么领域。如果你对统计学感兴趣,你可以上我们的介绍性课程可帮助您以简单的方式学习统计数据。我们涵盖了您需要知道的所有事情,以便彻底了解对主题 - 包括基础知识和数据分析的主要技术。

在本教程中,我们将来看看如何解释相关系数。如果您知道如何,它将更容易理解本教程计算相关系数,正如我们在本教程中所展示的那样。

什么是相关系数?

在统计学中,相关系数表示两个变量之间的关系强度。当我们说两个变量是相关的,这意味着两者之间存在一个可定义的关系。如果两个变量之间存在正相关关系,则表示当一个变量的值上升时,另一个变量的值也会上升,反之,当一个变量的值下降时,另一个变量的值也会下降。如果两个变量之间存在负相关关系,即当一个变量的值上升时,另一个变量的值下降,反之,当一个变量的值下降时,另一个变量的值上升。

正相关的一个例子是天然气价格与食品价格之间的关系。当气体昂贵时,食物也变得更加昂贵,反之亦然。负相关的一个例子是任何产品的供求之间的关系。随着产品的供应升高,其需求减少,反之亦然。

相关系数用于测量图形上的两个变量之间的线性关系的强度。它也绘制了关系的方向。相关系数通过以下公式计算:

(r)= [nΣxy - (σx)(σy)/ sqrt([nΣx2 - (σx)2] [nΣy2 - (σy)2])]

这些字母代表什么?

r:这是相关系数

n: n指定我们正在查看的值的数量。如果我们有5个实例来计算相关系数,那么n的值就是5。

x:第一个数据变量。

y:这是第二个数据变量。

σ.:西格玛符号(希腊语)被用来计算任何放在它旁边的东西的总和。

配方似乎令人困惑吗?让我们打破它以更好地了解它。如果我们计算重量损失和运动之间的关系,例如,减肥将是可变的x,锻炼将是可变的。如果我们为10人这样做,N将为10.计算结果后,我们将获得R的值。仍然困惑?如果您需要更多帮助解公式(或者您想了解有关一般相关的相关),我们会推荐您参加我们的课程来帮助你通过概率论和统计学的基础知识。

相关系数的解释

让我们继续使用上面的例子来帮助我们解释(理解和使用)相关系数。你可能会想,你锻炼得越多,你减掉的体重就越多,对吧?当然,这在某些情况下是正确的,但并不是所有情况都是如此。有些人在健身房增重,有些人则减重。这混淆了我们正在研究的两个变量(运动和减肥)之间的关系。

在现实世界中,很难得到两个变量之间的正(+1)或负(-1)关系。因此,相关系数的值通常徘徊在1和-1之间,取决于两个变量之间的关系强度。要了解更多有关相关性的知识,并获得更多处理这种情况的示例,您可以查看下面的内容我们的教程在这个话题。或者,你可以在统计数据上注册并在一个地方学习所有基础知识。

相关系数r的精确值

相关系数的值越接近1或-1,两个变量与其波动的影响越多,它们的波动越多。如果值r是1,这表示两者之间的完美正相关关系,并且可以在图形上绘制为向上的线,具有高斜率。如果值r等于0。5,这表示两个变量之间的正关系可以在图上画成一条向上的直线,斜率适中。如果值r等于0,这两个变量之间没有任何关系。如果值r是-0.5,这将表示两个变量之间的负面关系,它可以在图形上绘制为与中等斜率下降的线。如果值r是-1,它将表示两个变量之间的负相关,它可以在图形上绘制为与陡坡下方的线。

如果相关系数的值在0.1到0.5或-0.1和-0.5之间,则据说该关系中的两个变量是弱相关的。如果相关系数的值在0.9和1或-0.9和-1之间,则两个变量非常强烈。

正如我们前面讨论的,正系数表示变量同时上升。另一方面,负的系数表示变量朝着相反的方向移动。通过检查系数的正负值,很容易看出两者之间的关系。

统计概率原理

通过执行其他计算,如回归分析,可以进一步解释相关系数,例如回归分析,我们不会在当前的教程中详细讨论。可以采用统计概率原理来进一步了解两个变量之间的关系。如果相关系数高(.9),则偶然发生两者之间的关系的统计概率非常低。如果相关系数低(.1),则偶然发生两个变量之间的关系的统计概率很高。在某些情况下,当研究下的变量不明确或模糊时,我们可能需要通过这些技术进行进一步分析它们。

通过形成相关系数矩阵,可以进一步解释或研究相关系数。要了解有关相关系数的更多信息,并且相关矩阵用于日常分析,可以注册本课程,删除了用户体验的实用统计数据

特色课程

选择适当的分配

最后更新2020年7月

  • 2小时
  • 30的讲座
  • 初学者水平
4.9 (4)

@RISK和其他Monte Carlo仿真软件用户通过了解如何选择适当的发行版来获益。|在费尔南多·埃尔南德斯

探索课程

统计建模学生也会学习

赋予你的团队。引领行业。

使用Udemy for Business订阅在线课程库和数字学习工具。

请求演示