线性相关:变量之间的线性关联
相关系数衡量的是两个变量之间的关联强度,线性相关表示的是两个变量之间最强的关联。从视觉上看,这表示两个变量之间的任何关系,当在图中相邻绘制时,这两个变量表示一条直线。与可视化的描述性统计一样,它也是统计应用程序的一个领域,它使用数字和图形技术总结数据,寻找模式,并以有用和方便的方式表示信息。试试这个描述统计学导论今天进行更全面的回顾。
皮尔逊积矩相关系数衡量变量之间线性关联的强度。样本的相关系数是最常见的用r,和人口用相关系数ρ或r r明显用于统计,而且在数学和科学来衡量两个变量之间的线性关系的力量。更简单地说,它表示一个数字被另一个数字的变化所影响的程度。想要了解更多,可以试试这个推理统计学课程指导您通过SPSS中的统计检验,包括t检验、方差分析、相关、回归和卡方。
在讨论线性关联之前,让我们先从如何找到相关系数开始。
首先,确保您使用的是两组不同的数据。E每一对分别表示为(x我y我)。
- 你从四个初始计算开始。从这些计算得到的数量将在我们的计算的后续步骤中使用r:
- 计算x̄,数据的所有第一个坐标的平均值x我。
- 计算ȳ,数据的所有第二个坐标的平均值y我。
- 计算年代x数据的所有第一坐标的样本标准差x我。
- 计算年代y数据的所有第二坐标的样本标准差y我。
- 用公式(zx)我= (x我- x̄)/年代x并为每一个计算一个标准值x我。
- 用公式(zy)我= (y我-ȳ)/年代y并为每一个计算一个标准值y我。
- 乘以相应的标准化值:(zx)我(zy)我
- 将最后一步的产物加在一起。
- 将前一步的和除以n- 1,n是成对数据集中点的总数。所有这些的结果就是相关系数r。
完整的公式如下:
相关系数的符号和绝对值描述了两个变量之间关系的方向和大小。
- 相关系数取值范围为-1 ~ 1。
- 相关系数绝对值越大,线性关系越强。
- 最强的线性关系是由-1或1的相关系数表示的。
- 最弱的线性关系用相关系数等于0表示。
- 正相关意味着如果一个变量变大,另一个变量也会变大。
- 负相关意味着如果一个变量变大,另一个变量趋于变小。
值得注意的是,仅仅因为r等于0,并不意味着两个变量之间的关系是零。相反,它意味着有0个线性关系。皮尔逊积矩相关系数仅度量线性关系。
让我们将这些规则与一个流行的统计示例一起使用。
问:一份杂志报道了以下相关性。
- 汽车重量与汽车可靠性的相关系数为-0.30。
- 汽车重量与年维修费用的相关系数为0.20。
下列哪个陈述是正确的?
较重的汽车往往不太可靠。
2较重的汽车保养成本较高。
3汽车重量与可靠性的关系比与维护成本的关系更密切。
选项:
(一)我只
(B) II
第三(C)
(D)只有I和II
(E) I、II、III
答案:正确答案为(E)。汽车重量与可靠性之间的相关性为负。这意味着随着汽车重量的增加,可靠性往往会下降。汽车重量与维护成本呈正相关关系。这意味着随着汽车重量的增加,维护成本也会增加。
两个变量之间关系的强度是通过相关系数的绝对值来表示的。汽车重量和可靠性之间的相关性绝对值为0.30,这意味着变量之间存在线性相关关系(最强的线性关系是相关系数为-1或1),虽然不是很强。汽车重量和维护成本之间的相关性绝对值为0.20(仍然是线性关系,但略弱)。因此,汽车重量与可靠性之间的关系要强于汽车重量与维护成本之间的关系。
试着用这个公式来测试另一组变量对。需要更多实用统计的练习吗?试试这个课程内容包括可接近的概念和生成用户研究中常见问题的统计解决方案。