百科网

首页 > 生活常识 > 生活经验

生活经验

相关系数r的计算公式

生活经验佚名2023-05-10

相关系数(Correlation coefficient)是用来衡量两个变量之间相关程度的一个统计量。通俗的说,相关系数是用来刻画两个变量之间相互关联关系的强度与方向的。本文将详细介绍相关系数的定义、计算公式以及其在实际应用中的运用。

一、相关系数的定义

在数学和统计学中,相关系数通常用来描述两个变量之间的线性关系。它的取值范围通常在[-1,1]之间,其值越接近于1或-1,则表明两个变量之间的线性关系越紧密。当相关系数为0时,则表明两个变量之间不存在线性关系。

相关系数的正负号通常表明了两个变量之间的方向关系。如果相关系数为正,则表明当一个变量变大时,另一个变量也随之增加。反之,如果相关系数为负,则表明当一个变量变大时,另一个变量会减小。

相关系数通常使用 r 这个符号来表示,其计算公式如下:

r= (n∑xy-∑x∑y) ÷ ((n∑x^2-(∑x)^2)(n∑y^2-(∑y)^2))^1/2

其中,x和 y 分别代表两个变量(或两个赋值列),n代表数据样本的数量,∑xy代表x和y对应的数据乘积之和,∑x和∑y分别表示x和y的数据之和,∑x^2与∑y^2分别代表x和y每个数据的平方和。

相关系数的值通常是[-1,1]之间的实数,当相关系数为 1 时,表明两个变量之间的线性关系紧密、正相关;当相关系数为 0 时,表明两个变量之间不存在线性关系或只存在很弱的线性关系;当相关系数为 -1 时,表明两个变量之间的线性关系紧密,但是是负相关。

二、相关系数的计算方法

计算相关系数的方法根据给定数据的形式(原始数据或数据表)和数据集的大小(样本或总体)有所不同。在这里我们将详细介绍两种计算方法。

1、原始数据计算法

在原始数据计算法中,我们需要先计算两个变量的均值,然后计算两列数据的协方差,最后再用协方差除以两个变量的标准差的乘积得到相关系数 r。

该方法的计算公式如下:

r = ∑(x- x') (y- y') ÷ [ (∑(x- x')^2∑(y- y')^2)^(1/2)]

其中,x和y分别表示两个变量的数据集,x'和y'分别表示两个变量的均值。

举例来说,假如我们要计算一个公司的销售额与广告投入之间的相关系数。我们收集到了公司过去一段时间的销售额和广告费用(如下表所示):

步骤1:计算两个数据的均值:

x' = (100 110 105 120 115 125 130) / 7 = 114

y' = (50 55 60 72 68 75 80) / 7 = 64

步骤2:计算两个数据的协方差

s = ∑(x- x') (y- y') ÷ (n - 1)

= [(100-114) × (50-64) (110-114) × (55-64) (105-114) × (60-64) (120-114) × (72-64)