相关系数r的计算公式
|
相关系数(Correlation coefficient)是用来衡量两个变量之间相关程度的一个统计量。通俗的说,相关系数是用来刻画两个变量之间相互关联关系的强度与方向的。本文将详细介绍相关系数的定义、计算公式以及其在实际应用中的运用。
一、相关系数的定义 在数学和统计学中,相关系数通常用来描述两个变量之间的线性关系。它的取值范围通常在[-1,1]之间,其值越接近于1或-1,则表明两个变量之间的线性关系越紧密。当相关系数为0时,则表明两个变量之间不存在线性关系。 相关系数的正负号通常表明了两个变量之间的方向关系。如果相关系数为正,则表明当一个变量变大时,另一个变量也随之增加。反之,如果相关系数为负,则表明当一个变量变大时,另一个变量会减小。 相关系数通常使用 r 这个符号来表示,其计算公式如下: r= (n∑xy-∑x∑y) ÷ ((n∑x^2-(∑x)^2)(n∑y^2-(∑y)^2))^1/2 其中,x和 y 分别代表两个变量(或两个赋值列),n代表数据样本的数量,∑xy代表x和y对应的数据乘积之和,∑x和∑y分别表示x和y的数据之和,∑x^2与∑y^2分别代表x和y每个数据的平方和。 相关系数的值通常是[-1,1]之间的实数,当相关系数为 1 时,表明两个变量之间的线性关系紧密、正相关;当相关系数为 0 时,表明两个变量之间不存在线性关系或只存在很弱的线性关系;当相关系数为 -1 时,表明两个变量之间的线性关系紧密,但是是负相关。
二、相关系数的计算方法 计算相关系数的方法根据给定数据的形式(原始数据或数据表)和数据集的大小(样本或总体)有所不同。在这里我们将详细介绍两种计算方法。 1、原始数据计算法 在原始数据计算法中,我们需要先计算两个变量的均值,然后计算两列数据的协方差,最后再用协方差除以两个变量的标准差的乘积得到相关系数 r。 该方法的计算公式如下: r = ∑(x- x') (y- y') ÷ [ (∑(x- x')^2∑(y- y')^2)^(1/2)] 其中,x和y分别表示两个变量的数据集,x'和y'分别表示两个变量的均值。 举例来说,假如我们要计算一个公司的销售额与广告投入之间的相关系数。我们收集到了公司过去一段时间的销售额和广告费用(如下表所示):
步骤1:计算两个数据的均值: x' = (100 110 105 120 115 125 130) / 7 = 114 y' = (50 55 60 72 68 75 80) / 7 = 64 步骤2:计算两个数据的协方差 s = ∑(x- x') (y- y') ÷ (n - 1) = [(100-114) × (50-64) (110-114) × (55-64) (105-114) × (60-64) (120-114) × (72-64) (115-114) × (68-64) (125-114) × (75-64) (130-114) × (80-64)] /6 = 186.86 步骤3:计算标准差 sx =[(∑(x- x')^2)/(n-1)] ^1/2 =[((100-114)^2 (110-114)^2 (105-114)^2 (120-114)^2 (115-114)^2 (125-114)^2 (130-114)^2)/6]^(1/2) = 9.83, sy =[(∑(y- y')^2)/(n-1)]^1/2 =[((50-64)^2 (55-64)^2 (60-64)^2 (72-64)^2 (68-64)^2 (75-64)^2 (80-64)^2)/6]^(1/2) = 8.77. 步骤 4:计算相关系数 r=s/(sx sy)= 0.95 从上面的数据计算结果来看,该公司的销售额和广告费用之间存在着很强的正相关性。 2、数据表计算法 在数据表计算法中,我们需要先计算每个变量的平均数和标准差,然后计算两列数据的协方差,最后再用协方差除以两个变量的标准差的乘积得到相关系数。计算公式如下: r = cov(x,y) / (std(x) * std(y)) 其中,cov(x,y)代表两个变量的协方差,std(x)和std(y)分别代表两个变量的标准差。
三、相关系数的应用 相关系数在统计学上的应用极其广泛,对数据分析有重要的帮助。有以下几个方面的应用: 1、判断变量之间的相关性 通过计算相关系数,我们可以确定两个变量之间的相关性。如果相关系数大于0,表明两个变量之间存在正相关关系;如果相关系数小于0,则表明两个变量之间存在负相关关系;如果相关系数等于0,则表明两个变量之间不存在线性相关关系。 2、用于多元回归和线性回归分析 在多元回归和线性回归分析中,相关系数可以用来判断自变量和因变量之间的关系。例如,我们可以使用相关系数来判断传统电视广告投入与电视机收视人数之间的相关性,以及这两个因素如何对销售额产生影响。 3、用于探索性数据分析 相关系数也有助于探索性数据分析,可以帮助观察员们了解变量之间的相互关系,从而有助于数据分析员们发现新的变量之间的关系,尤其是那些不容易被发现的变量。 |
相关文章
热销商品
淘保罗品牌男士短袖POLO衫夏季新款纯棉高档条纹休闲时尚翻领T恤
保罗品牌男士短袖POLO衫夏季新款纯棉高档条纹休闲时尚翻领T恤
¥34.3 领券购买
淘中国舞免抽绳儿童练功鞋软鞋粉色不系带软底男士两底舞蹈鞋女软芭
中国舞免抽绳儿童练功鞋软鞋粉色不系带软底男士两底舞蹈鞋女软芭
¥7.3 领券购买
淘苗族舞蹈鞋子傣族舞蹈鞋儿童女高级舞蹈鞋彝族男生黑色布鞋演出鞋
苗族舞蹈鞋子傣族舞蹈鞋儿童女高级舞蹈鞋彝族男生黑色布鞋演出鞋
¥13 领券购买
天手机挂脖支架第一视角拍摄设备运动相机防抖磁吸胸前直播解放双手vlog拍摄神器适用大疆GoPro影石固定补光灯
手机挂脖支架第一视角拍摄设备运动相机防抖磁吸胸前直播解放双手vlog拍摄神器适用大疆GoPro影石固定补光灯
¥69 领券购买
天防抖磁吸手机挂脖支架第一视角拍摄胸前固定架骑行钓鱼vlog视频户外跑步直播设备通用配件
防抖磁吸手机挂脖支架第一视角拍摄胸前固定架骑行钓鱼vlog视频户外跑步直播设备通用配件
¥89 领券购买
淘反季清仓捡漏款棉服超轻款棉衣大码男装春款轻薄棉袄2025新款立领
反季清仓捡漏款棉服超轻款棉衣大码男装春款轻薄棉袄2025新款立领
¥5.8 领券购买
淘男胖子百搭直筒休闲裤春季宽松抗皱九分西装裤加肥加大通勤长裤男
男胖子百搭直筒休闲裤春季宽松抗皱九分西装裤加肥加大通勤长裤男
¥83.6 领券购买
天【官方直营】轩尼诗VSOP探索王嘉尔同款特调限量版干邑白兰地洋酒
【官方直营】轩尼诗VSOP探索王嘉尔同款特调限量版干邑白兰地洋酒
¥547.51 领券购买
天【官方直营】轩尼诗百乐廷干邑白兰地50ml 进口洋酒官方正品
【官方直营】轩尼诗百乐廷干邑白兰地50ml 进口洋酒官方正品
¥828 领券购买
天【官方直营】轩尼诗詹姆士马年礼盒700ml干邑白兰地 法国进口洋酒
【官方直营】轩尼诗詹姆士马年礼盒700ml干邑白兰地 法国进口洋酒
¥1007.92 领券购买
天南极人水暖毯2025新款水暖电热毯双人水循环单人电褥子毯子旗舰店
南极人水暖毯2025新款水暖电热毯双人水循环单人电褥子毯子旗舰店
¥168.96 领券购买
天真皮短靴女单靴加绒保暖皮靴中筒马丁靴秋冬季雪地靴女士妈妈靴子
真皮短靴女单靴加绒保暖皮靴中筒马丁靴秋冬季雪地靴女士妈妈靴子
¥180 领券购买
淘藤椒牛肉条麻辣五香牛肉干川香熟食即食牛肉特产零食小吃本宫饿了
藤椒牛肉条麻辣五香牛肉干川香熟食即食牛肉特产零食小吃本宫饿了
¥28.3 领券购买
天HM男装风衣法式通勤外套外出轻便舒适翻领中长款时尚大衣1262251
HM男装风衣法式通勤外套外出轻便舒适翻领中长款时尚大衣1262251
¥411 领券购买
淘【高克重100%羊毛】CULTUM 国王版马球大衣双排人字纹毛呢外套男
【高克重100%羊毛】CULTUM 国王版马球大衣双排人字纹毛呢外套男
¥878 领券购买
淘上海回力帆布鞋休闲运动跑步体考训练拔河跳远鞋男鞋女鞋学生鞋
上海回力帆布鞋休闲运动跑步体考训练拔河跳远鞋男鞋女鞋学生鞋
¥51 领券购买

