皮尔森 统计学相关性分析_统计学之三大相关性系数(pearson、spearman、kendall)...

本文介绍了统计学中的皮尔森、斯皮尔曼和肯德尔相关性系数,阐述了它们的计算方法、适用场景以及对异常值的敏感性。通过实例展示了如何在R语言中计算这些系数,并强调了它们在生物学实验数据分析中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关注公众号:“程序员成长软技能” ,日拱一卒,功不唐捐!

(转自 微信公众号克里克学苑)

三个相关性系数(pearson, spearman, kendall)反应的都是两个变量之间变化趋势的方向以及程度,其值范围为-1到+1,0表示两个变量不相关,正值表示正相关,负值表示负相关,值越大表示相关性越强。

person correlation coefficient(皮尔森相关性系数)

公式如下:

重点关注第一个等号后面的公式,最后面的是推导计算,暂时不用管它们。看到没有,两个变量(X, Y)的皮尔森相关性系数(ρX,Y)等于它们之间的协方差cov(X,Y)除以它们各自标准差的乘积(σX, σY)。

公式的分母是变量的标准差,这就意味着计算皮尔森相关性系数时,变量的标准差不能为0(分母不能为0),也就是说你的两个变量中任何一个的值不能都是相同的。如果没有变化,用皮尔森相关系数是没办法算出这个变量与另一个变量之间是不是有相关性的。

就好比我们想研究人跑步的速度与心脏跳动的相关性,如果你无论跑多快,心跳都不变(即心跳这个变量的标准差为0),或者你心跳忽快忽慢的,却一直保持一个速度在跑(即跑步速度这个变量的标准差为0),那我们都无法通过皮尔森相关性系数的计算来判断心跳与跑步速度到底相不相关。

我们再拔高一点,来看个更具普遍性的例子吧,其中的计算我们使用广受欢迎的R语言来运行,如果你手边也装了R语言,可以一起来做做看:

假设你现在做了个生物学实验,喜得以下两个变量:

X1=c(1, 2, 3, 4, 5, 6)

Y1=c(0.3, 0.9, 2.7, 2, 3.5, 5)

X1《-c(1, 2, 3, 4, 5, 6)

Y1《-c(0.3, 0.9, 2.7, 2, 3.5, 5)

mean(X1) #平均值

[1] 3.5

mean(Y1)

[1] 2.4

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值