皮尔逊相关系数怎么求
时间: 2025-01-28 08:10:42 浏览: 38
### 如何计算皮尔逊相关系数
#### 定义与公式
皮尔逊相关系数用于衡量两个变量之间的线性关系强度和方向。其取值范围在-1到+1之间,其中:
- +1表示完全正线性相关,
- 0表示无相关性,
- -1表示完全负线性相关。
具体计算公式如下[^4]:
\[ r_{xy} = \frac{\sum{(X_i-\bar{X})(Y_i-\bar{Y})}} {\sqrt{\sum(X_i-\bar{X})^2}\sqrt{\sum(Y_i-\bar{Y})^2}}\]
这里 \( X_i, Y_i \) 是观测值序列中的对应项;\( \bar{X}, \bar{Y} \) 则分别是这两个序列的平均数。
#### 实现代码示例
下面是一个简单的Python函数来计算给定两组数据间的皮尔逊相关系数:
```python
import numpy as np
def pearson_correlation(x, y):
n = len(x)
mean_x = sum(x) / n
mean_y = sum(y) / n
covariance = sum((a-mean_x)*(b-mean_y) for a,b in zip(x,y))
std_deviation_x = (sum([(i-mean_x)**2 for i in x])/(n)) ** 0.5
std_deviation_y = (sum([(j-mean_y)**2 for j in y])/(n)) ** 0.5
return covariance / (std_deviation_x * std_deviation_y)
# 测试案例
data_x = [1, 2, 3, 4, 5]
data_y = [7, 8, 9, 10, 11]
print(f"Pearson Correlation Coefficient: {pearson_correlation(data_x, data_y)}")
```
此段程序定义了一个名为`pearson_correlation()` 的函数接收两个列表参数 `x`, `y`. 函数内部先求得各自均值再通过上述提到的协方差以及标准偏差公式完成最终的相关系数运算并返回结果.
阅读全文
相关推荐

















