相关性分析代码python
时间: 2024-11-22 22:27:12 浏览: 68
在Python中,相关性分析通常使用`pandas`库中的`corr()`函数来计算数据集或两个变量之间的关联程度,以及`matplotlib`或`seaborn`库来进行可视化。以下是一个简单的例子:
```python
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# 假设我们有一个DataFrame df
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10],
'C': [11, 12, 13, 14, 15]
})
# 计算所有列的相关系数
correlation_matrix = df.corr()
# 热力图展示相关性矩阵
plt.figure(figsize=(10, 8))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')
plt.title('Correlation Matrix')
plt.show()
# 或者只看特定两列的皮尔逊相关系数
pearson_corr = df['A'].corr(df['B'])
print(f'The Pearson correlation between column A and B is {pearson_corr:.2f}')
```
在这个例子中,`corr()`函数返回的是一个二维数组,对角线上的值都是1,表示每个变量与自身的完美正相关。非对角线上的值表示变量间的关联度,正值表示正相关,负值表示负相关。
阅读全文
相关推荐

















