相关性分析——皮尔逊

参考文章:
【1】这篇回答写的很好
【2】皮尔逊相关系数(Pearson Correlation Coefficient)

1.皮尔逊相关系数
皮尔逊相关系数的百度百科定义: 在统计学中,皮尔逊相关系数( Pearson correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,简称 PPMCC或PCCs),是用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。
在这里插入图片描述

### 如何在R语言中执行皮尔逊相关性分析 #### 准备工作 为了进行皮尔逊相关性分析,首先需要准备数据集。假设有一个简单的CSV文件`data.csv`,其中包含两列数值型数据。 ```r # 加载必要的库 library(readr) # 导入数据 data <- read_csv("path/to/data.csv") # 查看前几行数据以确认导入成功 head(data) ``` #### 计算皮尔逊相关系数 一旦有了合适的数据框对象,在R中可以通过内置函数`cor()`轻松计算皮尔逊相关系数[^1]。 ```r # 假设数据集中有两列名为 'var1' 和 'var2' pearson_correlation <- cor(data$var1, data$var2, method = "pearson") print(pearson_correlation) ``` 此命令会返回一个介于-1到+1之间的值,表示两个变量间的线性关联程度;正值意味着正向关系,而负值则代表反向关系[^2]。 #### 进行假设检验 除了简单地获取相关系数外,还可以利用`t.test()`或专门设计的`cor.test()`来进行更深入的统计推断——即测试观察到的相关是否可能随机发生。 ```r test_result <- cor.test(data$var1, data$var2, method="pearson") print(test_result) ``` 上述代码不仅提供了p-value帮助判断结果的重要性水平,还包括95%置信区间的估计。 #### 可视化相关矩阵 对于拥有更多变量的情况,创建热图有助于直观理解各变量间的关系模式[^3]。 ```r # 安装并加载ggplot2包用于绘图 install.packages("GGally") # 如果尚未安装的话 library(GGally) # 绘制所有成对组合的相关性图表 pairs.panels(data) ``` 这种图形展示方式特别适合探索大型数据集内的复杂结构和潜在趋势。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值