R(tidyverse包)常用操作

R语言tidyverse包数据操作指南
本文介绍了R语言tidyverse包中常用的数据操作,包括使用select函数提取列,filter函数和slice函数筛选行,按逻辑条件过滤数据,以及通过distinct去除重复行。此外,还讲解了如何根据一列合并表格以及重命名列。
提取列

对列进行选择 select 函数

提取行

对行进行选择 filter 函数
slice():按位置提取行
filter():提取符合特定逻辑条件的行。 例如,iris%>%filter(Sepal.Length> 6)。
filter_all(),filter_if()和filter_at():过滤变量然后选择行。 这些函数复制所有变量或变量选择的逻辑标准。
sample_n():随机选择n行
sample_frac():随机选择一小部分行
top_n():选择变量排序的前n行

根据某一列合并表格
# 保存左侧完整表格
left_join(table1,table2,by="相同的列名") # 两列列名称不同使用(c ("X1"="Y1"))
right_join # 保存右侧
full_join # 取并集
inner_join # 取交集
删除重复行
# 根据所有列删除重复的行(完全一样的观测值):
my_data %>% distinct()
# 根据特定列删除重复值
my_data %>% distinct(Sepal.Length, .keep_all = TRUE)
# 根据多列删除重复值
my_data %>% distinct(Sepal.Length, Petal.Width, .keep_all = TRUE)
# 选项.kep_all用于保留数据中的所有变量。

根据一个或多个列值删除重复行:my_data%>%dplyr :: distinct(Sepal.Length)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值