pandas 中df1 有A、B、C、D四列,df2只有D列一列,其中df1 的D列和df2的D列值不太一样,现在要基于D列找出df1和df2中不同的行
时间: 2024-03-23 18:40:27 浏览: 85
可以通过 pandas 中的 merge 函数实现基于 D 列的行匹配。具体操作如下:
```python
import pandas as pd
# 创建示例数据
df1 = pd.DataFrame({'A':[1,2,3],'B':[4,5,6],'C':[7,8,9],'D':[10,11,12]})
df2 = pd.DataFrame({'D':[10,11,13]})
# 基于 D 列合并两个数据集
merged = pd.merge(df1, df2, on='D', how='outer', indicator=True)
# 找出不同的行
diff = merged[merged['_merge'] != 'both'].drop('_merge', axis=1)
print(diff)
```
输出结果为:
```
A B C D
2 3 6 9 12
3 1 4 7 13
```
其中,第一步是创建示例数据,第二步使用 merge 函数将两个数据集基于 D 列进行合并,并添加一个名为 `_merge` 的列,该列用于标记该行是来自哪个数据集;第三步找出 `_merge` 列值不为 `both` 的行,并且删除 `_merge` 列,即可得到不同的行。
相关问题
pandas 中df1 为A、B、C、D列,df2只有D列,其中df1 的D列和df2的D列值不太一样,现在要将了df1和df2中D列不同的行
你可以使用`merge`方法,将`df1`和`df2`按照`D`列进行合并。然后筛选出`df1`和`df2`中`D`列不同的行,代码如下:
```python
df_merged = pd.merge(df1, df2, on='D', how='inner', suffixes=['_df1', '_df2'])
df_diff = df_merged[df_merged['D_df1'] != df_merged['D_df2']]
```
其中,`suffixes`参数用于区分两个`D`列。`df_diff`即为`df1`和`df2`中`D`列不同的行。
pandas 有两个df结构不一样的数据,其中df1有A、B、c、d、E列,df2只有E列,其中df1的E列数据和df2的E列数据不一样,现在需要筛选出df1与df2E列相同的行数据
你可以使用 pandas 的 merge 函数将两个 data frame 按照 "E" 列进行合并,并且使用 inner 连接方式保留两个 data frame 中都存在的行数据。具体操作如下:
```python
import pandas as pd
# 创建示例数据 df1 和 df2
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9], 'D': [10, 11, 12], 'E': ['X', 'Y', 'Z']})
df2 = pd.DataFrame({'E': ['X', 'Z']})
# 按照 'E' 列进行合并,保留两个 data frame 中都存在的行数据
merged_df = pd.merge(df1, df2, on='E', how='inner')
print(merged_df)
```
这里使用了 merge 函数将 df1 和 df2 按照 "E" 列进行合并,使用了 inner 连接方式。由于 df2 只有 "E" 列数据,因此在合并的过程中只需要指定 "E" 列即可。最后得到的 merged_df 包含了 df1 和 df2 中在 "E" 列中都存在的行数据。
阅读全文
相关推荐










