python pandas 多表合并同类项求和
时间: 2025-04-06 11:10:26 浏览: 29
### 如何使用 Python Pandas 合并多个表格并对相同类别项目求和
在实际应用中,可以利用 `pandas` 库中的函数实现多表合并以及条件求和的功能。以下是具体方法:
#### 数据准备
假设存在两个 Excel 文件,分别存储不同月份的销售数据。每个文件都包含两列:产品名称 (`Product`) 和销售额 (`Sales`)。
#### 读取多个 Excel 文件
通过 `pd.read_excel()` 函数逐一加载这些文件,并将其存入列表以便后续统一处理[^2]。
```python
import pandas as pd
# 假设有三个Excel文件路径如下
file_paths = ['sales_january.xlsx', 'sales_february.xlsx', 'sales_march.xlsx']
# 创建一个空列表用于保存DataFrame对象
dataframes_list = []
for file_path in file_paths:
df_temp = pd.read_excel(file_path)
dataframes_list.append(df_temp)
```
#### 多表合并
使用 `pd.concat()` 方法沿垂直方向堆叠所有 DataFrame 对象形成一个新的 DataFrame 表格。
```python
combined_df = pd.concat(dataframes_list, ignore_index=True)
```
#### 按照分类进行求和
调用 `groupby()` 结合 `sum()` 实现按指定字段分组后的数值累加操作[^1]。
```python
summary_df = combined_df.groupby('Product')['Sales'].sum().reset_index()
print(summary_df)
```
上述代码片段展示了如何先将来自不同源的数据集合起来再依据特定标准完成统计汇总的过程。
### 注意事项
- 确保各子表结构一致即拥有相同的列名与顺序;否则需提前调整使其匹配后再做连接动作。
- 如果遇到重复索引问题可通过设置参数 `ignore_index=True` 解决。
阅读全文
相关推荐









