python遍历文件夹下的excel文件,并提取指定工作表指定区域数据,汇总到新文件中
时间: 2025-01-27 14:13:44 浏览: 55
要使用Python遍历文件夹下的Excel文件,并提取指定工作表的指定区域数据,然后将这些数据汇总到一个新的文件中,你可以使用`pandas`和`openpyxl`库来实现。以下是一个简单的步骤说明和代码示例:
1. 首先,确保你已经安装了`pandas`和`openpyxl`库。如果没有安装,可以使用pip来安装:
```bash
pip install pandas openpyxl
```
2. 导入所需的库:
```python
import os
import pandas as pd
```
3. 设置文件夹路径、目标工作表名称和数据区域:
```python
folder_path = '你的文件夹路径'
sheet_name = '指定的工作表名'
data_range = 'A1:C10' # 例如,提取A1到C10的数据
```
4. 创建一个空的DataFrame用于存储所有文件的数据:
```python
all_data = pd.DataFrame()
```
5. 遍历文件夹中的所有Excel文件:
```python
for filename in os.listdir(folder_path):
if filename.endswith('.xlsx') or filename.endswith('.xls'):
file_path = os.path.join(folder_path, filename)
# 读取指定工作表的指定区域
data = pd.read_excel(file_path, sheet_name=sheet_name, usecols=data_range)
# 将数据添加到all_data DataFrame中
all_data = pd.concat([all_data, data], ignore_index=True)
```
6. 将汇总后的数据保存到新的Excel文件中:
```python
output_path = '汇总数据.xlsx'
all_data.to_excel(output_path, index=False)
```
7. 完整的代码如下:
```python
import os
import pandas as pd
folder_path = '你的文件夹路径'
sheet_name = '指定的工作表名'
data_range = 'A1:C10'
all_data = pd.DataFrame()
for filename in os.listdir(folder_path):
if filename.endswith('.xlsx') or filename.endswith('.xls'):
file_path = os.path.join(folder_path, filename)
data = pd.read_excel(file_path, sheet_name=sheet_name, usecols=data_range)
all_data = pd.concat([all_data, data], ignore_index=True)
output_path = '汇总数据.xlsx'
all_data.to_excel(output_path, index=False)
```
这样,你就可以遍历指定文件夹下的所有Excel文件,提取每个文件中指定工作表的指定区域的数据,并将这些数据汇总到一个新的Excel文件中了。
阅读全文
相关推荐


















