python遍历文件夹下的excel文件,并提取指定工作表指定区域数据,汇总到新文件
时间: 2025-01-27 11:13:43 浏览: 74
要实现这个功能,可以使用`pandas`库结合`os`库来遍历文件夹并读取Excel文件。这里有两个主要步骤:
1. **遍历文件夹并读取Excel文件**[^1]:
```python
import os
import pandas as pd
# 指定要搜索的文件夹路径
folder_path = "your_folder_path"
for filename in os.listdir(folder_path):
if filename.endswith(".xlsx") or filename.endswith(".xls"): # 检查文件扩展名
file_path = os.path.join(folder_path, filename)
data = pd.read_excel(file_path) # 读取Excel文件
# 对于每个读取的数据集,继续执行下一步操作...
```
2. **提取指定工作表并筛选数据**[^2]:
```python
# 假设我们只想从名为'sheet_name'的工作表提取数据,且只关心'A1:C10'这一区域
target_sheet = 'sheet_name'
target_range = 'A1:C10'
for _, df in data.items(): # _代表当前的工作表名称
if df.columns.isin(target_range.split(':')) and df.index.isin(range(1, 11)): # 检查列和行范围
# 提取满足条件的数据
extracted_data = df[target_range]
# 进一步处理提取的数据,比如添加元数据(如文件路径、文件名)
metadata = {'file_path': file_path, 'filename': filename}
# 合并到新数据集中
new_data = new_data.append(extracted_data, ignore_index=True) if 'new_data' in locals() else extracted_data
# 最后,将所有数据写入新的Excel文件
if new_data.empty:
print("No matching data found.")
else:
new_data.to_excel('output.xlsx', index=False)
```
请注意,这只是一个基本示例,实际应用时可能需要根据具体需求调整条件和数据处理部分。
阅读全文
相关推荐


















