遍历文件夹,根据文件夹修改日期先后顺序读取excel文件,并对数据进行concat拼接 python
时间: 2024-12-30 08:36:53 浏览: 53
在Python中,你可以使用`os`模块来遍历文件夹,`datetime`模块处理修改日期,`pandas`库用于读取Excel文件并操作数据。这里是一个简单的示例,如何按照文件修改时间排序并concat拼接Excel文件:
```python
import os
import pandas as pd
from datetime import datetime
# 定义函数,遍历指定目录下的Excel文件
def read_excel_files(directory):
excel_files = [f for f in os.listdir(directory) if f.endswith('.xlsx') or f.endswith('.xls')]
# 按照文件修改时间排序
sorted_files = sorted(excel_files, key=lambda x: datetime.fromtimestamp(os.path.getmtime(os.path.join(directory, x))))
dfs = []
for file in sorted_files:
df = pd.read_excel(os.path.join(directory, file))
dfs.append(df)
# 使用pandas concat拼接所有数据
concatenated_df = pd.concat(dfs)
return concatenated_df
# 调用函数,传入你想遍历的文件夹路径
directory_path = 'your_directory_path'
result_df = read_excel_files(directory_path)
```
在这个例子中,`read_excel_files`函数首先列出指定目录下所有的Excel文件,然后按文件的最后修改时间(mtime)排序。接着,它读取每个文件,将其转换为DataFrame,然后合并所有DataFrame到一个大的DataFrame中。
阅读全文
相关推荐


















