pandas读取xls文件 保存指定文档的指定表格
时间: 2025-06-22 09:48:23 浏览: 14
### 使用 Pandas 读取 XLS 文件并保存指定表格
为了实现这一需求,可以按照如下方法操作:
#### 导入库
首先需要导入 `pandas` 库来处理 Excel 文件。
```python
import pandas as pd
```
#### 加载 XLS 文件中的特定工作表
通过 `pd.read_excel()` 函数加载 .xls 文件。此函数允许指定要读取的工作表名称或索引位置。如果知道具体的工作表名,则可以直接传入该字符串;也可以使用 sheet_name 参数设置为 None 来一次性读取所有工作表,并将其作为字典返回[^4]。
```python
# 假设文件路径为 'path_to_file.xls'
df = pd.read_excel('path_to_file.xls', sheet_name='Sheet1')
# 或者当不确定确切的工作表名字时可以选择默认的第一个sheet
# df = pd.read_excel('path_to_file.xls', sheet_name=0)
```
#### 处理数据框 (DataFrame)
此时已经成功创建了一个基于所选工作表的数据帧对象(df),可以根据实际业务逻辑对这些数据执行进一步的操作,比如筛选、清洗等。
#### 存储至其他格式的文件
完成必要的预处理之后,就可以把修改过后的 DataFrame 对象导出到不同的文件类型里去了。这里展示几种常见的输出方式:
- **CSV**: 如果希望将结果另存为逗号分隔值(Comma-Separated Values)文件的话,只需调用 to_csv 方法即可。
```python
df.to_csv('output.csv', index=False, sep=',')
```
- **Excel (.xlsx)**: 若要保持原有的电子表格形式不变,那么应该考虑采用 ExcelWriter 类配合 save 方法一起使用。
```python
with pd.ExcelWriter('new_output.xlsx') as writer:
df.to_excel(writer, sheet_name='NewSheetName', index=False)
```
- **TSV**: 同样地,对于制表符分割(Tab-Separated Values)文件来说,只需要调整分隔符参数sep='\t'.
```python
df.to_csv('output.tsv', index=False, sep='\t')
```
以上便是关于如何运用 Python 及其第三方库——Pandas 实现从 .xls 格式的源文件中选取特定部分再转存为目标文档类型的全过程介绍[^1]。
阅读全文
相关推荐


















