pandas库excel
时间: 2025-01-20 19:07:03 浏览: 49
### 使用 Pandas 处理 Excel 文件
#### 读取 Excel 文件
为了使用 `pandas` 库来读取 Excel 文件,可以利用 `read_excel()` 函数。此函数能够加载指定路径下的 Excel 文件并将其转换为 DataFrame 对象[^1]。
```python
import pandas as pd
def read_excel_file(file_path):
df = pd.read_excel(
io=file_path,
header=0, # 设置第一行为列名
sheet_name='Sheet2',# 指定要读取的工作表名称
keep_default_na=False,# 不保留默认的NA/NAN标记
dtype=str, # 将所有数据强制转换为字符串类型
engine='openpyxl' # 明确指明使用的解析引擎
)
return df
file_path = r'C:\Users\1\Desktop\date_raw.xlsx'
data_frame = read_excel_file(file_path)
print(data_frame)
```
这段代码定义了一个简单的函数 `read_excel_file()`, 它接受一个文件路径作为参数,并通过调用 `pd.read_excel()` 方法来获取该位置上的 Excel 数据。注意这里设置了几个重要选项以确保正确读入数据:
- `header`: 表头所在行数;
- `sheet_name`: 需要访问的具体工作簿的名字;
- `keep_default_na`: 是否保持原始 NA 值不变;
- `dtype`: 强制设定每一列的数据类型;
- `engine`: 解析器的选择,在某些情况下可能需要显式声明以便兼容不同版本的 Excel 文件[^3]。
#### 写入 Excel 文件
除了读取外,还可以借助 `to_excel()` 方法轻松地将 DataFrame 存储回新的或已有的 Excel 文件中。下面是一个基本的例子展示如何保存修改后的 DataFrame 到磁盘上:
```python
output_file_path = 'C:\\path\\to\\your\\new_output.xlsx'
with pd.ExcelWriter(output_file_path, engine='xlsxwriter') as writer:
data_frame.to_excel(writer, index=False, sheet_name='New Sheet')
```
在这个例子中,创建了一个临时对象 `ExcelWriter` 来管理整个写操作过程中的多个工作表。对于每一个想要写出到 Excel 中的数据集都可以单独调用一次 `.to_excel()` 。最后关闭这个上下文管理者 (`with`) 后会自动完成实际的文件存储动作。
阅读全文
相关推荐















