pandas 读取文件
时间: 2025-01-13 11:46:01 浏览: 51
### 如何使用 Pandas 读取文件
#### 使用 `read_csv` 方法读取 CSV 文件
Pandas 提供了多种读取文件的方法,其中最常用的是 `read_csv()` 函数来处理逗号分隔值 (CSV) 文件。此函数可以加载本地或远程存储的数据,并返回 DataFrame 对象。
```python
import pandas as pd
# 基本用法:读取 CSV 文件并显示前几行
df = pd.read_csv('path/to/file.csv')
print(df.head())
```
对于更复杂的场景,可以通过设置不同的参数来自定义读取行为[^1]:
- **sep**: 定义字段之间的分隔符,默认为逗号 `,`
- **header**: 指定哪一行作为列名;如果不存在则设为 None
- **names**: 当 header=None 时提供自定义的列名称列表
- **usecols**: 只导入特定的列,接受整数索引或字符串形式的列标签
- **skiprows**: 跳过某些行不参与解析
- **nrows**: 控制要读取的最大行数
#### 处理其他类型的纯文本文件
除了标准的 CSV 文件外,还可以通过调整参数轻松应对不同格式的纯文本文件,比如 TSV(Tab-Separated Values),只需更改 `sep='\t'` 即可[^2]。
```python
# 读取带有 Tab 分割符的 TXT 文件
data = pd.read_table('D/anadondas/数据分析/文本.txt', sep='\t')
# 如果没有标题行,则手动指定列名
column_names = ['col1', 'col2']
data_no_header = pd.read_table('file_without_header.txt', names=column_names, sep='\t')
```
#### Excel 文件的支持
针对 Microsoft Excel 表格文档,pandas 支持利用 `read_excel()` 来访问工作表中的数据。该功能依赖于第三方库 openpyxl 或 xlrd 进行底层操作[^4]。
```python
# 加载整个 Excel 工作簿的第一个 sheet
pd.read_excel('example.xlsx')
# 明确指出要打开的工作表名字
sheet_data = pd.read_excel('example.xlsx', sheet_name='SheetName')
# 同样支持多个 sheets 的批量读取
all_sheets = pd.read_excel('multi_sheet_file.xls', sheet_name=None)
for name, frame in all_sheets.items():
print(f'Sheet {name}:')
print(frame.head())
```
阅读全文
相关推荐


















