pandas函数大全及详解
时间: 2025-01-08 11:56:22 浏览: 52
### Pandas 库函数列表及其详细解释
#### 数据处理与清洗
`fillna()` 方法用于填充缺失数据,可以指定多种策略来处理 `NaN` 值。这有助于提高数据分析的质量和准确性[^1]。
```python
import pandas as pd
df = pd.DataFrame([[pd.NA, 2], [3, 4]])
filled_df = df.fillna(0)
print(filled_df)
```
#### 创建 DataFrame 和 Series
Pandas 提供了灵活的方式创建结构化数据对象:
- 使用字典创建 DataFrame:
```python
data = {'col_1': [0, 1, 2, 3], 'col_2': [4, 5, 6, 7]}
df_from_dict = pd.DataFrame.from_dict(data)
print(df_from_dict)
```
- 构建 Series 对象:
```python
s = pd.Series([1, 2, 3, 4])
print(s)
```
#### 文件读写操作
支持 CSV、Excel 等常见文件格式的数据导入导出功能:
- 从 CSV 文件加载数据:
```python
csv_data = pd.read_csv('example.csv')
print(csv_data.head())
```
- 将 DataFrame 存储为 Excel 表格:
```python
excel_writer = pd.ExcelWriter('output.xlsx', engine='xlsxwriter')
df.to_excel(excel_writer, sheet_name='Sheet1')
excel_writer.save()
```
#### 统计分析工具
内置丰富的统计计算方法帮助快速获取数据特征:
- 计算描述性统计数据:
```python
summary_stats = csv_data.describe(include='all')
print(summary_stats)
```
- 获取唯一值的数量:
```python
unique_counts = s.nunique()
print(unique_counts)
```
#### 时间序列处理能力
针对时间戳型数据提供了专门的操作接口:
- 转换字符串到 datetime 类型:
```python
date_series = pd.to_datetime(['2023/09/08', '2023/09/09'])
print(date_series)
```
- 设置日期作为索引并重采样:
```python
ts_indexed_df = df.set_index(pd.DatetimeIndex(date_series))
resampled_ts = ts_indexed_df.resample('D').mean()
print(resampled_ts)
```
更多关于 Pandas 的高级特性和具体应用场景可参阅官方文档或相关教程资料。
阅读全文
相关推荐


















