python中DataFrame的用法
时间: 2025-05-07 22:51:48 浏览: 24
### Python 中 DataFrame 的使用方法
#### 创建 DataFrame
`pandas` 是 Python 数据处理的重要工具之一,其核心数据结构 `DataFrame` 提供了强大的功能来简化数据操作。创建一个简单的 `DataFrame` 可以通过字典列表实现[^3]。
```python
import pandas as pd
data = {'Name': ['John', 'Emma', 'Max'],
'Age': [28, 32, 45],
'Salary': [5000, 8000, 6000]}
df = pd.DataFrame(data)
print(df)
```
#### 条件删除行
为了按特定条件移除某些行,可以结合布尔索引与 `.drop()` 方法。例如,当想要去除 A 列等于某个数值的所有记录时:
```python
# 删除A列值为5的行
df_dropped_rows = df.drop(df[df['A'] == 5].index)
print(df_dropped_rows)
```
此段代码会找到所有满足 `'A'==5` 的行并将其从原始表中剔除[^1]。
#### 排序
对于需要对某列进行排序的情况,可以通过调用内置函数完成。比如按照工资高低降序排列员工信息:
```python
# 对 Salary 列进行排名
df_sorted_by_salary = df.sort_values(by='Salary', ascending=False)
print(df_sorted_by_salary)
# 或者获取 Salary 列的具体排名位置
df_ranked_salaries = df['Salary'].rank(method='min', ascending=False)
print(df_ranked_salaries)
```
上述例子展示了如何先依据某一字段升/降序整理整个表格以及单独计算该字段内的相对名次[^2]。
#### where 函数的应用
`where` 函数用于根据给定条件过滤或修改数据。如果希望只保留符合条件的部分,则可设置参数使不符合项变为缺失值 (NaN),之后再进一步清理这些 NaN 记录。
```python
filtered_df = df.where(df['Age'] > 30).dropna()
print(filtered_df)
```
这段脚本将年龄大于三十岁的条目留下,并清除其余部分。
#### 聚合运算
最后,在执行诸如求和、平均数之类的汇总统计时,`.agg()` 方法十分有用。它可以接收多个聚合函数作为输入参数,从而一次性返回多维度的结果集。
```python
aggregated_stats = df[['Value1', 'Value2']].agg(['sum', 'mean', 'max', 'min'])
print(aggregated_stats)
```
这里演示的是针对两列分别应用四种不同类型的统计数据收集方式[^4]。
阅读全文
相关推荐


















