Pandas是一个功能强大的数据分析库,提供了丰富的工具和函数,用于处理和分析结构化数据。其中,聚合操作是数据分析中的重要环节,它允许我们对数据进行分组并计算各组的统计摘要。本文将介绍Pandas中常用的聚合操作,并通过案例演示其用法。
在开始之前,我们首先需要导入Pandas库,并准备一份示例数据。以下是一个简单的学生考试成绩表,包含学生姓名、科目和对应的成绩:
import pandas as pd
data = {
'姓名': ['张三', '李四', '王五', '赵六', '钱七', '孙八', '周九', '吴十'],
'科目': ['数学', '数学', '语文', '语文', '英语', '英语', '数学', '语文'],
'成绩': [80, 90, 85, 95, 70, 75, 88, 92]
}
df = pd.DataFrame(data)
上述代码创建了一个名为df
的DataFrame对象,其中包含了学生的考试成绩数据。
现在,让我们来探索一些常用的聚合操作。
- 计算平均值(mean