Pandas是Python的核心数据分析库,提供了高效、灵活的DataFrame结构,专为处理结构化数据设计。它支持从CSV、Excel、SQL等源快速加载数据,并能实现数据清洗、转换、聚合及可视化等操作。Pandas与NumPy、Scikit-learn等库无缝集成,已成为金融、统计、机器学习等领域的数据处理标准工具。
import pandas as pd
# 创建DataFrame
data = {'列1': [1, 2, 3], '列2': ['A', 'B', 'C']}
df = pd.DataFrame(data)
# 读取CSV文件
df = pd.read_csv('data.csv')
# 数据筛选与统计
df_filtered = df[df['列1'] > 1]
mean_value = df['列1'].mean()
print(df_filtered)
print("均值:", mean_value)
2129

被折叠的 条评论
为什么被折叠?



