DataFrame?
时间: 2025-01-28 13:09:31 浏览: 45
### Python Pandas DataFrame概述
Pandas 是一种强大的数据分析工具库,在Python编程环境中广泛应用于处理结构化数据。`DataFrame`作为Pandas的核心数据结构之一,可以被视作是一个表格型的数据容器,类似于电子表格或SQL表单,能够存储不同类型的列向量(即每列为同质化的数值),并且支持标签索引。
#### 创建DataFrame实例
为了创建一个简单的`DataFrame`对象,通常会先引入必要的库:
```python
from pandas import DataFrame
import pandas as pd
import numpy as np
```
接着可以通过多种方式来构建这个二维表状的数据集;例如通过传递NumPy数组并指定列名的方式生成随机数构成的`DataFrame`[^1]:
```python
df = DataFrame(np.random.randn(4, 5), columns=['A', 'B', 'C', 'D', 'E'])
print(df)
```
上述代码片段展示了如何利用NumPy自动生成一组浮点数填充到新的`DataFrame`中,并为其定义了五列表头'A'至'E'。
#### 获取DataFrame的内容
当拥有了一个具体的`DataFrame`之后,有时需要将其转换成更基础的形式以便进一步操作或是与其他程序交互。此时可借助`.values`属性获取该框架所含有的纯数值矩阵表示[^2]:
```python
# 打印原始DataFrame
print("Original DataFrame:")
print(df)
# 转换成Numpy array显示
print("\nAs Numpy Array:")
print(df.values)
```
这段脚本先是打印出了完整的`DataFrame`内容,随后又呈现了其对应的多维数组形态。
#### 数据分析功能展示
除了基本的操作外,`DataFrame`还提供了丰富的内置函数用于执行各种统计计算任务。比如想要找到某几列中的最小值,则可以直接调用`.min()`方法[^3]:
```python
minimum_values = df[['A','B']].min()
print(minimum_values)
```
此命令将会分别找出列'A'和'B'里的最低记录,并以序列形式返回结果。
对于重复项较多的数据集合来说,清理工作也是必不可少的一部分。为此,`drop_duplicates()`提供了一种便捷途径去除冗余条目[^4]:
```python
unique_df = df.drop_duplicates(subset=['A'], keep='first')
print(unique_df)
```
这里指定了仅考虑'A'这一维度上的唯一性约束条件,并保留首次出现的位置不变。
阅读全文
相关推荐


















