dataframe的info
时间: 2025-05-01 15:18:32 浏览: 19
### 关于 `pandas.DataFrame.info` 方法
#### 用法与功能描述
`pandas.DataFrame.info()` 是一个非常有用的工具,用于快速查看 DataFrame 的基本信息。该函数可以提供有关列的数量、每列的数据类型以及是否存在缺失值等重要细节[^1]。
此方法返回的内容包括但不限于:
- 数据框的名称(如果有)
- 各列的名字及其对应的非空值数量
- 列所使用的 dtype (data type),即数据类型
- 内存占用情况估计
对于大型数据集来说,这有助于理解数据结构并识别潜在的问题,比如异常高的缺失率或者不一致的数据类型。
#### 属性参数解释
`info` 函数接受几个可选参数来自定义输出:
| 参数名 | 描述 |
|------------|-------------------------------------------------------------|
| verbose | 如果设置为 True,则打印完整的统计信息;如果 False 只会显示摘要信息,默认是 True |
| buf | 输出目标缓冲区对象,默认情况下是在标准输出流上打印结果 |
| max_cols | 当超过这个数目时不会展示全部列的信息而是给出提示语句 |
| memory_usage | 控制是否计算近似或精确字节数表示内存消耗量,也可以设成 None 来禁用这部分报告 |
#### 实际应用案例
下面是一个简单的例子展示了如何调用 `info()` 并观察其效果:
```python
import pandas as pd
# 创建一个小规模的数据帧作为演示用途
df_example = pd.DataFrame({
'Column_A': ['apple', 'banana', 'cherry'],
'Column_B': [10, 20, 30],
})
print(df_example.info())
```
上述代码片段将会输出如下所示的结果(具体数值可能因环境不同而有所差异):
```
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 Column_A 3 non-null object
1 Column_B 3 non-null int64
dtypes: int64(1), object(1)
memory usage: 168.0+ bytes
```
通过这段输出可以看到,不仅有各字段类型的清晰呈现,还有关于整个表格大小的记忆体用量估算,这对于性能优化有着重要的指导意义.
阅读全文
相关推荐


















