python作描述性统计分析
时间: 2024-01-17 08:19:08 浏览: 128
描述性统计分析是一种用于总结和解释数据集的方法,它提供了关于数据集的基本特征和趋势的信息。在Python中,可以使用多种库和函数来进行描述性统计分析。
一种常用的库是pandas,它提供了丰富的数据处理和分析功能。下面是使用pandas进行描述性统计分析的示例代码:
```python
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['Tom', 'Nick', 'John', 'Sam'],
'Age': [20, 25, 30, 35],
'Salary': [5000, 6000, 7000, 8000]}
df = pd.DataFrame(data)
# 查看数据集的基本信息
print(df.info())
# 查看数据集的统计摘要
print(df.describe())
# 计算数据集的相关系数
print(df.corr())
```
上述代码中,首先导入了pandas库,并创建了一个示例数据集。然后,使用`info()`函数可以查看数据集的基本信息,包括列名、数据类型和非空值数量等。接下来,使用`describe()`函数可以生成数据集的统计摘要,包括计数、均值、标准差、最小值、25%分位数、中位数、75%分位数和最大值等。最后,使用`corr()`函数可以计算数据集的相关系数。
除了pandas,还有其他一些库和函数可以用于描述性统计分析,例如numpy和scipy等。这些库提供了更多的统计函数和方法,可以根据具体需求选择使用。
阅读全文
相关推荐















