箱线图&上下四分位数

箱线图学习笔记

在这里插入图片描述
四分位数(Quartile)也称四分位点,是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。多应用于统计学中的箱线图绘制。它是一组数据排序后处于25%和75%位置上的值。四分位数是通过3个点将全部数据等分为4部分,其中每部分包含25%的数据。很显然,中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值(称为下四分位数)和处在75%位置上的数值(称为上四分位数)。与中位数的计算方法类似,根据未分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。与中位数不同的是,四分位数位置的确定方法有几种,每种方法得到的结果会有一定差异,但差异不会很大。

箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比 较。箱线图的绘制方法是:先找出一组数据的上边缘、下边缘、中位数和两个四分位数;然后, 连接两个四分位数画出箱体;再将上边缘和下边缘与箱体相连接,中位数在箱体中间。

参考自:百度百科

你可以使用Python的matplotlib库来创建这样的复合图表。首先,你需要安装`pandas`和`matplotlib`,如果还没有安装,可以使用下面的命令: ```bash pip install pandas matplotlib ``` 接下来,假设你有一个CSV文件名为`precipitation_data.csv`,其中包含"year"和"annual_precipitation"列,你可以按照以下步骤编写代码: ```python import pandas as pd import matplotlib.pyplot as plt # 读取数据 data = pd.read_csv('precipitation_data.csv') # 确保"year"是索引列 data.set_index('year', inplace=True) # 计算平均值、上四分位数(Q3)、下四分位数(Q1)以及中位数(Median) stats = data['annual_precipitation'].describe([0.25, 0.5, 0.75]) # 折线图:平均值 mean_line = stats['mean'] plt.plot(data.index, mean_line, label='Average precipitation', marker='o', linestyle='-') # 箱线图:Q1、Q3、Median q1 = stats['25%'] q3 = stats['75%'] iqr = q3 - q1 whiskers = [q1 - 1.5 * iqr, q3 + 1.5 * iqr] boxes = [q1, q3] plt.boxplot(data['annual_precipitation'], positions=data.index, widths=0.8, labels=['Yearly Precipitation'], showmeans=True, showfliers=False) # 添加标题和标签 plt.title('Annual Precipitation from 1979 to 2023') plt.xlabel('Year') plt.ylabel('Precipitation (inches)') plt.legend() # 显示图形 plt.show() ``` 在这个代码中,我们首先导入必要的库,然后加载数据并设置年份作为索引。接着计算统计信息,并分别绘制折线图和箱线图。最后,我们添加标题、标签和图例,显示最终的复合图表。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值