df= pd.read_csv('pollution_us_5city_2007_NO2_descending.csv') # 离散化 queens_df= df[df['Column1'] == 'Queens'] queens_df['NO2 AQI']=pd.cut(queens_df['Column8'],bins=[0,25,50,75,100,125,150],labels=['Good','Moderate','SubUnhealthy','Unhealthy','VeryUnhealthy','Hazardous']) # 统计结果并画图 bar_plot=queens_df['NO2 AQI'].value_counts().plot(kind='bar') bar_plot.figure.savefig('NO2_AQI_bar.png',dpi=300) pie_plot=queens_df['NO2 AQI'].value_counts().plot(kind='pie') pie_plot.figure.savefig('NO2_AQI_pie.png',dpi=300)根据该代码做出的饼状图与柱状图重合,如何解决,需要正确的代码
时间: 2023-08-05 21:04:10 浏览: 185
该代码中缺少了一行代码,即需要在绘制饼状图之前先对数据进行排序。可以使用以下代码进行修改:
```
df= pd.read_csv('pollution_us_5city_2007_NO2_descending.csv')
# 离散化
queens_df= df[df['Column1'] == 'Queens']
queens_df['NO2 AQI']=pd.cut(queens_df['Column8'],bins=[0,25,50,75,100,125,150],labels=['Good','Moderate','SubUnhealthy','Unhealthy','VeryUnhealthy','Hazardous'])
# 统计结果并画图
queens_df = queens_df.sort_values('NO2 AQI') # 添加排序代码
bar_plot=queens_df['NO2 AQI'].value_counts().plot(kind='bar')
bar_plot.figure.savefig('NO2_AQI_bar.png',dpi=300)
pie_plot=queens_df['NO2 AQI'].value_counts().plot(kind='pie')
pie_plot.figure.savefig('NO2_AQI_pie.png',dpi=300)
```
这样就可以在绘制饼状图之前先对数据进行排序,从而确保饼状图和柱状图不会重合。
相关问题
# 读取文件 df= pd.read_csv('pollution_us_5city_2007_NO2_descending.csv') # 离散化 queens_df= df[df['Column1'] == 'Queens'] queens_df['NO2 AQI']=pd.cut(queens_df['NO2 AQI'],bins=[0,25,50,75,100,125,150],labels=['Good','Moderate','SubUnhealthy','Unhealthy','VeryUnhealthy','Hazardous'])显示keyerror为NO2 AQI,如何解决,正确的代码应该是什么样的
根据您提供的代码,可能是读入的 CSV 文件中没有名为 "NO2 AQI" 的列,导致 KeyError。您可以使用 `df.head()` 查看一下读入的数据中有哪些列。
如果您确定数据中存在名为 "NO2 AQI" 的列,可能是列名中含有空格或其他不可见字符,可以试着将列名改为 "NO2_AQI" 或 "NO2AQI" 等无空格的形式。
修改后的代码应该类似于:
```python
import pandas as pd
# 读取文件
df = pd.read_csv('pollution_us_5city_2007_NO2_descending.csv')
# 离散化
queens_df = df[df['Column1'] == 'Queens']
queens_df['NO2_AQI'] = pd.cut(queens_df['NO2 AQI'], bins=[0,25,50,75,100,125,150], labels=['Good','Moderate','SubUnhealthy','Unhealthy','VeryUnhealthy','Hazardous'])
```
def task3(): # 读取文件 df=pd.read_csv('pollution_us_5city_2007_NO2.txt',sep=' ',header=None) # 统计总行数和总列数 print(f'Total rows:{len(df)}') print(f'Total columns:{len(df.columns)}') # 按照CountyCode降序排序 df_sorted = df.sort_values(by=['County Code'], ascending=False) # 导出为CSV文件 df_sorted.to_csv('pollution_us_5city_2007_NO2_descending.csv', index=False) print("任务三执行成功!")这段代码执行后显示keyerror=county code的原因,该文本文件只有单行单列,如何解决?
根据您提供的信息,可以猜测该文本文件中的列名可能并不是 "County Code",导致程序无法识别该列名而报错。您可以尝试在读取文件时指定列名,例如:
```
# 读取文件并指定列名
df = pd.read_csv('pollution_us_5city_2007_NO2.txt', sep=' ', header=None, names=['Column 1', 'Column 2', 'County Code', 'Column 4', 'Column 5', 'Column 6', 'Column 7', 'Column 8'])
# 统计总行数和总列数
print(f'Total rows:{len(df)}')
print(f'Total columns:{len(df.columns)}')
# 按照CountyCode降序排序
df_sorted = df.sort_values(by=['County Code'], ascending=False)
# 导出为CSV文件
df_sorted.to_csv('pollution_us_5city_2007_NO2_descending.csv', index=False)
print("任务三执行成功!")
```
其中,`names` 参数指定了每一列的名称。如果您不确定列名,可以先查看一下该文件的内容,或者尝试逐个列名进行测试。
阅读全文
相关推荐

















