一、数据处理目标
有一个excel类型或者说dataframe类型的二维表格,需要将其中一列的数据分割出来多个,然后对分割出来的数据进行统计分析。比如,有一个电影类型的数据如下:
希望最后统计出各个类型的电影的数量和占比。比如,科幻类型的电影有几部,冒险类型的电影有几部,分别占总电影数量的百分之几等等。
二、代码实现
1、先将数据转为dataframe格式的数据。如果你的数据是excel格式的,则读取出来,我这里为了演示,数据只直接写死的。
有一个excel类型或者说dataframe类型的二维表格,需要将其中一列的数据分割出来多个,然后对分割出来的数据进行统计分析。比如,有一个电影类型的数据如下:
希望最后统计出各个类型的电影的数量和占比。比如,科幻类型的电影有几部,冒险类型的电影有几部,分别占总电影数量的百分之几等等。
1、先将数据转为dataframe格式的数据。如果你的数据是excel格式的,则读取出来,我这里为了演示,数据只直接写死的。