项目场景:
做基站退服报表真是个复杂的事情,365天*100年,天天如此,移动通信中3G\4G\5G各个厂家还不同,集中监控系统报表又不能满足实际工作需求,为了提高工作效率(主要是为了提升幸福指数),省去每天两小时的各种EXCEL操作(容易出错),硬着头皮,用自己三脚猫功夫,亲自动手......
问题描述
一来就遇到了困难。python通过pandas对基站退服报表中汉字字段【分公司】进行排序时,发现和习惯的排序方式不符,如下图所示:
import pandas as pd
data3G=pd.read_excel('data3G.xlsx')
data3G.sort_values(by=["分公司"],ascending=True,inplace=True)
data3G
原因分析:
pandas的sort_values可对英文和数字进行排序,但对汉字排序时不能按照我们的习惯(拼音顺序)正确排序。