由于日常容易弄混Python,R和SQL的类似操作,加上Python有太多实现类似目的的函数,这篇文章就当是备忘汇总,会把Python pandas numpy sklearn等包的最简易常用操作记录下来
Python pandas numpy常用tips汇总
Dataframe相关
1. dataframe单独修改某一列/部分列的列名
# 不会改变原 df
df.rename(columns={'old_name1':'new_name1', 'old_name2':'new_name2'})
# 会改变原 df
df.rename(columns={'old_name1':'new_name1', 'old_name2':'new_name2'}, inplace=True)
2. dataframe删除某一列/部分列
# 不会改变原 df
df.drop([df.columns[[0,1]]], axis=1)
# 会改变原 df
df.drop([df.columns[[0,1]]], axis=1,inplace=True)
String字符串相关
1. 去掉数字/金额中的逗号
其实对于纯数字/货币来说可以直接用 string.replace(’,’, ‘’)去掉逗号,但如果金额是出现在一整句话中的话,就需要额外使用 re 库来定位,从而避免删除其他我们需要的逗号:
import re
s = 'Today is Sunday, I bought $ 100,000 and used $ 4,500 to get a car.'
pattern = re.compile(r'\d,\d')
tmp = re.findall(pattern, s)
for i in tmp:
s = s.replace(i,i.replace(',',''))