python保留字符串中数字,去除字母,再转化为Int类型操作

现在我们有一个这样的分类列表:

categories = ['Layer1', 'Layer2', 'Layer3', 'Layer4', 'Layer5', 'Layer6', 'WM']

我们想保留其中的分类的数字,去除字母,该怎么做呢?

首先第一步

import pandas as pd
import re

# 原始分类数据
categories = ['Layer1', 'Layer2', 'Layer3', 'Layer4', 'Layer5', 'Layer6', 'WM']

# 保留数字,去掉字母
cleaned_categories = [re.sub(r'\D', '', cat) for cat in categories]

print(cleaned_categories)  # 输出 ['1', '2', '3', '4', '5', '6', '']

这样就转化为字符型的数字啦,方法说明一下:

  • re.sub(r'\D', '', cat)

    • \D 匹配所有非数字字符。
    • 将非数字字符替换为空字符串(''),只保留数字部分。
  • 如果某些值完全没有数字(如 'WM'),处理后会变为空字符串('')。

但是我们也注意到,如果全是字母的话会出现转化后列表中有空字符的出现,那我们进行第二步,再加个条件语句,并且空值设置为7:

cleaned_categories = [
    re.sub(r'\D', '', cat) if re.sub(r'\D', '', cat) else '7' for cat in categories
]

输出结果:

['1', '2', '3', '4', '5', '6', '7']

然后我们进行最后一步,将其转化为int类型的:

cleaned_categories = [
    int(re.sub(r'\D', '', cat)) if re.sub(r'\D', '', cat) else 7 for cat in categories
]

注意看黄色部分代码,其实改动很小~

输出结果:

 [1, 2, 3, 4, 5, 6, 7]

是不是很简单~

完整代码如下

import pandas as pd
import re

# 原始分类数据
categories = ['Layer1', 'Layer2', 'Layer3', 'Layer4', 'Layer5', 'Layer6', 'WM']

# 保留数字,去掉字母,没有数字的值替换为 7,并转为整数
cleaned_categories = [
    int(re.sub(r'\D', '', cat)) if re.sub(r'\D', '', cat) else 7 for cat in categories
]

print(cleaned_categories)  # 输出 [1, 2, 3, 4, 5, 6, 7]

欢迎各位一起交流学习~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

梦云澜

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值