re.sub不能替换所有的非打印字符，ascii为28的并不能被替换掉

这段代码是我用来处理excel数据里面的非打印字符的，我的表格中会出现一个ascii码为28的文件分隔符，并且不会被替换掉，非常奇怪，不知道是否有人遇见过类似的情况。你们是如何解决的。

    # 正则表达式模式，用于匹配非打印字符（ASCII 控制字符）
        pattern = r'[\x00-\x1F\x7F]'

        # 遍历所有工作表
        for ws in all_worksheets:
            # 遍历当前工作表的所有单元格并清洁数据
            for row in ws.iter_rows():
                for cell in row:
                    if cell.value:
                        # 将单元格值转换为字符串
                        cleaned_value = re.sub(pattern, '*', str(cell.value))
                        cell.value = cleaned_value

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-07-26 18:53
关注
不知道你这个问题是否已经解决, 如果还没有解决的话:
你可以看下这个问题的回答https://ask.csdn.net/questions/7531148
以下回答由chatgpt基于相关博客总结生成:
问题的解决方案如下：

# 正则表达式模式，用于匹配非打印字符（ASCII 控制字符），包括ASCII为28的字符 pattern = r'[\x00-\x1F\x7F\x1C]' # 遍历所有工作表 for ws in all_worksheets: # 遍历当前工作表的所有单元格并清洁数据 for row in ws.iter_rows(): for cell in row: if cell.value: # 将单元格值转换为字符串 cleaned_value = re.sub(pattern, '*', str(cell.value)) cell.value = cleaned_value

上述代码在正则表达式的模式中新增了\x1C，该字符对应ASCII为28的文件分隔符。添加了该字符后，使用re.sub函数就可以将所有的非打印字符，包括ASCII为28的字符都替换为星号（*）。这样，在遍历所有工作表的过程中，对每个单元格的值进行替换操作，最终达到替换所有非打印字符的目的。

但需要注意，上述代码只能处理具有文字内容的单元格。如果单元格的值是日期、数值等其他类型，则可能需要根据具体情况进行适当的转换和处理。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

计算机软件-商业源码-19 替换字符串中的内容.zip
2022-05-21 15:52

在计算机编程领域，替换字符串中的内容是一项常见的任务，它涉及到字符串操作、正则表达式以及文本处理等基础知识。本资源“计算机软件-商业源码-19 替换字符串中的内容.zip”似乎提供了一个用于执行此类操作的源码...
[编程基础] Python字符串替换笔记
2021-08-16 21:59

落痕的寒假的博客 Python字符串替换笔记主要展示了如何在Python中替换字符串。Python中有以下几种替换字符串的方法，本文主要介绍前三种。 replace方法（常用） translate方法 re.sub方法字符串切片（根据Python字符串切片方法替换...
python清除字符串里非字母字符的方法
2020-09-21 22:20

另外，Python的`re`模块提供了强大的正则表达式功能，我们可以使用`re.sub()`函数来匹配并替换非字母字符。`[^A-Za-z]`表示匹配任何不是大写或小写字母的字符，然后替换为空字符串： ```python import re s = ...
Python_ASCII.zip_ascii python
2022-09-24 17:07

Python编程语言在处理文本数据时的强大之处在于其丰富的库支持和简洁的语法。在这个名为"Python_ASCII.zip_ascii python"的项目中，我们看到一个利用Python编写的应用程序，它专门用于处理ASCII（美国标准代码信息...
正则表达式@Python（Regular Expression、Re、Regex、正则、查找、替换、通配符、模式、DOTALL、Multiline、M、re.DOTALL、re.M）
2024-03-30 15:38

Le0v1n的博客关键词：Regular Expression、Re、Regex、正则、查找、替换、通配符、模式、DOTALL、Multiline、M、re.DOTALL、re.M
python字符串替换源码_Python实现字符串中某个字母的替代功能
2020-12-11 12:38

weixin_39918128的博客 Python实现字符串中某个字母的替代功能今晚想实现这样一个功能：将输入字符串中的字母 “i” 变成字母 “p”。当时想的很简单，直接用for循环遍历，然后替代，出问题的代码如下：name = input('随便输入一堆字符吧.....
南开大学2021年9月《Python编程基础》作业考核试题及答案参考15.docx
2024-12-06 10:02

8. 正则表达式：用于字符串匹配，如re.sub用于替换字符串中的部分。 9. 搜索推广结果展示规则：通常优先展示相关性强和竞争力强的推广结果。 10. 面向对象编程：可以通过继承创建新类，也可以动态地为类添加属性和...
南开大学2021年9月《Python编程基础》作业考核试题及答案参考15.pdf
2024-12-06 10:02

例如，re.sub()函数用于替换字符串中的某些内容，而re.match()函数则用于匹配字符串的起始部分。电子邮件在Internet上的传输格式通常是ASCII文本，它是最广泛使用的字符编码标准。 PPPoE（Point-to-Point ...
《Python程序设计》第4章+字符串、元组和字典.ppt
2024-10-09 18:42

count()方法用于统计子字符串在字符串中出现的次数，split()方法用于按照指定的分隔符分割字符串，join()方法用于连接序列中的元素成一个新的字符串，replace()方法用于替换字符串中的某些内容，strip()方法用于去除...
Python基础入门教程由浅入深讲解清晰第4章字符串与正则表达式（共55页）.ppt
2021-09-25 13:02

- `sub(pattern, repl, string)`：将字符串中所有匹配项替换为新的字符串。 ### 字符串与正则表达式的结合在处理字符串时，正则表达式可以用来验证用户输入、提取有用信息、清洗数据等。例如，通过正则表达式可以...
python关于字符串replace 方法如果替换成功返回_学习 python 连接字符串，替换，截取，引用，拷贝,is，def返回值，异常...
2020-12-06 12:12

weixin_39860260的博客先进方法1：用字符串的join方法：a = ['a','b','c','d']content = ''content = 'K'.join(a)print contentcontent的结果:'akbkckd'先进方法2：用字符串的替换占位符替换a = ['a','b','c','d']content = ''content = '...
re/regex：正则表达式（持续更新ing...）
2022-06-21 10:57

诸神缄默不语的博客本文介绍Python3中的正则表达式操作包：re/regex
python课件-第4章字符串与正则表达式.ppt
2021-11-25 21:01

字符串在Python中属于不可变序列类型，这意味着一旦创建，其内容不能更改。字符串支持序列操作，如索引、切片以及一系列特有的字符串操作方法。此外，Python有一个字符串驻留机制，对于短字符串，多个对象可能引用同...
ErrInvalidCharacter(解决方案).md
2024-11-28 08:54

在上述示例代码中，我们使用re模块来执行正则表达式操作，并通过sub函数替换掉所有不在标准ASCII可打印字符范围内的字符（即从\x20到\x7E的字符）。之后，尝试使用json模块的loads函数来解析这个已清理过的字符串。...
UnicodeEncodeError.md
2024-12-03 10:19

如果原始字符串是用UTF-8编码的，但是目标编码格式是ASCII，那么所有非ASCII字符都不能被直接编码。这时候，可以先将字符串编码为一种可以容纳更多字符的编码格式，如ISO-8859-1，再解码为原格式，最后再编码为目标...
Python语言的字符串处理
2025-02-27 12:38

冯瑶琛的博客在Python中，可以直接用单引号（）、双引号（）或三引号（'''或"""）来定义字符串。三引号字符串支持多行文本。python在这篇文章中，我们...Python作为一种灵活的编程语言，为开发者提供了丰富的字符串处理工具和方法。
python正则表达式re模块
2025-05-07 20:51

王小玗的博客 Python的re模块提供了强大的正则表达式功能，是文本处理的...高效处理文本：快速完成复杂的文本匹配和替换数据验证：验证用户输入的格式数据提取：从非结构化文本中提取结构化信息文本清洗：预处理文本数据用于分析。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 12月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月26日

re.sub不能替换所有的非打印字符，ascii为28的并不能被替换掉

3条回答 默认 最新

问题事件

3条回答默认最新