Lua剔除string字符串中的某些字符、符号或者UTF-8中文符号的解决办法及注意事项

本文介绍了如何使用Lua剔除字符串中的特定英文字符和UTF-8中文符号,包括使用通配符和正则表达式进行替换。在英文字符替换部分,提到了各种字符类和通配符的用法。在剔除UTF-8中文符号时,给出了相应的代码示例,并强调了确保符号为UTF-8编码的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

**

一、英文字符替换

--替换掉字符里的所有空格
local text = string.gsub(textvalue, "%s+", "")
--替换掉英文标点符号
local text = string.gsub(textvalue,"%p+","")
--自定义字符或标点 用'[]'括起来,加上'%' ,后面加上要剔除的字符 eg:剔除字符串中的a和b
local text = string.gsub(textvalue, "[%a%b]", "")

重要提示:
一些字符意义如下
%s 空白符
%p 标点
%c 控制字符
%d 数字
%x 十六进制数
%z 代表0的字符
%a 字母
%l 小写字母
%u 大写字母
%w 字母数字
. 任意字符
字符类的大写形式代表相应集合的补集, 比如 %A 表示除了字母以外的字符集
另外,* + - 三个,作为通配符分别表示:
*: 匹配前面指定的 0 或多个同类字符, 尽可能匹配更长的符合条件的字串
+: 匹配前面指定的 1 或多个同类字符, 尽可能匹配更长的符合条件的字串
-: 匹配前面指定的 0 或多个同类字符, 尽可能匹配更短的符合条件的字串
**

二、剔除UTF-8类型的中文符号 。 、【】、《》等等

在Lua中添加如下工具代码:

local pattern = '[%z\1-\127\194-\244][\128-\191]*'

-- helper function
local posrelat =
	function (pos, len)
		if pos 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值