**
一、英文字符替换
--替换掉字符里的所有空格
local text = string.gsub(textvalue, "%s+", "")
--替换掉英文标点符号
local text = string.gsub(textvalue,"%p+","")
--自定义字符或标点 用'[]'括起来,加上'%' ,后面加上要剔除的字符 eg:剔除字符串中的a和b
local text = string.gsub(textvalue, "[%a%b]", "")
重要提示:
一些字符意义如下
%s 空白符
%p 标点
%c 控制字符
%d 数字
%x 十六进制数
%z 代表0的字符
%a 字母
%l 小写字母
%u 大写字母
%w 字母数字
. 任意字符
字符类的大写形式代表相应集合的补集, 比如 %A 表示除了字母以外的字符集
另外,* + - 三个,作为通配符分别表示:
*: 匹配前面指定的 0 或多个同类字符, 尽可能匹配更长的符合条件的字串
+: 匹配前面指定的 1 或多个同类字符, 尽可能匹配更长的符合条件的字串
-: 匹配前面指定的 0 或多个同类字符, 尽可能匹配更短的符合条件的字串
**
二、剔除UTF-8类型的中文符号 。 、【】、《》等等
在Lua中添加如下工具代码:
local pattern = '[%z\1-\127\194-\244][\128-\191]*'
-- helper function
local posrelat =
function (pos, len)
if pos