正则表达式是用于描述符合某些复杂规则的字符串的工具,也就是用来匹配字符串的。
一、匹配数字范围
通过拆解数字,分段匹配。
示例:
//范围[20 20000]
//拆为20-29 30-99 100-9999 10000-19999 20000
"(2[0-9])|([3-9][0-9])|([1-9][0-9]{2,3})|(1[0-9]{4})|20000"
//范围[0.404 28.5]
//拆为0.404-1.000 1-28.000 28-28.500
"0|(0\\.[4-9][0-9][4-9])|(0\\.40[4-9])|(0\\.[4-9][1-9][0-9])|([1-9]|1[0-9]|2[0-7])|(([1-9]|1[0-9]|2[0-7])\\.[0-9]{0,3})|(28\\.[0-4][0-9]{0,2})|(28\\.5)"
//范围[-12.0 12.0]
//拆为0-9 10-11 12
"^-*((([0-9]|1[0-1])(\\.[0-9])?)|12$)"
基础知识
1、’^’ 和 ‘$’ ——匹配字符串的开始和结束
’^’ 和 ‘$’ 他们是分别用来匹配字符串的开始和结束。
例子:
"^The": 匹配以 "The"开头的字符串;
"of despair$": 匹配以 "of despair" 结尾的字符串;
"^abc$": 匹配以abc开头和以abc结尾的字符串,实际上是只有abc与之匹配;
"notice": 匹配包含notice的字符串;
你可以看见如果你没有用我们提到的两个字符(最后一个例子),就是说 模式(正则表达式) 可以出现在被检验字符串的任何地方,你没有把他锁定到两边。
2、 *, +,和 ?——一个字符可以出现的次数或者顺序
字符 ‘*’, ‘+’,和 ‘?’, 他们用来表示一个字符可以出现的次数或者顺序.。
他们分别表示:“zero or more”(0个或更多), “one or more”(1个或更多), and “zero or one”(0个或1个)
"ab*": 匹配字符串a和0个或者更多b组成的字符串("a", "ab", "abbb", etc.);
"ab+": 和上面一样,但最少有一个b ("ab", "abbb", etc.);
"ab?":匹配0个或者一个b;
"a?b+$": 匹配以一个或者0个a再加上一个以上的b结尾的字符串.
3、{}——限定字符出现的次数
在大括号里面限制字符出现的个数
"ab{2}": 匹配一个a后面跟两个b(一个也不能少)("abb");
"ab{2,}": 最少更两个b("abb", "abbbb", etc.);
"ab{3,5}": 3-5个b("abbb", "abbbb", or "abbbbb").
4、()——多个字符的集合
现在把一定数量的字符放到小括号里,比如:
"a(bc)*": 匹配 a 后面跟0个或者一个"bc";
"a(bc){1,5}": 一个到5个 "bc."
5、│——或操作
字符 ‘│’, 相当于OR 操作:
"hi│hello": 匹配含有"hi" 或者 "hello" 的 字符串;
"(b│cd)ef": 匹配含有 "bef" 或者 "cdef"的字符串;
"(a│b)*c": 匹配含有这样 - 多个(包括0个)a或b,后面跟一个c的字符串 的字符串;
“[ab]”: 匹配单个的 a 或者 b ( 和 “a│b” 一样);
6、一个点(’.’)——代替一个单字符
一个点(’.’)可以代表1个 未知字符:
"a.[0-9]": 一个a跟一个字符再跟一个数字的 (含有这样一个字符串的字符串将被匹配,以后省略此括号)
"^.{3}$": 以三个字符结尾.中括号括住的内容只匹配一个 单一的字符
7、[ - ]——匹配一个范围的字符
"[a-d]": 匹配'a' 到'd'的单个字符 (和"a│b│c│d" 还有 "[abcd]"效果一样);
"^[a-zA-Z]": 匹配以字母开头的字符串
"[0-9]%": 匹配含有 形如 x% 的字符串
",[a-zA-Z0-9]$": 匹配以逗号在加一个数字或字母结尾的字符串
8、[^ ]——排除不想要的字符
你也可以把你不想要得字符列在中括号里,你只需要在总括号里面使用’^’ 作为开头
"%[^a-zA-Z]%" 匹配含有 两个百分号里面有一个非字母 的字符串
9、\——转义字符
如小数点,前面已经有了意义了。需要加“\”