前阵子面试遇到正则表达式,是自己平时比较疏忽的一个点,因此复习了一番做下笔记。
面试题
- 使用正则表达式检查某段字符串是否为 URL。U RL 的认定标准:以「协议://」开头,例如「http://」、「https://」、「ftp://」、「file://」等,但无需校验是否为有效协议
解答:
([a-z]+):\/\/
字符匹配
1 \d 表示0-9的一位数字
2 \D 除数字以外的任意字符
3 \w 表示数字,大小写字母以及下划线
4 \W 非单词字符
5 \s 表示空白符 \f \v \n \r
6 \S 表示空白符 \f \v \n \r
7 [abc] a b or c
8 [ ^abc] not a b c
9 [a-g] a-g之间
位置匹配
1 \b \w和\W之间的位置 ??
2 \B 去掉\b ??
3 ^abc$ 字符串开始,结束的位置 ??
组
1 (abc) 捕获组
2 \n 引用第n组捕获匹配的内容
3 (?:abc) 非捕获组
先行断言
- 匹配pattern表达式的前面内容,不返回本身。
a(?=b) a只有在b前才断言
a(?!b) a只有不在b前面才断言
后行断言
- 匹配pattern表达式的后面的内容,不返回本身。
(?<=b)a a只有在b后面才匹配
(?<!b)a a只有不在b后面才匹配
量词与分支
a* 0或多次
a+ 1 或多次
a? 0或1
a{5} 5
a{2,}2 到多次
a{1,3} 1到3次
a+? 惰性匹配
分支
ab|cd ab或者cd
特殊字符
转义前需要加斜杠
1 $ 匹配输入字符串结尾部分
2 ( )标记的一个表达式开始和结尾位置
3 * 匹配前面的子表达式零次或多次。要匹配 * 字符,请使用 *。
4 + 匹配一次或者多次
5 .匹配换行符以外的字符
6 [ 标记一个中括号表达式的开始
7 ?前面的字表达式零次或者一次
8 \ 转义符
9 ^ 匹配输入字符串的开始位置
10 { 标记限定符表达式的开始
11 | 或
限定符
限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。有 ***** 或 + 或 ? 或 {n} 或 {n,} 或 {n,m} 共6种。