JavaScript 3.2 正则表达式1

一、正则表达式

1、简单模式

简单模式是由你想直接找到的字符构成。

如:/abc/,这个模式就仅能匹配到abc.

示例

var x = 'gabcdef';
var y = 'gab cdef';
var z = 'dcab';
 with(/abc/){
console.log(test(x));
console.log(test(y));
console.log(test(z));}
/*输出
true 
false
false
*/

简单模式只能顺序匹配,字符串中必须包含表达式,包含的内容与表达式一致,才能返回true

2、特殊字符  

字符说明
\

● 在非特殊字符之前的反斜杠表示下一个字符是特殊字符,不能按照字面理解。例如,前面没有 "\" 的 "b" 通常匹配小写字母 "b",即字符会被作为字面理解,无论它出现在哪里。但如果前面加了 "\",它将不再匹配任何字符,而是表示一个字符边界。

● 在特殊字符之前的反斜杠表示转义

^

匹配输入的开始。当存在多行标志m时,那么也匹配换行符后紧跟的位置

var x = 'gabcdef';
var y = 'gab cdef';
var z = 'ecab'+'\n'+
'dfdasf';
 with(/^d/m){
console.log(test(x));
console.log(test(y));
console.log(test(z));}
/*
上述输出:
false
false
true
当加了m多行标志后,会匹配换行符后紧跟的位置
但是字符串还有另外一种换行输入的方法如下
var z = 'ecab\
dfdasf';
上述的正则表达式是无法匹配的
*/
$

匹配输入的结束。如果存在多行标志m时,那么也匹配换行符前的位置。

var str = "abcdefg";
var str1 = "abcdefg ";
var str2 = "abcdefg" +"\n"+
"acdef";
var str3 = "abcdef" +"\n"+
"acdefg";
console.log(/g$/.test(str));
console.log(/g$/.test(str1));
console.log(/g$/m.test(str2));
console.log(/g$/m.test(str3));
/*
输出
true
false
true
true
str1中,空格也会被当成一个字符去匹配
str2和str3中,当添加了多行标志后,换行符前的第一个字符和换行符后面的字符串的最后一个字符都会匹配
*/
*

匹配前一个表达式 0 次或多次。等价于 {0,}

var str = "abccccbcbcd";
var str1 = "abbccccbcbcd";
var str2 = "abcdefbc";
var str3= "acdefg";
var str4 = "acdebeg";
var str5 = "abbccccbcbcd" +"\n"+
"bc";


console.log(/bc*/.exec(str)[0]);
console.log(/bc*/.exec(str1)[0]);
console.log(/bc*/.exec(str2)[0]);
console.log(/bc*/.exec(str3));
console.log(/bc*/.exec(str4)[0]);
console.log(/bc*/m.exec(str5)[0]);
/*
输出
bcccc
b
bc
null
b
b
从上面结果分析,
1、*限定符是匹配0个或者多个c,且b要和c相邻,不相邻则会匹配0个,如str4的值为b
2、多行标志m不能与之配合

*/
+

匹配前面一个表达式 1 次或者多次。等价于 {1,}

 

var str ="abbdcdfd";
var str1 = "abeeeeed";
var str2 = "abed";

console.log(/e+/.exec(str));
console.log(/e*/.exec(str)[0]);
console.log(/e+/.exec(str1)[0]);
console.log(/e+/.exec(str2)[0]);

/*
输出
null
""
eeeee
e

注意*和+的区别,*如果没有匹配到,返回的是空字符串,+如果没有匹配到,返回的是null
*/

如果紧跟在任何量词 *、 +、? 或 {} 的后面,将会使量词变为非贪婪(匹配尽量少的字符),和缺省使用的贪婪模式(匹配尽可能多的字符)正好相反。
还可以用作先行断言和后行断言

 

var str ="anglel";
var str1="engla"
console.log(/e?/.exec(str)[0]);
console.log(/el?/.exec(str)[0]);
console.log(/e?/.exec(str1)[0]);
console.log(/el??/.exec(str)[0]);
/*
输出
""
el
e
e

1、第一个输出是一个空的字符串,当?前面只有一个字符时,由于e的左边没有指定值且不是首位,
所以无法匹配,返回了空的字符串,并且如果你用replace方法去替换的话,
如var x = str.replace(/e?/,"d");最终的结果是danglel
2、由于?是贪婪的,所以会尽可能的多匹配,即输出el
3、字符串中e和a调了个位置,就能输出e了,和第一条对比一下
4、当问号用在量词后面时,将会时量词变为非贪婪,即更少匹配
*/
.

小数点默认匹配除换行符之外的任何单个字符。如果使用了s标志,也会匹配换行符

 

var str = " abcd你好/";
var str1 = "abc"+"\n"+"d";
console.log(/.\//.exec(str)[0]);//输出/好
console.log(/.a/.exec(str)[0]);//输出去空格+a,即 a
console.log(/.d/s.exec(str1)[0]);//输出换行符 + d
(x)

匹配并记住括号中的表达式的值,通过$1、$2……方式来使用记住的值,$&表示整个用于匹配的原字符串。

 

var str ="hello world";
//输出一个数字,0下标是完全匹配的值,后续的下标是依次保存括号中的值
console.log(/(he)(llo)/.exec(str));
//输出llohe world,$1代表的是第一个括号中的值,$2代表的是第二个括号中的值
console.log(str.replace(/(he)(llo)/,'$2$1'));
(?:x)

非捕获括号,匹配x的值,但是不记住

var str = "foofoo";
console.log(/(?:foo){1,2}/.exec(str));
console.log(/foo{1,2}/.exec(str));
/*
输出
foofoo
foo
(?:foo)非捕获组,捕获的值不会记住,后面跟着{1,2}针对的是整个foo进行匹配
而foo(1,2)针对的是第二o进行匹配
*/
x(?=y)

先行断言,匹配x,仅当后面跟着y时匹配

var str ="hello world";
console.log(/he(?=llo)/.exec(str));
console.log(/llo(?= w)/.exec(str));
/*
输出
he
110  空格也是可以匹配的

*/
(?<=y)x

后行断言,匹配x,仅当x前面是y时匹配

var str = "hello world";
console.log(/(?<=hello )world/.exec(str)[0]);
/*输出 world*/
x(?!y)正向否定查找,仅当x后面不是y时匹配x
var str  = "hello world ,javascript";
console.log(/java(?!sript)/.exec(str)[0]);
//输出java
(?<!y)x反向否定查找,仅当x前面不是y时匹配x
var str ="hello world javascript";
console.log(/(?<!d)java/.exec(str)[0]);
//输出java,当java前面不是d的时候匹配
x|y匹配x或者y
var str ="hello world";
console.log(/hello|world/.exec(str)[0]);
console.log(/hall|world/.exec(str)[0]);
//分别输出hello  ,world
{n}n 是一个正整数,匹配了前面一个字符刚好出现了 n 次
var str ="hello";
var str1 = "lworld";
console.log(/l{2}/.exec(str)[0]);
console.log(/l{2}/.exec(str1));

//匹配一个字符刚好出现的连续两次,l在world中也出现了两次,但是不是连续的,所以没有匹配上

 

{n,}

n是一个正整数,匹配前一个字符至少出现了n次。

var str ="hello world";
console.log(/l{3,}/.exec(str));
console.log(/l{2,}/.exec(str)[0]);
//分别输出null 和 ll,匹配的字符也必须连续出现
{n,m}n 和 m 都是整数。匹配前面的字符至少n次,最多m次。如果 n 或者 m 的值是0, 这个值被忽略。
var str ="hello world"
console.log(/l{1,2}/.exec(str));
console.log(/l{0,0}/.exec(str));
/*
输出
ll
空字符串
*/

 

[xyz]一个字符集合。匹配方括号中的任意字符,可以用“-”来表示范围,如[a-z]
var str ="abc";
console.log([...str.matchAll(/[abc]/g)][0]);
console.log([...str.matchAll(/[a-c]/g)][1]);
console.log([...str.matchAll(/[abc]/g)][2]);
/*
输出
a
b
c
*/

 

[^xyz]一个反向字符集。也就是说, 它匹配任何没有包含在方括号中的字符。
var str ="abcd";
console.log([...str.matchAll(/[^&]/g)][0]);//output:[a,b,c,d]
console.log([...str.matchAll(/[^ab]/g)][1]);//output:[c,d]
console.log([...str.matchAll(/[^a-c]/g)][2]);//output:[d]

 

[\b]匹配一个退格符
var str ="abcd\b";
console.log(str.replace(/[\b]/g,"e"));
//退格符会被替换成e,最后输出abcde

 

\b匹配一个词的边界
var str ="hello world";
console.log([...str.matchAll(/\bh/g)]);//输出h
console.log([...str.matchAll(/d\b/g)]);//输出d
console.log([...str.matchAll(/\bh.*d\b/g)]);//输出hello world
\B匹配一个非单词边界。使用条件:

1、字符串第一个字符为非“字”字符,除大小写字母数字,下划线,均是非字字符

2、字符串最后一个字符为非“字”字符

简而言之,紧随\B左右的只能是非字字符

var str = "_hello _world";
console.log([...str.matchAll(/_\B..../g)]);//output:_hell 和_worl
console.log([...str.matchAll(/_\B........./g)]);//output:_hello _wo
/*
几个点表示向后匹配多少个字符,\b同样适用

*/

var str1 = "hello world";
var str2 = "哈罗 world";
var str3 = "hello 世界";
console.log([...str1.matchAll(/\Bh.../g)]);//没有匹配上
console.log([...str2.matchAll(/\b哈.../g)]);//没有匹配上
console.log([...str2.matchAll(/\B哈.../g)]);//output:哈罗 w
console.log([...str3.matchAll(/...界\B/g)]);//output:o 世界



\cX当X是处于A到Z之间的字符的时候,匹配字符串中的一个控制符,关于控制符,可以参照ASCll码图
var str = "\n";
console.log([...str.matchAll(/\cJ/g)]);//匹配换行符
\d匹配一个数字等价于[0-9]
\D匹配一个非数字字符等价于[^0-9]
\f匹配一个换页符
\n匹配一个换行符
\r匹配一个回车符
\s匹配一个空白字符,包括空格、制表符、换页符和换行符。等价于[ \f\n\r\t\v\u00a0\u1680\u180e\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff]。
\S匹配一个非空白字符。等价于 [^ \f\n\r\t\v\u00a0\u1680\u180e\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff]
\t匹配一个水平制表符
\v匹配一个垂直制表符
\w匹配一个单字字符(字母、数字或者下划线)。等价于 [A-Za-z0-9_]
\W匹配一个非单字字符。等价于 [^A-Za-z0-9_]
\n在正则表达式中,它返回最后的第n个子捕获匹配的子字符串(捕获的数目以左括号计数)
var str = "apple,orange";
console.log([...str.matchAll(/appl(e),orang\1/g)]);
/*
output:Array(2)
0: "apple,orange"
1: "e"
*/
var str = "apple,orlange";
console.log([...str.matchAll(/app(l)(e),or\1ang\2/g)]);
/*
output: Array(3)
0: "apple,orlange"
1: "l"
2: "e"
从结果可以得出\n可以取()中捕获的值
*/
\0匹配 NULL(U+0000)字符
\xhh匹配一个两位十六进制数(\x00-\xFF)表示的字符。
\uhhhh匹配一个四位十六进制数表示的 UTF-16 代码单元。
\u{hhhh}(仅当设置了u标志时)匹配一个十六进制数表示的 Unicode 字符。
\u{hhhhh}(仅当设置了u标志时)匹配一个十六进制数表示的 Unicode 字符。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值