1.应用:判断一个字符串是否符合规则,取出符合规则的数据
2. import re 正则表达式模块
最前面加不加 r' ':加上r 表示字符串为非转义的原始字符串,让编译器忽略反斜杠,也就是忽略转义字符。由于正则表达式通常都包含反斜杠,所以最好使用原始字符串来表示它们。(如 r'\t',等价于 '\\t')匹配相应的特殊字符
re.search() 匹配一次(但后面有组的概念)
re.findall() 可以匹配多次,找出所有满足的
具体用法和re模块的其他一些函数写在下面第8点.
3.匹配字符
e.g. re.findall('\W',data) 但匹配出的都是单个字符
4.量词符号与组
5. 一些例子
" | " 或的关系,只要存在就能捕获,匹配到的数据按字符串的数据返回而不是按照匹配规则返回
解决了只匹配单个字符的问题 \w* 匹配0次或多次字母数字下划线
\w+ @和.属于出现0次范围 不会匹配出来
[a-zA-Z0-9]等同于\w (只差一个下划线)
6.组的概念
想要字符串中的某一部分元素 可以用组
7.贪婪与非贪婪
8.正则表达式re模块,函数
findall(),search(),group(num),groups(),split(),compile(),match()
match() 只会匹配从头开始的信息,匹配成功返回对象,匹配失败返回none
compile():
9.re的额外匹配要求
参考 菜鸟教程 https://www.runoob.com/python/python-reg-expressions.html 很全面