正则表达式,简称regex,是文本模式的描述方法。你可以在google上搜索regex或者regexp获得非常多的学习资料。这篇短文介绍在python脚本中使用正则表达式的步骤:
1、导入re模块
Python中所有正则表达式的函数都在re模块中,可以在交互式环境或者脚本文件中输入以下代码。导入该模块:
import re
2、创建正则表达式对象
向re.compile()传入一个表示正则表达式的字符串值,它将返回一个Regex对象。例如要创建一个Regex对象来匹配电话号码模式,可以输入以下代码:
phoneNumRegex = re.compile(r’\d\d\d-\d\d\d-\d\d\d\d’)
此时phoneNumRegex就包含了一个Regex对象
3、匹配Regex对象
Regex对象中的search()方法查找传入的字符串,寻找该正则表达式的所有匹配。
phoneMatch = phoneNumRegex.search(’My number is415-555-4242’)
如果字符串中没有找到该正则表达式模式,则search()方法返回None。如果找到该模式则返回一个