目录
一、正则表达式
1、正则表达式定义
正则表达式又称正规表达式、常规表达式。在代码中常简写为 regex、regexp 或 RE。正则表达式是使用单个字符串来描述、匹配一系列符合某个句法规则的字符串,简单来说, 是一种匹配字符串的方法,通过一些特殊符号,实现快速查找、删除、替换某个特定字符串。
正则表达式是:由普通字符与元字符组成的文字模式
普通字符包括大小写字母、数字、标点符号及一些其他符号,元字符则是指那些在正则表达式中具有特殊意义的专用字符
正则表达式一般用于脚本编程与文本编辑器中
2、正则表达式的层次分类
基础正则表达式:BRE 支持的工具:grep、egrep、sed、awk
扩展正则表达式:ERE 支持的工具:egrep、awk
Linux三剑客(grep、sed、awk)支持的正则表达式
支持正则的shell命令 | 正则类型 |
---|---|
grep | 默认使用基本正则表达式(BRE)(要使用扩展正则需要加转义字符) |
egrep 或grep -E | 使用扩展的正则表达式(ERE) |
sed | 默认使用基本正则表达式(BRE) |
awk | 使用扩展正则表达式(ERE) |
二、grep和元字符
1、grep
grep [选项] [查找条件(正则)] [目标文件]
常用选项 | 功能 |
---|---|
-n | 列出所匹配的文本行,并显示行号 |
-i | 匹配时忽略字符大小写 |
-v | 反向匹配,匹配的字符串与搜索的不相符 |
-w | 精确匹配。匹配整个单词、 一个字符 |
-o | 只显示匹配的部分 |
-c | 显示匹配内容的行数 |
-E | 开启扩展的正则表达式 |
--color=auto | 可以将找到的关键词部分加上颜色的显示! |
2、元字符
^ | 匹配输入字符串的开始位置。除非在方括号表达式中使用,表示不包含该字符集合。要匹配"^"字符本身,需要转移"\^" |
$ | 匹配输入字符串的结尾位置。如果设置了RegExp对象的Multiline属性,则"$"也匹配'\n'或'r' |
. | “.”代表除"\n\s"之外的任何单个字符 |
\ | 反斜杠,又叫转义字符,去除其后紧跟的元字符或通配符的 特殊意义 |