sed 保持空间命令之 g、G 的执行逻辑

目录

1. 将保持空间的内容复制到模式空间

2. 在每行后面加一空行

3. 模式空间到保持空间的逐行复制、隔行匹配、并行打印

4. 用 sed 加行号并模拟 tac


        sed 有两个内置的存储空间:

  • 模式空间:该空间是 sed 内置的一个缓冲区,是 sed 执行的正常流程中,暂存当前处理行的空间。每处理完一行都会清空模式空间再读取下一行。模式空间初始为空。
  • 保持空间:保持空间是另外一个缓冲区,用来存放临时数据,以便在后续处理中使用。与模式空间不同,保持空间的内容不会在循环中被删除。不能在保持空间上执行普通的 sed 命令。保持空间初始为一个换行符。
     

        命令 g(get)把保持空间的内容复制到模式空间(覆盖当前模式空间的内容)。假定当前模式空间内容为“line 1”,保持空间内容为“line 2”,执行命令 g 之后,模式空间内容变为“line 2”,保持空间内容仍然为“line 2”。

1. 将保持空间的内容复制到模式空间

        示例文本 empnametitle.txt 的内容如下:

John Doe
CEO
Jason Smith
IT Manager
Raj Reddy
Sysadmin
Anand Ram
Developer
Jane Miller
Sales Manager

        在这个文件中,每个员工的姓名和职位位于连续的两行内。下面的命令打印管理者的名称。

#sed -n -e '/Manager/!h' -e '/Manager/{g;p}' empnametitle.txt
Jason Smith
Jane Miller
#

        本例中:

  • /Manager/!h 的作用是如果模式空间内容不包含关键字 Manager,那么就把它复制到保持空间。
  • /Manager/{g;p} 的作用是如果模式空间内容包含关键字 Manager,则把保持空间的内容复制到模式空间中,然后打印出来。

        完整的执行流程如下表所示。

循环次数

模式空间

保持空间

操作

1

John Doe

John Doe

\n

John Doe

John Doe

h =>

2

CEO

CEO

John Doe

CEO

CEO

h =>

3

Jason Smith

Jason Smith

CEO

Jason Smith

Jason Smith

h =>

4

IT Manager

Jason Smith

Jason Smith

Jason Smith

Jason Smith

g =>

p Jason Smith

5

Raj Reddy

Raj Reddy

Jason Smith

Raj Reddy

Raj Reddy

h =>

6

Sysadmin

Sysadmin

Raj Reddy

Sysadmin

Sysadmin

h =>

7

Anand Ram

Anand Ram

Sysadmin

Anand Ram

Anand Ram

h =>

8

Developer

Developer

Anand Ram

Developer

Developer

h =>

9

Jane Miller

Jane Miller

Developer

Jane Miller

Jane Miller

h =>

10

Sales Manager

Jane Miller

Jane Miller

Jane Miller

g =>

p Jane Miller

        也可以把命令保存到 sed 脚本中执行:

  1. 创建内容如下的脚本文件 g.sed
    #!/bin/sed -nf
    /Manager/!h
    /Manager/{g;p}

  2. 修改脚本文件的模式为可执行
    chmod u+x g.sed

  3.  执行脚本
    #./g.sed empnametitle.txt
    Jason Smith
    Jane Miller
    #

        大写 G 命令把当前保持空间的内容作为新行追加到模式空间中。模式空间的内容不会被覆盖,该命令在模式空间后面加上换行符 \n,然后把保持空间内容追加进去。G 和 g 的用法类似于 H 和 h,小写命令替换原来的内容,大写命令追加原来的内容。

        假定当前模式空间内容为“line 1”,保持空间内容为“line 2”,命令 G 执行后,模式空间内容变为“line 1\nline 2”,同时保持空间内容不变,仍然为“line 2”。

2. 在每行后面加一空行

#echo -e "line1\nline2\nline3" | sed 'G'
line1

line2

line3

#

3. 模式空间到保持空间的逐行复制、隔行匹配、并行打印

        示例文本 empnametitle.txt 的内容如下:

John Doe
CEO
Jason Smith
IT Manager
Raj Reddy
Sysadmin
Anand Ram
Developer
Jane Miller
Sales Manager

        在这个文件中,每个员工的姓名和职位位于连续的两行内。下面的命令在同一行上打印以冒号分割的管理者的名称和职位。

#sed -n -e '/Manager/!h' -e '/Manager/{x;G;s/\n/:/;p}' empnametitle.txt
Jason Smith:IT Manager
Jane Miller:Sales Manager
#

        本例中:

  • /Manager/!h 的作用是如果模式空间内容不包含关键字 Manager,那么就把它复制到保持空间。
  • /Manager/{x;G;s/\n/:/;p} 的作用是如果模式空间包含 Manager,那么:
    • x 交换模式空间和保持空间的内容。
    • G 把保持空间的内容追加到模式空间。
    • s/\n/:/ 在模式空间中,把换行符替换为冒号。
    • p 打印模式空间内容。

        完整的执行流程如下表所示。

循环次数

模式空间

保持空间

操作

1

John Doe

John Doe

\n

John Doe

John Doe

h =>

2

CEO

CEO

John Doe

CEO

CEO

h =>

3

Jason Smith

Jason Smith

CEO

Jason Smith

Jason Smith

h =>

4

IT Manager

Jason Smith

Jason Smith\nIT Manager

Jason Smith:IT Manager

Jason Smith

IT Manager

IT Manager

IT Manager

IT Manager

x =>

G =>

s/\n/:/ =>

p Jason Smith:IT Manager =>

5

Raj Reddy

Raj Reddy

IT Manager

Raj Reddy

Raj Reddy

h =>

6

Sysadmin

Sysadmin

Raj Reddy

Sysadmin

Sysadmin

h =>

7

Anand Ram

Anand Ram

Sysadmin

Anand Ram

Anand Ram

h =>

8

Developer

Developer

Anand Ram

Developer

Developer

h =>

9

Jane Miller

Jane Miller

Developer

Jane Miller

Jane Miller

h =>

10

Sales Manager

Jane Miller

Jane Miller\nSales Manager

Jane Miller:Sales Manager

Jane Miller

Sales Manager

Sales Manager

Sales Manager

x =>

G =>

s/\n/:/ =>

p Jane Miller:Sales Manager

        注意:如果舍去命令 x,即使用 /Manager/{G;s/\n/:/;p},那么结果会由“雇员名称: 雇员职位”变成”雇员职位: 雇员名称”。

        也可把上述命令写到 sed 脚本中然后执行:

  1. 创建内容如下的脚本文件 G-upper.sed
    #!/bin/sed -nf
    /Manager/!h
    /Manager/{x;G;s/\n/:/;p}

  2. 修改脚本文件的模式为可执行
    chmod u+x G-upper.sed

  3. 执行脚本
    #./G-upper.sed empnametitle.txt
    Jason Smith:IT Manager
    Jane Miller:Sales Manager
    #

4. 用 sed 加行号并模拟 tac

        cat -n 可以加行号,tac 可以按行反转输出,例如:

#echo -e "line1\nline2\nline3\nline4\nline5" | cat -n | tac
     5	line5
     4	line4
     3	line3
     2	line2
     1	line1
#

        用 sed 也可以达到相同的效果:

#echo -e "line1\nline2\nline3\nline4\nline5" | sed '=' | sed 'N;s/\n/  /g;s/^/     /g;' | sed -n '1!G;h;$p'
     5  line5
     4  line4
     3  line3
     2  line2
     1  line1
#

        第一个 sed 命令用于在每行前面加行号:

#echo -e "line1\nline2\nline3\nline4\nline5" | sed '='
1
line1
2
line2
3
line3
4
line4
5
line5
#

        第二个 sed 命令将行号与正文拼成一行,并对标 cat -n 的输出添加相应的空格:

#echo -e "line1\nline2\nline3\nline4\nline5" | sed '=' | sed 'N;s/\n/  /g;s/^/     /g;'
     1  line1
     2  line2
     3  line3
     4  line4
     5  line5
#

        N 命令将下一行添加到模式空间中,结果是当前读入行和用 N 命令添加的下一行拼成“一行”:

1\nline1
2\nline2
3\nline3
4\nline4
5\nline5

        s/\n/  /g;s/^/     /g; 命令将 \n 替换成两个空格,并在行头添加四个空格,为的是让输出和 cat -n 完全一样。

        最后的 sed -n '1!G;h;$p' 命令模拟 tac 反转输出行,这个命令的工作原理是:

  1. 1!G:对于不是第一行的每一行,将保持空间的内容追加到模式空间。由于在第一行之前没有内容在保持空间中,所以这一行对第一行没有影响。
  2. h:将模式空间的内容复制到保持空间中。
  3. $p:在文件的最后一行,打印模式空间的内容。
     

        完整的执行流程如下表所示(为简化演示,没显示行头的空格)。

循环次数

模式空间

保持空间

操作

1

1  line1

1  line1

\n

1  line1

1  line1

h =>

2

2  line2

2  line2\n1  line1

2  line2\n1  line1

1  line1

1  line1

2  line2\n1  line1

2  line2\n1  line1

G =>

h =>

3

3  line3

3  line3\n2  line2\n1  line1

3  line3\n2  line2\n1  line1

2  line2\n1  line1

2  line2\n1  line1

3  line3\n2  line2\n1  line1

3  line3\n2  line2\n1  line1

G =>

h =>

4

4  line4

4  line4\n3  line3\n2  line2\n1  line1

4  line4\n3  line3\n2  line2\n1  line1

3  line3\n2  line2\n1  line1

3  line3\n2  line2\n1  line1

4  line4\n3  line3\n2  line2\n1  line1

4  line4\n3  line3\n2  line2\n1  line1

G =>

h =>

5

5  line5

5  line5\n4  line4\n3  line3\n2  line2\n1  line1

5  line5\n4  line4\n3  line3\n2  line2\n1  line1

4  line4\n3  line3\n2  line2\n1  line1

4  line4\n3  line3\n2  line2\n1  line1

5  line5\n4  line4\n3  line3\n2  line2\n1  line1

G =>

h =>

p 5  line5\n4  line4\n3  line3\n2  line2\n1  line1

        但是需要注意,这种方法实际上是在文件处理完成后才输出反转的内容,而不是在读取文件时逐行反转。对于真正的逐行反向输出,应该考虑使用 tac 或者编写一个小的脚本(如使用 awk、perl 或 bash)来实现。例如,使用 awk 实现逐行反向输出的脚本可能如下所示:

awk '{lines[NR] = $0} END {for (i=NR; i>0; i--) print lines[i]}' filename

        这个 awk 脚本将文件的每一行存储在数组 lines 中,然后在文件处理完成后,从数组的末尾开始向前遍历并打印每一行,从而实现反向输出的效果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值