【纯干货!!!】文件和目录内容检索

目录

一、文件和目录内容检索处理命令

1、grep筛选

2、find查找

3、sort排序

4、uniq去重

5、tr转换

6、cut切割

7、which命令

8、whereis命令

9、diff命令

二、文件与目录归档压缩命令

1、tar

2、zip/unzip

3、gzip / gunzip

4、bzip2 / bunzip2

5、xz / unxz

三、统计命令

1、wc

2、du

3、高级工具 ncdu

实操内容请看博主的实操文章内容


实操内容请看博主的实操文章内容

一、文件和目录内容检索处理命令

1、grep筛选

语法:grep [选项] file

选项作用
-i忽略大小写。
-v反转匹配,只显示不匹配的行。
-c计数,只输出匹配行的数量。
-n显示匹配行及其行号。
-l(小写L)只输出包含匹配字符串的文件名。
-L只输出不包含匹配字符串的文件名。
-q(暂时不用)静默模式,不输出任何匹配信息。
-E使用扩展正则表达式。
-o只输出匹配到的部分,而不是整行内容。
-A [NUM]打印匹配行和之后的[NUM]行。
-B [NUM]打印匹配行和之前的[NUM]行。
-C [NUM] 或 --context=[NUM]打印匹配行及其前后的[NUM]行。
-P使用Perl正则表达式。
-r 或 --recursive递归搜索目录中的文件。
-R 或 --text将二进制文件当作文本文件处理。
-s 或 --no-messages不显示错误信息。

2、find查找

find-递归地在层次目录中处理文件

选项作用
-name根据关键字查找,支持通配符*
-type根据文件类型查找
-size根据文件大小查找
-maxdepth指定查找时的路径深度
-exec将find命令查找到的内容交给-exec后面的命令再次处理
-user根据文件的属主进行查找
-perm根据文件的权限进行查找

文件类型:

  • 普通文件: f

  • 目录:d

  • 连接文件: l

  • 字符设备文件: c

  • 块设备文件: b

3、sort排序

以行对文件进行排序

选项作用
-f忽略大小写,会将小写字母都转换为大写字母来进行比较
-b忽略每行前面的空格
-n按照数值进行排序
-r反向排序
-u等同于uniq,表示相同的数据仅显示一行
-t指定字段分隔符,默认使用[Tab]键分隔
-k指定排序字段
-o<输出文件>将排序后的结果转存至指定文件
-h友好显示

说明:

当使用sort -n对包含英文字母的文本进行排序时,它会尝试将英文字母按照其在字符编码中的顺序进行数值化解释并排序。

4、uniq去重

uniq 是 Unix 和类 Unix 系统中的命令,用于从排序的文本数据中去除重复行,仅保留唯一的行。它通常与 sort 命令结合使用,因为 uniq 只能删除相邻的重复行。

语法:

uniq [options] [input_file [output_file]]
选项作用
-c进行计数,并删除文件中重复出现的行
-d仅显示连续的重复行
-u仅显示出现一次的行
-i忽略大小写

5、tr转换

tr 命令是 Unix 和类 Unix 系统中的一个用于字符转换或删除的实用程序。tr 命令通常用于处理文本数据,例如删除特定字符、替换字符、转换大小写等操作。

语法:

tr [options] set1 set2
选项作用
-c保留字符集1的字符,其他的字符用(包括换行符\n)字符集2替换
-d删除所有属于字符集1(-d 后面的参数)的字符
-s将重复出现的字符串压缩为一个字符串;用字符集2 替换 字符集1
-t字符集2 替换 字符集1,不加选项同结果

6、cut切割

cut 是 Unix 和类 Unix 系统中的命令,用于根据指定的字符分隔符从输入中提取字段。cut 命令用于处理文本文件,通常与管道 (|) 和其他命令一起使用,以进一步处理和分析文本数据。

语法:

cut [options] [field-spec]
选项作用
-f通过指定哪一个字段进行提取。cut命令使用“TAB”作为默认的字段分割符
-d“TAB”是默认的分隔符,使用此选项可更改为其他的分隔符
-c以字符为单位进行分割
- -complement用于排除所指定的字段
- -output-delimiter更改输出内容的分隔符
-s跳过空白字段
-b, -B仅打印非空白的字段。

7、which命令

which 命令在 Unix 和类 Unix 系统中用于查找一个命令的完整路径。当您输入一个命令名称时,which 命令会告诉您该命令位于哪个文件系统中。which 命令通常用于确认命令是否存在于系统 PATH 中,或者用于在脚本中获取命令的确切路径。如果您想要查找的命令不存在于 PATH 中,which 命令将不会返回任何输出。

语法:

which [command]
选项作用
-a 或 --all打印所有匹配的命令路径,而不仅仅是第一个匹配的。
-p 或 --print-path除了命令名称外,还打印出完整的路径。
-v 或 --version打印 which 命令的版本信息。

8、whereis命令

whereis 命令在 Unix 和类 Unix 系统中用于查找二进制文件、源代码文件和手册页的位置。它搜索默认的文件系统路径来确定指定命令的相关文件。

语法:

whereis [-bms] [-u] [-f] [-h] [-L] [-M] [-S] [-version] [command]
选项作用
-b 或 --binary只查找二进制文件。
-m 或 --manual只查找手册页。
-s 或 --source只查找源代码文件。
-u 或 --usage打印使用说明。
-f 或 --follow跟随符号链接。
-h 或 --help打印帮助信息。
L 或 --logical搜索逻辑路径,不包含物理符号链接。
-M 或 --physical搜索物理路径,不包含逻辑符号链接。
-S 或 --size只查找指定大小的文件。

9、diff命令

语法:

diff [选项] 文件1 文件2
选项作用
-q 或 --quiet只输出文件差异的文件名,不显示详细差异。
-c 或 --context以语境方式显示差异,默认显示3个字符的上下文。
-u 或 --unified以统一的方式显示差异,这是默认模式,显示共同的祖先与当前文件之间的差异。
-a 或 --text比较文本文件,忽略文件的格式差异。
-b 或 --ignore-space-change忽略空白的差异(空格、制表符等)。
-B 或 --ignore-space-at-eol忽略每行末尾的空白差异。
-i 或 --ignore-case忽略大小写差异。
-D 或 --horizontal-split以水平分割的方式显示差异。
-E 或 --sideby-side以并排的方式显示差异。
-l 或 --from-file只显示文件2相对于文件1的差异。
-r 或 --recursive递归地比较目录。
-N 或 --new-file当文件2是文件1不存在的文件时,只显示文件2的内容。
-x 或 --exclude跳过指定模式的文件。
-X 或 --exclude-from从指定的文件中读取排除模式。
--from-file=FILE同 -l,指定比较的基准文件。
--horizontalsplit同 -D,以水平分割的方式显示差异。
--left-column只显示左侧列的差异。
--no-dereference不解析符号链接。
--old-file当文件1是文件2不存在的文件时,只显示文件1的内容。
--recursive同 -r,递归地比较目录。
--right-column只显示右侧列的差异。
--speed-large-files用于大文件,减少内存使用。

二、文件与目录归档压缩命令

1、tar

归档命令

语法:tar [选项] [归档文件名] [-C] [解压路径]

选项作用
-z,--gzip用 gzip 对存档压缩
-c, --create建立新的存档
-v, --verbose详细显示处理的文件
-f, --file指定存档文件路径及名称
-j, --bzip2通过 bzip2 过滤归档
-x, --extract, --get从归档中解出文件
-C指定解压后的存储路径
tvf仅查看归档包中的文件内容
--same-owner保留文件所有者(需root权限)
-J使用xz压缩

2、zip/unzip

语法:zip 压缩后的文件名 需要压缩的文件

解压缩命令:unzip 压缩文件名

3、gzip / gunzip

默认压缩后源文件消失

语法:gzip            需要压缩的文件

          gzip -k filename       # 保留原文件

解压缩命令:默认解压后源文件消失

gunzip 压缩文件        gunzip -k 压缩文件

4、bzip2 / bunzip2

压缩后源文件消失,压缩率最高

语法:bzip2 需要压缩的文件

解压缩命令:

解压后源文件消失

bunzip2       压缩文件

5、xz / unxz

  • 压缩文件:xz filename            # 生成filename.xz

  • 解压文件:unxz filename.xz

工具对比

工具/格式压缩率速度典型扩展名特点
gzip.gz通用,适合文本文件
bzip2.bz2高压缩率,适合大文件
xz极高最慢.xz最高压缩率,资源消耗大
zip.zip跨平台(Windows兼容)
tar.tar仅归档,需配合压缩工具使用

三、统计命令

1、wc

统计文件内容的行数、字符数、单词数

wc -l file.txt

统计文件行数
wc -c file.txt统计字节数
wc -m file.txt统计字符数
wc -w file.txt统计单词数
wc -L file.txt统计最长行的长度

2、du

统计文件占用磁盘空间的容量

du -sh /path/to/dir统计目录总大小(-s汇总,-h人性化显示)
du -h --max-depth=1 /var  显示/var下一级子目录大小
du -ah /path 显示所有文件及子目录大小(含隐藏文件)

3、高级工具 ncdu

ncdu /path/to/dir 交互式分析目录占用(按大小排序,支持删除)
ncdu -x /                  不跨越文件系统边界扫描

注意:

实操内容请看博主的实操文章内容

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值