shell脚本实现:截取HDFS目录下的hive仓库里的库名和表名

截取HDFS目录下的hive仓库里的库名和表名

运行步骤拆分
方法一:shell脚本实现

#!/bin/bash
#截取hdfs中hive仓库目录
hdfs dfs -ls -R /user/hive/warehouse | awk '{print $8}' > file_paths.txt

#剔除/user/hive/warehouse,取库名和表名
awk -F'/' '{print $5, $6}' file_paths.txt > extracted_data.txt

#最后把提取到的库名和表名进行去重
sort extracted_data.txt | uniq > data.txt

方法二:命令行实现
因为脚本运行过后会产生好几个中间文件,我把代码优化了一下
直接在命令行中运行以下命令即可

hdfs dfs -ls -R /user/hive/warehouse | awk '{print $8}' | awk -F'/' '{print $5, $6}' | sort | uniq > data.txt

打开data.txt文件
这是运行后面的展示效果

hivetest.db
hive_test.db a
hive_test.db b
hive_test.db c
test.db
test.db aaa
test.db customers
test.db employee
test.db sales
test.db test
test_luo.db
test_luo.db student_test

每个库名对应下面的表名

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值