Hive基础之自定义封装hivefile命令

本文介绍了一种自定义HiveFile脚本的方法,解决了HQL脚本在Shell中不便阅读及无法传递参数的问题。通过创建hivefile脚本,可以实现从单独的HQL文件中读取查询并传递参数进行动态替换。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

存在的问题:当把hql写到shell中,不方便阅读;但把hql写到文件中,又传递不了参数;怎么办呢? 

自定义hivefile

执行方式形如:

第一个参数为要执行的hql文件,后续的参数为要替换的key-value对。

hivefile d:/hivefile_test.hql -date "2013-01-01" -name "luogk"

 

hivefile思路分析:

本案例脚本和代码均放置在/home/spark/software/hivefile路径下,lib包放在/home/spark/lib下

1、将hql脚本放置在单独的脚本中:hivefile_test.hql

select a.id,sum(b.amount) from city a join sale_order b on a.id=b.city_id where b.amount > {$amount} group by a.id

 2、创建shell脚本:hivefile_test.sql,在sh脚本中通过hivefile调用hql文件,并传递进去要替换的参数键值对

#!/bin/bash
. ~/.bash_profile
cd /home/spark/software/hivefile
hivefile ./hivefile_test.hql -amount 20 

3、创建hivefile脚本

. ~/.bash_profile
sql=`java -jar /home/spark/lib/hivefile.jar $*`    #$*用于传递参数
echo "$sql"
hive -e "$sql"

 4、hivefile做要的事情

  1)获取到hive -e命令行的参数,形如:c:/hive_test.hql -date "2013-01-01" ;

  2)解析参数,解析规则为:第一个参数为sql文件名,从第二个参数开始要替换的变量名采用"-"开头,紧跟着的是该变量名的值,一次类推;

  3)java代码获取到文件名,读取该文件的内容,并使用值去替换掉文件中的占位符变量名;

  4)将替换后的文件内容交给hive -e 去执行;

5、执行hivefile_test.sh

cd /home/spark/software/hivefile
hivefile_test.sh

6、为了使用hivefile脚本更加方便,将hivefile脚本封装到~/.bash_profile中去,使得在任意位置都可以执行hivefile命令,在path中添加hivefile的路径:

export PATH=.:/home/spark/software/hivefile

添加到环境变量后,就可以在任意路径下执行hivefile命令,形如:

hivefile /home/spark/software/hivefile/hivefile_test.hql -amount 20

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值