实验环境准备
Hive-2.3.3
Hbase-1.3.1
launcher start
start-dfs.sh
start-yarn.sh
zkServer.sh start
(3)
./mr-jobhistory-daemon.sh start historyserver
(hadoop/sbin)
bin/start-hbase.sh
实验原理:
Hive与HBase整合的实现是利用两者本身对外的API接口互相通信来完成的,其具体工作交由Hive的lib目录中的hive-hbase-handler-*.jar工具类来实现
通信原理:
整合的意义:
(一)通过Hive把数据加载到HBase中,数据源可以是文件也可以是Hive中的表。
(二)通过整合,让HBase支持JOIN、GROUP等SQL查询语法。
(三)通过整合,不仅可完成HBase的数据实时查询,也可以使用Hive查询HBase中的数据完成复杂的数据分析。
(四)通过结合,可以设计一个高速写入,后面接入实时分析的海量数据分析系统。
实验步骤:
- 修改hive-site.xml文件以及hive-env.sh文件配置(仅当hbase为集群模式时)
hive-site.xml: