基于Hadoop集群的Hive安装配置(Derby数据库)

本文详细介绍了如何在Hadoop集群上安装配置Hive 2.2.0,特别是与Derby数据库的集成。内容包括环境准备、Hive和Derby的环境变量设置、配置Hive的Metastore、解决启动Hive时遇到的问题,以及启动验证。文章适合大数据初学者,提供了一步一步的实践指导。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Hive是一个数据仓库基础工具在Hadoop中用来处理结构化数据,提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行(具体的Hive架构大家自行搜索)。接下来主要讲下Hadoop集群下Hive的安装配置,并搭载Derby数据库(一款小巧的数据库,用于测试,不推荐开发使用,具体大家自行百度),进行一些基本的数据库操作,好了,让我们开始吧。

    一、环境:同样的启用三个节点,分别是虚拟机slave01,slave02,slave03,基于之前已经搭建好的环境,包括JDK、Zookeeper、Hadoop

    二、Hive、Derby配置(自行解压)

这里推荐下载版本较低的Hive,本人经验教训告诉大家:高版本易出现问题,比如说我的Hadoop 2.7.6,下载Hive 2.2.0 安装配置后就出现了很多问题,体验极差,像 报错为:

 就属于版本过高导致的,所以,大家尽量下载低版本的。

    (1)设置Hive、Derby环境变量    

    添加HIVE_HOME、DERBY_HOME,如下: