file-type

Apache Hive 2.1.1 版本发布与安装指南

RAR文件

下载需积分: 10 | 140.13MB | 更新于2024-11-13 | 116 浏览量 | 0 下载量 举报 收藏
download 立即下载
是指Apache Hive的2.1.1版本的二进制发行版。Apache Hive是一个开源数据仓库软件,用于处理大规模数据集。它建立在Hadoop之上,提供了一系列用于数据查询和管理的工具,其查询语言是类SQL的HiveQL(HQL)。Hive定义了一个简单的类SQL查询语言,允许熟悉SQL的用户查询存储在Hadoop文件系统中的数据。 从IT知识角度分析,以下是关于apache-hive-2.1.1-bin的关键知识点: 1. Hive的架构:Hive包含四个主要的组件:用户接口(如命令行和Web界面)、元数据存储(通常是一个关系数据库,存储表结构的定义)、驱动程序、编译器和优化器(将HiveQL转换成一系列用于处理数据的MapReduce任务)、以及执行器(运行实际的任务并返回结果)。 2. HiveQL语言:HiveQL允许用户查询和管理大数据。它类似于SQL,并为数据仓库操作提供了简单的查询语句。但是,HiveQL在执行时会将查询语句转换成MapReduce任务。 3. 数据存储:在Hive中,数据存储在Hadoop文件系统(HDFS)中,这是分布式存储系统,设计用来优化对大数据的读写操作。Hive能够管理存储在HDFS上的数据,而不需要关心底层的分布式存储细节。 4. 数据模型:Hive定义了一个类似于关系数据库的数据模型,包括表、分区、桶等概念。数据在Hive中是以表的形式存储的,表可以被分区以提高查询性能,还可以通过桶操作提高抽样查询的效率。 5. 集成和兼容性:Hive可以很好地集成到现有的Hadoop生态系统中,比如可以使用Hadoop的YARN进行资源管理,使用HBase作为底层存储,使用Pig语言进行数据处理。 6. 元数据管理:Hive的元数据存储在一个关系数据库中,通常使用MySQL或者Derby。元数据包括了表结构的定义、表中数据的位置、表的分区信息等。 7. 数据类型:Hive支持多种数据类型,包括基本数据类型(如int, float, boolean等)、复杂数据类型(如array, map, struct等),以及文本类型(如string, varchar等)。 8. 性能优化:Hive支持多种优化技术,包括分区剪裁、桶表和索引等。通过这些技术,Hive可以提高查询性能,尤其是在处理大数据集时。 9. Hive的安全性:Hive支持Kerberos认证、基于角色的访问控制(RBAC)、列级别的权限控制等安全特性,这些都可以帮助用户保护数据的安全。 10. Hive的版本更新和兼容性:2.1.1版本是在此之前版本的更新。版本更新通常会包括bug修复、性能改进以及新功能的引入。需要注意的是,随着版本的更新,可能会引入一些不兼容的变更,因此在升级时需要进行相应的兼容性测试。 11. Hive的部署和安装:Hive的安装和部署相对简单,可以作为一个独立的应用或者通过Hadoop集群的管理工具如Ambari或者Cloudera Manager进行安装。安装Hive通常需要Java环境,并配置好Hadoop和元数据库。 12. 用户接口:Hive提供了多种用户接口,用户可以通过命令行接口(CLI)、Web界面(如Hue)或者编程接口(如JDBC/ODBC、Thrift服务器等)进行交互。 了解和掌握apache-hive-2.1.1-bin的这些知识点,对于IT专业人士在大数据处理领域进行数据仓库的构建、数据查询与分析、以及数据仓库的维护和优化工作具有重要意义。

相关推荐

filetype

[root@master apache-hive-2.1.1-bin]# bin/hive which: no hbase in (/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/usr/java/jdk1.8.0_144/bin:/usr/zookeeper/zookeeper-3.4.10/bin:/usr/hadoop/hadoop-2.7.3/bin:/usr/hadoop/hadoop-2.7.3/sbin:/root/bin:/usr/java/jdk1.8.0_144/bin:/usr/zookeeper/zookeeper-3.4.10/bin:/usr/hadoop/hadoop-2.7.3/bin:/usr/hadoop/hadoop-2.7.3/sbin:/usr/hive/apache-hive-2.1.1-bin/bin) SLF4J: Class path contains multiple SLF4J bindings. SLF4J: Found binding in [jar:file:/usr/hive/apache-hive-2.1.1-bin/lib/log4j-slf4j-impl-2.4.1.jar!/org/slf4j/impl/StaticLoggerBinder.class] SLF4J: Found binding in [jar:file:/usr/hadoop/hadoop-2.7.3/share/hadoop/common/lib/slf4j-log4j12-1.7.10.jar!/org/slf4j/impl/StaticLoggerBinder.class] SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation. SLF4J: Actual binding is of type [org.apache.logging.slf4j.Log4jLoggerFactory] Logging initialized using configuration in jar:file:/usr/hive/apache-hive-2.1.1-bin/lib/hive-common-2.1.1.jar!/hive-log4j2.properties Async: true Exception in thread "main" java.lang.RuntimeException: org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient at org.apache.hadoop.hive.ql.session.SessionState.start(SessionState.java:591) at org.apache.hadoop.hive.ql.session.SessionState.beginStart(SessionState.java:531) at org.apache.hadoop.hive.cli.CliDriver.run(CliDriver.java:705) at org.apache.hadoop.hive.cli.CliDriver.main(CliDriver.java:641) at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62) at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) at java.lang.reflect.Method.invoke(Method.java:498) at org.apache.hadoop.util.RunJar.run(RunJar.java:221) at org.apache.hadoop.util.RunJar.main(RunJar.java:136) Caused by: org.apache.hadoop.hiv

filetype
简单的小呆瓜
  • 粉丝: 2w+
上传资源 快速赚钱