CentOS 7上搭建Hadoop 2.7.7环境与配置详解

PDF文件

hadoop

hbase

hive

scala

spark

下载需积分: 50 | 1.31MB | 更新于2024-09-03 | 70 浏览量 | 举报收藏

立即下载

本篇文档主要介绍了在CentOS 7环境中搭建Hadoop 2.7.7的大数据处理平台的步骤，涉及多个关键组件的安装和配置。以下是详细的内容概览： 1. **环境准备**： - 环境选择：针对的是Linux操作系统，具体版本为CentOS 7。 - 技术栈：文档涉及的工具和技术包括Java Development Kit (JDK)、Hadoop、HBase、Hive、Scala以及Spark。 2. **Hadoop 2.7.7安装**： - 安装源：首先从Apache官网下载Hadoop 2.7.7的源码包(hadoop-2.7.7.tar.gz)，并通过Xshell进行传输。 - 解压与目录结构：在`/home/hadoop`目录下解压Hadoop包，如果不打算重命名目录，可以直接使用`tar -zxvf hadoop-2.7.7.tar.gz`。 3. **虚拟机部署**： - 为了后续的分布式架构研究，建议设置三台虚拟机，这一步未在本文中详细描述，但可以理解为后续扩展的规划。 4. **Hadoop伪分布搭建**： - **环境变量配置**： - 在`~/.bash_profile`或`~/.bashrc`中，添加环境变量来指定Java和Hadoop的安装路径，如`JAVA_HOME`和`HADOOP_HOME`，同时设置`PATH`和`CLASSPATH`，确保命令行访问这些工具的正确路径。 - `hadoop-env.sh`文件中也进行了类似的环境变量配置，确认无误后在CentOS 7中验证有效。 - **核心配置**： - `core-site.xml`是Hadoop的核心配置文件，其中`<name>hadoop.tmp.dir</name>`属性用于指定Hadoop运行时临时文件的存放位置，这是在本地Linux文件系统中的路径，而非HDFS。通过以上步骤，读者能够在一个单一的CentOS 7机器上实现Hadoop 2.7.7的伪分布环境，为后续学习和测试Hadoop生态系统（如HBase、Hive和Spark）打下基础。注意，为了实际部署一个生产级别的集群，还需要考虑数据存储、网络配置和集群间的协调等问题。

大数据 Hadoop

1 / 5

1 Cent7 搭建大数据环境

包括 jdk、hadoop、scala、habse、mysql、hvie、spark

1.1 安装 Hadoop2.7.7

https://archive.apache.org/dist/hadoop/common/

1.1.1 通过 xshell 传输 hadoop*.tar.gz

通过 xshell 将 hadoop2.7.7.tar.gz 复制到 centos 的 hadoop 家目录中：

1.1.2 在 xshell 命令符下解压

# tar -zxvf hadoop-2.7.7.tar.gz -C /home/hadoop/

解压时自动在/home/hadoop 下创建目录 hadoop2.7.7，如果需要重命名目录（此处不

重命名），则使用

#mv hadoop2.7.7 hadoop2.x

1.1.3 做三台虚拟机（以后研究）

1.1.4 hadoop 伪分布搭建

hadoop 伪分布模式，就是在单机上模拟 hadoop 分布式。

下载后可阅读完整内容，剩余4页未读，立即下载

chengzhb_csdn

粉丝: 1

CentOS 7上搭建Hadoop 2.7.7环境与配置详解

第2集-Hadoop环境搭建 - linux（centos7） - 安装配置jdk1.8.pdf

第7集-Hadoop环境搭建 - linux（centos7） - 安装配置hive2.1.1.pdf

第6集-Hadoop环境搭建 - linux（centos7） - 安装配置hbase1.3.6.pdf

第1集-Hadoop环境搭建 - linux（centos7） - ssh免登陆.pdf

linux 32位操作系统 源码编译后hadoop-2.7.7 centos-i686 hadoop-2.7.7.tar.gz

centos i686 linux 32位 hadoop-2.7.7 hadoop2.7.7-lzo-0.4.21.jar

hadoop-2.7.7-centos-6.7.tar.gz

hadoop-2.7.7-Centos6.10.tar.gz

hadoop-eclipse-plugin-2.7.7.jar

centos7安装hadoop2.7.7

最新资源

linux 32位操作系统源码编译后hadoop-2.7.7 centos-i686 hadoop-2.7.7.tar.gz