Hadoop虚拟机centos7的安装配置
时间: 2025-05-28 14:48:02 浏览: 18
### Hadoop 安装配置 CentOS 7 虚拟机 教程
#### 准备工作
在开始安装前,确保已经成功部署了基于 VMware 的 CentOS 7 虚拟机,并完成了基本的网络设置以及主机名配置。如果尚未完成这些操作,请参考相关文档[^1]。
#### 配置 SSH 密钥登录
为了简化节点间的通信,在主节点(master)上生成 SSH 密钥并将其分发到其他节点(slave)。执行以下命令来生成密钥对:
```bash
ssh-keygen -t rsa
```
随后将公钥复制至所有节点(包括本机),以便实现无密码访问:
```bash
ssh-copy-id root@<node-ip>
```
#### 下载与解压 Hadoop
前往 Apache 官方网站下载最新版本的 Hadoop 压缩包,并上传至虚拟机中的 `/opt` 或者 `/usr/local` 文件夹下。使用 tar 工具对其进行解压缩:
```bash
tar -xzvf hadoop-x.x.x.tar.gz -C /usr/local/
ln -s /usr/local/hadoop-x.x.x /usr/local/hadoop
```
#### 修改核心配置文件
编辑 `core-site.xml` 来指定 NameNode 地址及其临时存储路径:
```xml
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://<namenode-host>:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/hadoop/tmp</value>
</property>
</configuration>
```
对于 DataNode 和 SecondaryNameNode,则需要调整 `hdfs-site.xml` 中的相关参数以匹配实际数据目录结构[^2]:
```xml
<configuration>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/usr/hadoop/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/usr/hadoop/dfs/data</value>
</property>
</configuration>
```
最后一步是在 `mapred-site.xml.template` 上定义 MapReduce 框架使用的 JobTracker URI:
```xml
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
```
#### 启动服务
依次启动 HDFS 和 YARN 服务之前,先初始化分布式文件系统的命名空间:
```bash
/usr/local/hadoop/bin/hdfs namenode -format
```
接着通过脚本来开启各个组件的服务进程:
```bash
start-dfs.sh
start-yarn.sh
```
验证集群状态是否正常运行可利用 JPS 工具查看当前 JVM 进程列表;或者打开浏览器输入 http://<namenode-host>:50070 查看 Web UI 页面显示的信息。
阅读全文
相关推荐

















