vmvirtualbox 单机安装Hadoop
时间: 2025-02-15 20:14:34 浏览: 46
### 单机模式下在 VirtualBox 中安装 Hadoop
#### 准备工作
为了顺利进行Hadoop的单机模式安装,在VirtualBox中创建并配置好Ubuntu虚拟机是必要的前提条件。确保已经按照相关指南完成了Linux Ubuntu虚拟机的设置,并且能够正常启动运行。
#### 配置网络连接
确认虚拟机中的网络适配器已正确配置,以便后续可以访问互联网下载所需资源以及与其他设备通信。通常建议采用NAT或桥接方式来实现良好的联网性能[^1]。
#### 下载与解压Hadoop压缩包
前往Apache官方网站获取最新稳定版本的Hadoop二进制分发版ZIP/TAR.GZ文件。将其上传至虚拟机内部并通过命令行工具tar解开到指定位置:
```bash
wget https://archive.apache.org/dist/hadoop/core/hadoop-3.2.0/hadoop-3.2.0.tar.gz
tar -xzvf hadoop-3.2.0.tar.gz -C /usr/local/
```
#### 修改环境变量
编辑`~/.bashrc`文件以永久性地向PATH路径添加Hadoop主目录下的bin子目录,从而可以在任何地方执行hdfs dfs等指令而无需输入完整路径:
```bash
export PATH=$PATH:/usr/local/hadoop/bin
source ~/.bashrc
```
#### 更改所有权
为了让特定用户拥有对整个Hadoop文件夹及其内容的操作权限,需调整其所属关系为当前登录账户名(假设这里用户名也为"hadoop") :
```bash
sudo chown -R hadoop:hadoop /usr/local/hadoop
```
#### 编辑核心配置文件core-site.xml
进入`$HADOOP_HOME/etc/hadoop/`目录内定位到名为core-site.xml的核心站点XML文档,依据实际需求修改其中<configuration>标签内的参数项如下所示:
```xml
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
```
#### 编辑HDFS配置文件 hdfs-site.xml
同样是在上述etc/hadoop/ 文件夹里找到另一个重要的配置文件——hdfs-site.xml ,为其增加必要属性定义:
```xml
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/home/hadoop/data/nameNode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/home/hadoop/data/dataNode</value>
</property>
```
#### 初始化NameNode节点元数据
切换回终端界面,通过下面这条语句初始化namenode上的命名空间结构体:
```bash
hdfs namenode -format
```
#### 启动服务进程
最后一步就是利用start-dfs.sh脚本来激活所有必需的服务组件了;此时应该能看到控制台打印出成功消息表示集群已经开始运作:
```bash
start-dfs.sh
```
以上就是在VirtualBox环境下针对单一主机部署简易版Hadoop框架的具体流程概述[^4]。
阅读全文
相关推荐















