Hadoop—分布式文件系统HDFS第1关:HDFS的基本操作
时间: 2025-01-04 09:32:03 浏览: 101
### Hadoop HDFS 基本操作教程
#### 使用命令行工具访问HDFS
为了执行HDFS上的各种文件系统操作,可以使用`hadoop fs`或`hdfs dfs`命令。两者功能相同;然而,在处理HDFS特定的操作时推荐使用后者[^1]。
#### 创建目录
创建新目录可以通过如下命令实现:
```bash
hdfs dfs -mkdir /user/hadoop/dirname
```
这将在根路径下建立名为`dirname`的新目录。
#### 查看文件列表
要查看指定目录中的文件和子目录列表,可运行以下命令:
```bash
hdfs dfs -ls /
```
此命令会显示根目录下的所有条目及其属性。
#### 上传本地文件到HDFS
通过下面的指令可以从本地文件系统向HDFS传输数据:
```bash
hdfs dfs -put localfile.txt /user/hadoop/
```
这里假设将当前工作目录里的`localfile.txt`复制到了远程位置/user/hadoop/之下。
#### 下载HDFS文件至本地
相反地,如果想要把存储在分布式环境内的资料取回,则应该采用这样的语法结构:
```bash
hdfs dfs -get /user/hadoop/remotefile.txt ./destination_folder/
```
它表示获取位于/user/hadoop/处的目标文档并保存到宿主机相应的位置上。
#### 删除文件或目录
当不再需要某些对象时,可通过下列方式移除它们:
```bash
hdfs dfs -rm /path/to/file_or_directory
```
请注意,默认情况下只会删除单个文件而非整个树形结构。对于非空文件夹来说,需附加参数`-r`来实施递归清除动作。
#### 关闭HDFS服务
最后,停止集群内各节点的服务进程需要用到这个脚本:
```bash
stop-dfs.sh
```
该命令能够优雅地中止NameNode以及DataNodes的工作流程[^3]。
阅读全文
相关推荐






