首页Hadoop—分布式文件系统HDFS第1关：HDFS的基本操作

Hadoop—分布式文件系统HDFS第1关：HDFS的基本操作

时间: 2025-01-04 09:32:03 浏览: 101

### Hadoop HDFS 基本操作教程 #### 使用命令行工具访问HDFS 为了执行HDFS上的各种文件系统操作，可以使用`hadoop fs`或`hdfs dfs`命令。两者功能相同；然而，在处理HDFS特定的操作时推荐使用后者[^1]。 #### 创建目录创建新目录可以通过如下命令实现： ```bash hdfs dfs -mkdir /user/hadoop/dirname ``` 这将在根路径下建立名为`dirname`的新目录。 #### 查看文件列表要查看指定目录中的文件和子目录列表，可运行以下命令： ```bash hdfs dfs -ls / ``` 此命令会显示根目录下的所有条目及其属性。 #### 上传本地文件到HDFS 通过下面的指令可以从本地文件系统向HDFS传输数据： ```bash hdfs dfs -put localfile.txt /user/hadoop/ ``` 这里假设将当前工作目录里的`localfile.txt`复制到了远程位置/user/hadoop/之下。 #### 下载HDFS文件至本地相反地，如果想要把存储在分布式环境内的资料取回，则应该采用这样的语法结构： ```bash hdfs dfs -get /user/hadoop/remotefile.txt ./destination_folder/ ``` 它表示获取位于/user/hadoop/处的目标文档并保存到宿主机相应的位置上。 #### 删除文件或目录当不再需要某些对象时，可通过下列方式移除它们： ```bash hdfs dfs -rm /path/to/file_or_directory ``` 请注意，默认情况下只会删除单个文件而非整个树形结构。对于非空文件夹来说，需附加参数`-r`来实施递归清除动作。 #### 关闭HDFS服务最后，停止集群内各节点的服务进程需要用到这个脚本： ```bash stop-dfs.sh ``` 该命令能够优雅地中止NameNode以及DataNodes的工作流程[^3]。

阅读全文