一、进程启停管理
1.一键启停脚本
启动命令:
$HADOOP_HOME/sbin/start-dfs.sh
,一键启动HDFS集群
执行原理:
- 在执行此脚本的机器上,启动SecondaryNameNode
- 读取core-site.xml内容(fs.defaultFS项),确认NameNode所在机器,启动NameNode
- 读取workers内容,确认DataNode所在机器,启动全部DataNode
关闭命令:
$HADOOP_HOME/sbin/stop-dfs.sh
,一键关闭HDFS集群
执行原理:
- 在执行此脚本的机器上,关闭SecondaryNameNode
- 读取core-site.xml内容(fs.defaultFS项),确认NameNode所在机器,关闭NameNode
- 读取workers内容,确认DataNode所在机器,关闭全部NameNode
2.单进程启停
除了一键启停外,也可以单独控制进程的启停。
1.$HADOOP_HOME/sbin/hadoop-daemon.sh,此脚本可以单独控制所在机器的进程的启停
用法:hadoop-daemon.sh (start|status|stop) (namenode|secondarynamenode|datanode)
2.$HADOOP_HOME/bin/hdfs,此程序也可以用以单独控制所在机器的进程的启停
用法:hdfs --daemon (start|status|stop) (namenode|secondarynamenode|datanode)
二、文件系统操作命令
1.简要概述
HDFS同Linux系统一样,均是以/作为根目录的组织形式:
-
Linux:
/usr/local/hello.txt
-
HDFS:
/usr/local/hello.txt
区分:
- Linux:
file:///
- HDFS:
hdfs://namenode:port/
HDFS文件系统的操作命令,Hadoop提供了2套命令体系:
-
hadoop命令(老版本用法),用法:
hadoop fs [generic options]
-
hdfs命令(新版本用法),用法:
hdfs dfs [generic options]
两者在文件系统操作上,用法完全一致。
2.创建文件夹
命令:
hadoop fs -mkdir [-p] <path>
hdfs dfs -mkdir [-p] <path>
参数:
- -p:与Linux mkdir -p一致,它会沿着路径创建父目录。
示例:
hadoop fs -mkdir -p /itcast/bigdata
hdfs fs -mkdir -p /itheima/hadoop
3.查看指定目录下内容
命令:
hadoop fs -ls [-h] [-R] [<path> ...]
hdfs dfs -ls [-h] [-R] [<path> ...]
参数:
- -h:人性化显示文件size
- -R:递归查看指定目录及其子目录
示例:
hadoop fs -ls /
hdfs fs -ls /
4.上传文件到HDFS指定目录下
命令:
hadoop fs -put [-f] [-p] <localsrc> ... <dst>
hdfs dfs -put [-f] [-p] <localsrc> ... <dst>
参数:
- -f:覆盖目标文件(已存在下)
- -p:保留访问和修改时间,所有权和权限。
示例:
hadoop fs -put words.txt /itcast
hdfs dfs -put file:///etc/profile hdfs://node1:8020/itcast
5.查看HDFS文件内容
命令:
hadoop fs -cat <src>
hdfs dfs -cat <src>
示例:
hadoop fs -cat /itcast/words.txt
hdfs dfs -cat /itcast/profile
6.下载HDFS文件
命令:
hadoop fs -get [-f] [-p] <src> ... <localdst>
hdfs dfs -get [-f] [-p] <src> ... <localdst>
参数:
- -f 覆盖目标文件(已存在下)
- -p 保留访问和修改时间,所有权和权限。
示例:
[root@node1 ~]# mkdir test
[root@node1 ~]# cd test/
[root@node1 test]# ll
total 0
[root@node1 test]# hadoop fs -get /itcast/zookeeper.out ./
[root@node1 test]# ll
total 20
-rw-r--r-- 1 root root 18213 Aug 18 17:54 zookeeper.out
7.拷贝HDFS文件
命令:
hadoop fs -cp [-f] <src> ... <dst>
hdfs dfs -cp [-f] <src> ... <dst>
参数:
- -f 覆盖目标文件(已存在下)
示例:
[root@node3 ~]# hadoop fs -cp /small/1.txt /itcast
[root@node3 ~]# hadoop fs -cp /small/1.txt /itcast/666.txt #重命名
[root@node3 ~]# hadoop fs -ls /itcast
Found 4 items
-rw-r--r-- 3 root supergroup 2 2021-08-18 17:58 /itcast/1.txt
-rw-r--r-- 3 root supergroup 2 2021-08-18 17:59 /itcast/666.txt
8.追加数据到HDFS文件中
命令:
hadoop fs -appendToFile <localsrc> ... <dst>
hdfs dfs -appendToFile <localsrc> ... <dst>
示例:
#追加内容到文件尾部 appendToFile
[root@node3 ~]# echo 1 >> 1.txt
[root@node3 ~]# echo 2 >> 2.txt
[root@node3 ~]# echo 3 >> 3.txt
[root@node3 ~]# hadoop fs -put 1.txt /
[root@node3 ~]# hadoop fs -cat /1.txt
1
[root@node3 ~]# hadoop fs -appendToFile 2.txt 3.txt /1.txt
[root@node3 ~]# hadoop fs -cat /1.txt
1
2
3
9.HDFS数据移动操作
命令:
hadoop fs -mv <src> ... <dst>
hdfs dfs -mv <src> ... <dst>
10HDFS数据删除操作
命令:
hadoop fs -rm -r [-skipTrash] URI [URI ...]
hdfs dfs -rm -r [-skipTrash] URI [URI ...]
参数:
- -skipTrash 跳过回收站,直接删除
回收站功能默认关闭,如果要开启需要在core-site.xml内配置:
<property>
<name>fs.trash.interval</name>
<value>1440</value>
</property>
<property>
<name>fs.trash.checkpoint.interval</name>
<value>120</value>
</property>
回收站默认位置在:/user/用户名(hadoop)/.Trash