HDFS是Hadoop的核心模块,Hadoop体系结构主要通过HDFS来实现分布式存储,
HDFS的体系结构,采用主从(Master/Slave)结构模型。一个HDFS集群由一个NameNode和若干个DataNode组成。
其中NameNode作为主服务器,管理文件系统的命名空间和处理客户端的文件读写操作。集群中的DataNode管理
存储的数据。
——HDFS中的Namenode主节点
——HDFS中的Datanode节点
当文件进行存储时,文件被划分为若干个数据块,并且这些数据块会被放在集群的各个节点(DataNode)上。