各角色职责介绍与梳理
主角色:Namenode
- Namenode是Hadoop分布式文件系统的核心,架构中的主角色
- Namenode维护和管理文件系统元数据,包括名称空间目录树结构、文件和块的位置信息、访问权限等信息。
- 基于此,Namenode成为了访问HDFS的唯一入口。
- Namenode内部通过内存和磁盘文件两种方式管理元数据。
- 其中磁盘上的元数据文件包括Fsimage内存元数据镜像文件和edits log(Journal)编辑日志。
从角色:Datanode
- Datanode是Hadoop HDFS中的从角色,负责具体的数据块存储。
- Datanode的数量决定了HDFS集群的整体数据存储能力。通过和Namenode配合维护着数据块。
主角色辅助角色:secondarynamenode
- secondary Namenode充当Namenode的辅助节点,但不能替代Namenode。
- 主要是帮助主角色进行元数据文件的合并动作。可以通俗的理解为主角色的“秘书”。
Namenode职责
- Namenode仅存储HDFS的元数据:文件系统中所有文件的目录树,并跟踪整个集群中的文件,不存储实际数据。
- Namenode知道HDFS中任何给定文件的块列表及其位置。使用此信息Namenode知道如何从块中构建文件
- Namenode不支持久化存储每个文件中各个块所在的Datanode的位置信息,这些信息会在系统启动时从Da