HDFS体系结构----checkpoint检查点机制相关属性

最新推荐文章于 2024-07-03 14:44:32 发布

Little Rain～

最新推荐文章于 2024-07-03 14:44:32 发布

阅读量749

点赞数

CC 4.0 BY-SA版权

分类专栏： Hadoop

本文链接：https://blog.csdn.net/zy_remarkable/article/details/81346574

本文介绍了HDFS的checkpoint检查点机制，包括默认的1小时checkpoint周期，每1百万次txid操作触发检查点，以及每隔60秒检查txid次数的设置。这些配置确保了HDFS的稳定性和数据一致性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.checkpoint周期，默认为1小时。

<name>dfs.namenode.checkpoint.period</name>

两个定期检查点之间的秒数。

</description>

</property>

2.txid的次数达到1百万次，也执行checkpoint；与周期无关

<name>dfs.namenode.checkpoint.txns</name>

无论'dfs.namenode.checkpoint.period'是否已经过期，Secondary

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Little Rain～

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

HDFS中的checkpoint(检查点)

weixin_47681855的博客

09-30

2014

checkpoint机制当客户端向NN发送请求以后在NN当中的内存区的FsImage对象(元数据–内存对象) 会及时更新元数据信息(updataNode) 但问题是元数据为了安全起见会进行持久化的存储,将内存中的文件序列化到磁盘当中,如果用户每次就行访问都进行持久化的话,又太消耗系统资源,基于这一问题就产生了checkpoint机制问题之所在: 当客户端对HDFS上的数据进行频繁操作以后, 数据的元数据会发生变化 , NameNode可以FSImage.saveImage()修改内存对象数据 ,

Day06-HDFS的体系结构(namenode作用、datanode作用、block)、fsimage文件、edits文件和checkpoing检查点机制

长安一片月的博客

06-07

647

HDFS的体系结构(namenode作用、datanode作用、block)、fsimage文件、edits文件和checkpoing检查点机制和Namenode开启过程HDFS的体系结构------------------------- 1.namenode[守护进程]作用：管理文件系统名称空间；【fsimage元数据镜像文件】管理客户端对文件的访问。【edits操作文件...

参与评论您还未登录，请先登录后发表或查看评论

HDFS中的NameNode 检查点问题

wyj1023405602的博客

08-10

837

今天在登录CDH后发现HDFS上存在运行状况报警由于CM会默认每隔1小时SNN会执行checkpoint操作，初步分析是SNN的checkpoint操作存在问题引起，查看SNN日志，发现如下报错。很明显是由于SNN和NN的集群ID对不上导致的，分别查看NN所在节点（此处节点node0，文件路径/dfs/nn/current）和SNN所在节点（此处节点node1，文件路径/dfs/snn/current）的version文件确认。 ...

hdfs中CheckPoint(检查点)

Dimples.

11-18

3552

检查点节点 NameNode使用两个文件来保留其命名空间：fsimage，它是命名空间和编辑的最新检查点，是自检查点以来命名空间更改的日志（日志）。当NameNode启动时，它会合并fsimage和edits journal以提供文件系统元数据的最新视图。NameNode然后用新的HDFS状态覆盖fsimage并开始一个新的编辑日志。 Checkpoint节点定期创建命名空间的检查点。它从活...

HDFS之checkpoint机制---大数据分析学习笔记5

qq_41554337的博客

07-26

1498

Checkpoint（检查点）： HDFS这样的分布式文件系统，对文件数据的修改不是直接写回到磁盘的，很多操作是先缓存到内存的Buffer中，当遇到一个检查点Checkpoint时，系统会强制将内存中的数据写回磁盘，当然此时才会记录日志，从而产生持久的修改状态。 1.Namenode上面有些什么数据：笔记2中提到namenode管理结点主要有下面两类文件 edits：HDFS操作的日志记录，没此...

Hadoop HDFS系统检查点过程

tus00000的博客

10-10

1402

首先NameNode相应Secondry NameNode的请求，将自身的editslog文件和fsimage文件发送给Secondry NameNode，同时创建一个新的editslog，从此将日志内容记录到新的editslog文件中。Secondry NameNode收到后将fsimage文件加载到自己的内存中，并应用editslog文件中的内容，之后生成一个新的fsimage文件。随后将新的...

大数据技术之Hadoop-HDFS用户指南

weixin_42137586的博客

11-22

809

HDFS用户指南目的概览前期准备Web页面Shell 命令DFSAdmin命令Secondary NameNode检查点节点备份节点导入检查点均衡器机架识别安全模式目的本文档是使用Hadoop分布式文件系统（HDFS）作为Hadoop集群的一部分或作为独立的通用分布式文件系统的用户的起点。尽管HDFS旨在在许多环境中“正常工作”，但是了解HDFS的工作机制可极大地帮助改进特定集群上的配置和进行...

HDFS-HDFS体系架构

yc_hen的博客

02-08

4315

一、体系架构 HDFS 采用的是master/slaves主从结构模型来管理数据，这种结构模型主要由四个部分组成：Client(客户端)、Namenode(名称节点)、Datanode(数据节点)和SecondaryNamenode(第二名称节点，辅助Namenode)。一个真正的HDFS集群包括一个Namenode和若干数目的Datanode。Namenode是一个中心服务器，负责管理文件系统...

《HDFS 1》--HDFS的简介 / 设计思想、HDFS体系结构、DataNode掉线判断时限参数、查看镜像文件和日志文件

yk_3215123的博客

05-07

340

1、HDFS的简介/设计目标 1）硬件错误硬件组件错误是常态，而非异常情...

hdfs读写机制及其checkpoint机制

悠忧南士

05-15

277

https://blog.csdn.net/u014253445/article/details/77574319

HDFS中几个重要的工作机制和原理（1）

weixin_44261653的博客

04-22

261

简单总结一下HDFS中几个重要的工作机制和原理一.检查点机制 1.首先SecondaryNamenode会请求Namenode停止使用正在编辑的editslog文件，Namenode会创建新的editslog文件并且更新seed_txid文件 2.SecondaryNamenode会通过http获取Namenode上的fsimage文件和editslog文件。 3.SecondaryNamenode会先将fsimage文件加载到内存中并逐步分析editslog文件中的数据，然后进行合并操作写入到新文件f

HDFS元数据管理/磁盘清理维护

someInNeed的博客

11-23

2599

文件、目录自身的属性信息，例如文件名，目录名，修改信息等文件记录的信息的存储相关的信息，例如存储块信息，分块情况，副本个数等记录 HDFS 的 Datanode 的信息，用于 DataNode 的管理。

HDFS中的checkpoint（ 检查点 ）的问题

weixin_30352191的博客

08-05

1599

1、问题的描述由于某种原因，需要在原来已经部署了Cloudera CDH集群上重新部署，重新部署之后，启动集群，由于Cloudera Manager 会默认设置dfs.namenode.checkpoint.period和dfs.namenode.checkpoint.txns分别是1个小时和1000000。只要达到这两个条件之一，secondarynamenode会执行checkp...

Hadoop设置Checkpoint点条件

Enche的博客

02-23

1126

secondary namenode在合并namenode上的fsimage和edits的动作是达到某种条件时才会进行的，一般为到某个时间点或者操作次数达到某个特定的值时会进行checkpoint 在配置checkpoint条件时，需要在hdfs-site.xml进行设置 1、每隔3600秒执行一次 <property> <name>dfs.namenod...

Hadoop3.2.0 HDFS 用户指南

张伯毅的专栏

02-19

9913

HDFS用户指南目的概览先决条件 Web界面 Shell命令 DFSAdmin命令 Secondary NameNode 检查点节点备份节点导入检查点 负载均衡机架意识安全模式 fsck的 fetchdt 恢复模式升级和回滚 DataNode热插拔驱动器文件权限和安全性可扩展性相关文档目的本文档是使用Hadoop分布式文件系...

【完全分布式Hadoop】（二）HDFS、YARN以及HA高可用概念介绍

u013429010的博客

10-30

1009

一、HDFS-Hadoop分布式文件系统 HDFS 采用Master/Slave的架构来存储数据，这种架构主要由四个部分组成，分别为HDFS Client、NameNode、DataNode和Secondary NameNode。下面我们分别介绍这四个组成部分 1、Client：就是客户端。 1）文件切分。文件上传 HDFS 的时候，Client 将文件切分成一个一个128M的Block，然...

【大数据Hadoop】HDFS-HA模式下Checkpointer机制代码分析

如切如磋，如琢如磨，臻于至善。

03-26

1083

Namenode一方面为了提供客户端的响应速度，另外一方面为了提高集群的可靠稳定性（断电后数据不丢失），所以在内存中存储全量的文件系统元数据，定期的将元数据信息持久化到磁盘中(fsimage_0000000000000102359)，对于此持久化时间点后产生的元数据操作（创建，修改，删除等），都会记录到edits_xxx-xxx文件中，对于正在执行元数据操作过程中的操作，会记录在一个edits_inprogress_xxxx文件中。此过程就是将 fsImage 上传给 active namenode节点。

HDFS的Checkpoint 执行流程

limenghao2002的博客

07-03

604

HDFS的Checkpoint 执行流程

HADOOP 离线计算机系统【二】HDFS详解

wzq18845280610的博客

11-26

1689

HDFS详解******HDFS基本概念篇******1.HDFS前言2. HDFS的概念和特性******HDFS基本操作篇******3. HDFS的shell(命令行客户端)操作3.1 HDFS命令行客户端使用3.2 命令行客户端支持的命令参3.2 常用命令参数介绍******HDFS原理篇******4.hdfs的工作机制**详细请看：HDFS 详解:** [https://blog.csdn.net/wzq18845280610/article/details/110188742](https:

有些面试官会问到大数据相关的知识，请帮我系统的补充一下相关知识

最新发布

02-27

<think>嗯，用户之前问过后端系统安全性的问题，现在转向大数据相关知识，可能是为了应对技术面试。需要判断用户的需求层次，是刚入门还是有一定基础需要系统梳理。用户提到面试官会问，所以需要覆盖常见的大数据面试考点，同时结构清晰，便于记忆。首先，大数据的基础概念是必须的，比如4V特征，常见工具分类。用户可能需要区分不同技术的适用场景，比如Hadoop和Spark的区别。然后是核心技术组件，HDFS、MapReduce、YARN，这些是Hadoop生态的核心，得详细解释原理和架构。数据处理方面，批处理和流处理的对比很重要，包括对应的框架如Flink和Spark Streaming。数据存储部分，要覆盖数据仓库、数据湖、湖仓一体，以及NoSQL数据库的类型和适用场景。OLAP引擎如Kylin、Doris，可能也是高频问题。数据治理涉及数据质量、元数据管理、数据安全，这些在实战中很重要，面试可能会问实际应用案例。资源调度和协调服务，比如YARN和ZooKeeper，需要解释其作用。分布式理论如CAP定理、一致性协议，是理论基础，常被问到。性能优化技巧，如数据倾斜处理、Shuffle优化，都是实际开发中的痛点，面试官喜欢考察解决问题的能力。实时数仓和Lambda/Kappa架构的区别，以及数据湖的ACID特性，可能是较新的考点。项目经验部分，用户可能需要举例如何描述项目，如何突出技术难点和解决方案。最后，面试题举例能帮助用户模拟练习，但需要注意不要泄露具体题目，而是提供思路。需要确保内容全面，层次分明，同时使用用户熟悉的数学公式和代码示例，符合之前的格式要求。还要检查是否覆盖了Hadoop生态、Spark、Flink、数据存储、治理、分布式理论、性能优化等关键领域，确保系统性。</think>以下是系统化的大数据知识体系补充，包含基础概念、技术栈、常见考点及公式化表达： --- ### **一、大数据基础理论** 1. **4V特征公式化** $$大数据 = \int_{Volume}^{Variety} (Velocity \times Veracity) \, dt$$ - **Volume**：数据规模（PB/EB级） - **Variety**：数据多样性（结构化/半结构化/非结构化） - **Velocity**：数据生成速度（如Kafka处理百万级TPS） - **Veracity**：数据质量（需满足$数据可信度 \geq 99.99\%$） 2. **CAP定理** $$\text{分布式系统} \subseteq \{一致性(C), 可用性(A), 分区容错性(P)\}^2 - \{(C,A,P)\}$$ 典型取舍： - HBase选CP - Cassandra选AP --- ### **二、核心技术栈** #### **1. 存储层** - **HDFS** $$\text{文件分块}= \lceil \frac{\text{FileSize}}{\text{BlockSize(128MB)}} \rceil$$ 核心机制： - 副本放置策略（机架感知） - 写入流水线（Pipeline Write） - **列式存储** Parquet/ORC文件格式，压缩率比较： $$\frac{\text{ORC压缩率}}{\text{Parquet压缩率}} \approx 1.2 \sim 1.5$$ #### **2. 计算引擎** - **MapReduce** $$\text{Job} = \bigcup_{i=1}^n \left( \text{Map}_i \rightarrow \text{Shuffle} \rightarrow \text{Reduce}_j \right)$$ 优化点： - Combiner预聚合 - 数据本地化（Data Locality） - **Spark** $$\text{DAG} = \text{RDD} \xrightarrow{transformation} \text{RDD}' \xrightarrow{action} \text{Result}$$ 内存计算优势： $$\frac{\text{Spark性能}}{\text{MapReduce性能}} \approx 10 \times \quad (\text{迭代算法场景})$$ - **Flink** 实时计算模型： $$\text{EventTime} = \text{ProcessingTime} - \text{Watermark}$$ 窗口函数： ```java dataStream.keyBy(...) .window(TumblingEventTimeWindows.of(Time.minutes(5))) .aggregate(new MyAggregateFunction()); ``` #### **3. 资源调度** - **YARN** 资源分配公式： $$\text{Container资源} = \langle vcores, memory \rangle \quad s.t. \quad \sum \leq \text{集群总资源}$$ - **K8s调度** Pod资源限制： ```yaml resources: limits: cpu: "4" memory: 8Gi ``` --- ### **三、高频面试考点** #### **1. 数据倾斜** - **解决方案** - 加盐分桶：$key' = key + \text{random}(1,N)$ - MAPJOIN优化：$\text{小表} \bowtie_{\text{Broadcast}} \text{大表}$ #### **2. Shuffle优化** - Spark参数调优： ```python spark.conf.set("spark.shuffle.file.buffer", "1MB") spark.conf.set("spark.reducer.maxSizeInFlight", "48MB") ``` #### **3. 数据一致性** - HBase的WAL机制： $$\text{写入顺序} = \text{MemStore} \oplus \text{HLog}$$ #### **4. 流批一体** - Lambda架构 vs Kappa架构： $$ \text{Lambda} = \text{BatchLayer} \oplus \text{SpeedLayer} \\ \text{Kappa} = \text{StreamLayer} \otimes \log(\text{EventTime}) $$ --- ### **四、大数据生态工具链** ```mermaid graph TD A[HDFS] --> B(MapReduce) A --> C(Spark) A --> D(Hive) D --> E[LLAP] C --> F{执行模式} F --> F1(Standalone) F --> F2(YARN) F --> F3(K8s) D --> G[Tez] C --> H[SparkSQL] H --> I[DataFrame API] ``` --- ### **五、实战场景分析** #### **案例：实时用户行为分析** 1. **数据流** ```plaintext UserLog --Kafka--> Flink --Window Agg--> HBase --Presto--> BI报表 ``` 2. **关键技术点** - 精确一次语义（Exactly-Once）：Flink Checkpoint + Kafka事务 - 维表关联：Async I/O + LRU Cache --- ### **六、学习路径建议** 1. **理论奠基** - 《Hadoop权威指南》 - 《Designing Data-Intensive Applications》 2. **动手实践** - 使用Docker部署Hadoop集群 - 实现WordCount的MapReduce/Spark/Flink三版本 3. **面试准备** - 掌握SQL窗口函数： ```sql SELECT user_id, RANK() OVER (PARTITION BY city ORDER BY sales DESC) FROM orders; ``` - 理解LSM树（HBase底层存储结构） --- 通过此知识体系，可以系统化回答以下高频问题： - "MapReduce和Spark的区别是什么？" - "如何处理数据倾斜？" - "Flink如何实现精确一次语义？" - "HDFS的读写流程是怎样的？"