file-type

"Hadoop YARN源码解析:MR程序提交流程与节点运行过程分析"

PDF文件

下载需积分: 5 | 194KB | 更新于2024-01-05 | 80 浏览量 | 2 下载量 举报 收藏
download 立即下载
本文主要是对Hadoop中YARN(Yet Another Resource Negotiator)源码的解析进行总结和概述。 YARN是Hadoop中用于资源管理和作业调度的框架,它负责管理和分配集群中的资源,并将作业调度到可用的计算资源上。在一次完整的作业提交过程中,涉及到多个组件和步骤,下面将对这些步骤进行概述。 作业提交首先是将作业程序提交到客户端所在的节点,然后由YarnRunner运行。接下来的步骤如下: 1. 创建一个Application,将其提交给ResourceManager(RM)。这个Application表示一个作业,由ResourceManager进行管理和调度。 2. 提交作业所需的资源给ResourceManager,包括计算资源和存储资源等。 3. 资源提交完毕后,申请运行MapReduce Application Master(MRAppMaster),该MRAppMaster将负责管理和调度作业的执行。 4. MRAppMaster将用户的请求初始化为一个Task,并开始领取Task任务。对于NodeManager来说,它需要进行两个操作:创建容器(Container)和将作业资源下载到本地。 5. MRAppMaster申请运行MapTask容器,由NodeManager创建容器并启动相应的程序脚本。 6. NodeManager向ResourceManager申请运行ReduceTask任务,并执行相应的NodeManager的ReduceTask任务。 7. ReduceTask从MapTask获取相应分区的输出数据。 8. 程序运行完成后,MRAppMaster会向ResourceManager注销自己。 以上就是整个作业提交和执行的大致流程。通过对源代码的分析,可以更加深入地了解其中的细节和实现原理。 需要注意的是,本文只是对YARN源码解析的概述和总结,具体的源码内容并没有提及。如果需要深入了解源码细节,建议查看相关的文档和源码。

相关推荐

迅捷的软件产品制作专家
  • 粉丝: 1402
上传资源 快速赚钱