
"Hadoop YARN源码解析:MR程序提交流程与节点运行过程分析"
下载需积分: 5 | 194KB |
更新于2024-01-05
| 80 浏览量 | 举报
收藏
本文主要是对Hadoop中YARN(Yet Another Resource Negotiator)源码的解析进行总结和概述。
YARN是Hadoop中用于资源管理和作业调度的框架,它负责管理和分配集群中的资源,并将作业调度到可用的计算资源上。在一次完整的作业提交过程中,涉及到多个组件和步骤,下面将对这些步骤进行概述。
作业提交首先是将作业程序提交到客户端所在的节点,然后由YarnRunner运行。接下来的步骤如下:
1. 创建一个Application,将其提交给ResourceManager(RM)。这个Application表示一个作业,由ResourceManager进行管理和调度。
2. 提交作业所需的资源给ResourceManager,包括计算资源和存储资源等。
3. 资源提交完毕后,申请运行MapReduce Application Master(MRAppMaster),该MRAppMaster将负责管理和调度作业的执行。
4. MRAppMaster将用户的请求初始化为一个Task,并开始领取Task任务。对于NodeManager来说,它需要进行两个操作:创建容器(Container)和将作业资源下载到本地。
5. MRAppMaster申请运行MapTask容器,由NodeManager创建容器并启动相应的程序脚本。
6. NodeManager向ResourceManager申请运行ReduceTask任务,并执行相应的NodeManager的ReduceTask任务。
7. ReduceTask从MapTask获取相应分区的输出数据。
8. 程序运行完成后,MRAppMaster会向ResourceManager注销自己。
以上就是整个作业提交和执行的大致流程。通过对源代码的分析,可以更加深入地了解其中的细节和实现原理。
需要注意的是,本文只是对YARN源码解析的概述和总结,具体的源码内容并没有提及。如果需要深入了解源码细节,建议查看相关的文档和源码。
相关推荐


















迅捷的软件产品制作专家
- 粉丝: 1402
最新资源
- H3C全系列产品手册速查汇总与介绍
- Python库secretfinder-0.2.1: PyPI官网下载与云原生应用
- 使用App Inventor开发自定义WiFi通信App
- Python库python-bol-api的最新版本发布!
- 《Satisfactory》SML.smod模组v3.3.0版本更新
- 波形梁钢护栏现场质量检验方法及标准
- 钻孔桩终孔灌注前现场检查记录表使用指南
- 舟山群岛新区矢量边界shp文件解析
- 白洋淀湖泊矢量数据在ArcGIS中的应用教程
- Satisfactory v3.3.0 Mod管理器与SML插件升级
- 人力资源管理师考试资料大合集,历年真题与重点解析
- 2022全国省市区县完整列表及目录解析
- 南宁市道路矢量数据集详细分类及shp格式下载
- NURBS样条线算法推导与Python编程实现教程
- 2022年年会主持人串词稿精选
- IOS和平精英追踪绘制技术深度解析
- 荣耀星球:基于微信小游戏的个人开发框架
- 强制措施条文检测记录:详细资料与分析
- RedHat系统中NTP时间同步配置教程
- 计算机网络实验报告集:协议与组网实践
- 图解网络教程:小林coding的暗黑风格解析
- 探索澄湖矢量数据在ArcGIS中的应用方法
- STM32F103CBT6+MP2625+CC1101+GC65 GPS Track板原理图及PCB设计
- ESFramework2.0源码深度解析及通信框架应用示例