
Hadoop Yarn:新MapReduce框架解析
649KB |
更新于2024-08-28
| 56 浏览量 | 举报
收藏
"Hadoop新MapReduce框架Yarn详解"
Hadoop MapReduce V2,也称为YARN(Yet Another Resource Negotiator),是Hadoop生态系统中针对原MapReduce框架的一次重大改进,旨在解决旧框架在大规模分布式计算环境中的性能瓶颈和扩展性问题。原MapReduce架构在处理大量作业和更大规模集群时暴露出了一些问题,如单点故障、资源管理效率低下以及任务调度不灵活等。
在旧的MapReduce框架中,JobTracker承担了双重职责:作业管理和资源调度。这导致了以下几个主要问题:
1. 单点故障:JobTracker是整个框架的核心,如果它发生故障,整个系统将受到影响,这是明显的单点故障问题。
2. 资源消耗过高:JobTracker既要监控和调度所有作业,还要处理心跳信息,当作业数量增加时,JobTracker的内存开销会急剧上升,增加了系统崩溃的风险。
3. 简单的资源模型:TaskTracker仅以map和reduce任务的数量来分配资源,忽略了CPU和内存的具体需求,可能导致资源分配不合理,甚至引发内存溢出(OOM)。
为了解决这些问题,YARN引入了全新的架构设计:
1. 分离资源管理和作业调度:YARN将JobTracker的功能拆分为两个独立的组件:ResourceManager(RM)和ApplicationMaster(AM)。ResourceManager负责全局资源管理,而ApplicationMaster专注于作业特定的调度和监控。
2. 分布式应用管理:每个作业都有自己的ApplicationMaster,与ResourceManager协商获取资源,然后监控和管理该作业的所有任务,这样避免了单点故障。
3. 动态资源分配:TaskTracker被替换为NodeManager,它们报告可用资源给ResourceManager,ResourceM
相关推荐










weixin_38692202
- 粉丝: 3
最新资源
- C#进销存系统开发教程(含MSSQL数据库设计)
- 掌握uC/OS II 实时操作系统,嵌入式学习必备
- 模拟电路设计课程资料及电子课程概览
- JSP网上书店项目:实现与源码解析
- 王涛力荐:深入学习.NET的必读书籍
- 《代码大全》CHM版:C#程序员必读经典
- C#图书管理系统:免费资源分享与代码下载
- C语言实践教程:实验题源代码解析
- HA_YambMP4Tools:无需重新编码的快速MP4合并软件
- Reflector反编译工具插件整合包发布
- 010 Editor中文版:强大的二进制文件编辑工具
- Oracle数据库DBA技术精粹解析
- C#编程实现自动重启、定时关机与开机自运行技巧
- 精选100张PPT幻灯片背景图片,打造专业演示效果
- Solid Converter PDF 6.0:卓越的文档转换工具
- IOCP_API库测试程序:采用Echo测试方法
- 基于Matlab的WiMAX仿真源码程序详解
- 谭浩强《数据结构》第九章代码解析
- Oracle课程设计案例精编详细解析
- 批量转换图片为图标格式的工具介绍
- 应用程序乱码解决方案NTLEA工具包发布
- C#权限管理源码解析:核心组件及其实现
- Puppy Linux的pup2usb工具:轻松安装到硬盘与移动设备
- 深入解析C语言数据结构课本第八章代码