Mapreduce基础知识

1、MapReduce定义?

       MapReduce是一个分布式运算程序的编程框架。核心功能是将用户编写的业务逻辑代码和自带默认组件整合成完整的分布式运算程序。并发运行在一个Hadoop集群上。

2、MapReduce的优缺点?

      优点:

     (1)MapReduce易于编程:它简单的实现一些接口就可以完成一个分布式的程序。

     (2)良好的扩展性

     (3)适用PB以上海量的数据离线处理

    缺点:

    (1)不擅长实时计算

    (2)不擅长流式计算(输入的数据集是静态的)

    (3)不擅长DAG(有向图)计算

3、MapReduce核心编程

需求:统计其中每个单词出现的总次数

           查询结果:a-p一个文件,q-z一个文件

      上图体现了MapReduce的实际工作的过程以及原理,思考每一步的细节,才能掌握MapReduce。笔记虽少,但都是认为学习的过程中非常核心的概念以及原理。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值