一、Hadoop简介 和 Hadoop结构介绍

本文介绍了Hadoop的基础知识,包括Hadoop的定义和组成结构。Hadoop是一个由Apache开发的分布式系统架构,用于大规模数据的存储和分析计算。其主要组成部分包括HDFS(分布式文件系统)、YARN(资源管理和调度系统)和MapReduce(分布式运算系统)。HDFS由NameNode和DataNode构成,而YARN涉及ResourceManager、NodeManager和ApplicationMaster。MapReduce通过Map和Reduce阶段进行数据处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、Hadoop 是什么

  • Hadoop是现阶段数据开发的基础,Hadoop通常是指一个更广泛的概念----Hadoop生态圈(基于或关于Hadoop的大数据开发的各种软件环境)
  • Apache公司使用Java语言编写的开源的分布式系统的基础架构
  • 分布式就是,当储存数据很多很大时,一台机器储存不了时,需要将数据切成块,使用多台计算机分布式储存这些数据。
  • 由于专业的大数据的服务器比较昂贵,Hadoop解决了,在计算机级别服务器上的,大规模数据的存储分析计算
  • Hadoop 官网

2、Hadoop 组成结构

  • HDFS :分布式文件储存系统
  • Yarn资源管理和调度系统
  • MapReduce :分布式运算系统
  • Hadoop 1.x 与 Hadoop 2.x 区别

在这里插入图片描述

2.1、 HDFS 架构

  • NameNode :的主要工作就是和Client(客户端)打交道,接受Client
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值