大数据MaxCompute教程(阿里云离线数仓项目)学习笔记20231128

本文介绍了阿里云的DataWorks与MaxCompute,作为企业级云数据仓库,MaxCompute提供全托管服务以处理海量数据,而DataWorks则提供了全链路开发治理平台。两者结合支持ETL、SQL、分布式计算模型,帮助企业高效分析数据,降低成本并保证数据安全。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

学习视频

2.2.x DataWorks 和 MaxCompute

DataWorks 基于阿里云MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。
MaxCompute 是面向分析的企业级SaaS模式云数据仓库,以Serberless框架提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您可以经济并高效的分析处理海量数据。数以万计的企业正基于MaxCompute进行数据计算与分析,将数据高效转换为为业务洞察。

MaxCompute:
SQL MR 图计算 机器学习
MaxCompute Engine 统一计算引擎
伏羲:分布式调度系统
盘古:分布式文件系统
存储集群 存储集群 存储集群

盘古👉Hadoop中的HDFS
伏羲👉Hadoop中的YARN
MaxCompute👉MR、Tez等计算引擎

MaxCompute和DataWorks一起向用户提供完善的ETL和数仓管理能力,以及SQL、MR、Graph等多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,能降低企业成本,保障数据安全

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值