Greenplum峰会 2020 第一场 精彩回顾

本文回顾了Greenplum峰会上的精彩内容,涵盖了Greenplum在开源社区、大规模并行数据分析以及多云环境中的优势。讨论了在Kubernetes上部署Greenplum的步骤,以及在公共云中的成本节约、数据安全和灾难恢复解决方案。此外,还分享了Dell IT如何利用Greenplum构建关键业务数据湖,以及如何通过Greenplum回收弹性计算资源以实现绿色环保。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

获得技术资料内容,请访问Greenplum中文社区网站

为什么Greenplum如此受欢迎?主要基于以下三个原因:

  1. 蓬勃发展的开源社区的支持

  2. 支撑大规模并行数据分析的优异性能

  3. 多云,基础架构原生支持


其中第三条是我们于7月29日进行的Greenplum峰会第一场活动的重点。 在本专题中,我们针对此专题,讨论了多云对Greenplum社区的真正意义。 有些人认为,多云只是一个抽象层,可以使软件部署起来更容易,而不用受基础架构的束缚。但是,这样会使你无法享受很多基础架构的原生优势。对于Greenplum社区,多云意味着针对给定的基础架构优化部署。换句话说,Greenplum的目标是不管你选择在哪部署,都能获得一个独特的,差异化的体验。2020 Greenplum峰会上的话题为大家提供了多个实用干货。 欢迎点击文章底部的“阅读原文”获取峰会的精彩视频和PPT,回顾峰会的精彩。

为了真正了解数据的未来,Greenplum工程总监Divya Bhargov向我们介绍了软件定义数据中心的价值:
 

将软件定义的数据中心扩展到数据
(Expanding the Software Defined Data Center to Data)

VMware以创建软件定义的数据中心而闻名。Greenplum是一个横向扩展(scale-out),share-nothing的大规模并行数据平台。通过将Greenplum添加到基于vSphere的私有云中,可以创建以数据为中心的私有云,并将软件定义数据中心的概念扩展到涵盖数据架构。其中的好处包括:

 

  1. 消除对专有硬件的依赖性——由于所有的硬件都已商品化,无需进行昂贵的培训学习专有的硬件技能;

  2. 简化技术管理——数据可被监控,系统可以方便更新,存储资源可以被统一调度分配;

  3. 自动化和编制——软件比人类更可靠。SDDC在各方面都更加敏捷,响应更为迅速。



284ef7ab-7769-48a6-b96b-b8124189a8a6.png
 

 


接着,首席产品经理Oz Basarir展示了如何将从SDDC中学到的原则应用于在Kubernetes中运行的Greenplum:

 

 

在Kubernetes上部署Greenplum的六个步骤

Six Steps to Deploy Greenplum on any Kubernetes 

本话题详细介绍在Kubernetes上部署Greenplum的流程和所需构件。类似于部署常见的非24×7服务,例如开发环境,自动化的CI / CD pipeline,动态扩展计算和存储,我们要先将镜像置入到容器中(如Docker,Harbor,GCR和ECR),进一步的,Oz将演示Kubernetes如何访问镜像以创建Greenplum Operator和其他容器,然后,Oz会介绍如何创建其他组件,如MADlib,PXF和GPText等。Kubernetes是著名的配置项繁多,因此你将了解在拓扑和存储配置等方面如何做出的选择。通过本话题,你将可以轻松地在Kubernetes上部署Greenplum。



2f345c82-6fb2-4f32-9a2b-137ff4e9b620.png
 

 

 

首席工程师Jon Roberts向我们展示了在公共云市场中运行的基础架构原生功能:

 

 

拥抱公共云以节省成本,提供云原生功能和多云功能

Embrace the Public Cloud for cost savings, cloud-native features, & multi-cloud ability 

在公共云中可以获得的最显而易见的好处是:即付即用(pay-as-you-go)定价。在公共云上部署Greenplum,你只需: 

 

  1. 支付每小时消耗的CPU和内存,并可以通过简单的命令行工具进行扩容和缩容。 

  2. 仅需购买所需的存储空间。随着数据需求的增长,扩展你的存储空间。了解简单的命令行工具如何在不影响用户的情况下扩展存储。 

  3. 暂停和恢复集群可通过简单的命令行工具进行,来节省IaaS成本。



810bf99d-db48-4158-b0b4-dd0e9d7571d0.png
 

 

 

执行总监George Billman谈到了Greenplum的便捷和数据的安全性:

 

 

使用SecuPI保护云中的数据

Securing Data in the Cloud with SecuPI

云计算使每个人都能对数据和基础架构资源进行自助式和按需访问。但这有一个缺点,企业IT领导者需要注意这种无摩擦访问带来的额外攻击手段。SecuPI解决方案为Greenplum部署提供了无缝的补充,从而在不影响数据安全性的情况下实现了云计算的便利性。数据安全从未像现在这样重要!



f7e3821a-f4e9-4152-a2f5-56775c01ba2d.png
 

 

 

高级数据工程师Ji Lim谈到利用云进行灾难恢复以提供令人难以置信的强大解决方案:

 

 

按需灾难恢复解决方案

On-Demand Disaster Recovery Solution

曾经,灾难恢复是非常昂贵。但如今,公有云改变了游戏规则。在任何公有云上部署Greenplum,你就可以享受这样的轻松便捷!


了解如何通过简单的命令行工具改变你的备份方式,以及如何轻松,简单地创建低成本的灾难恢复解决方案。



83463537-6618-4708-b3af-78043b5211e6.png
 

 

 

首席数据平台架构师兼杰出工程师Darryl Smith和Greenplum平台首席主管Praveen Gorthy谈到了他们使用Greenplum提供关键业务数据湖的经验:

 

 

Greenplum社区聚焦:Dell IT

Greenplum Community Spotlight: Dell IT

如果你是戴尔 IT,你会如何存储,查询和处理所有企业数据?当然是使用VMware Tanzu Greenplum!向戴尔IT专业人员学习第一手资料:为什么5年前选择VMware Tanzu Greenplum作为其数据湖的基础?它是如何迅速增长到340 TB以上?演讲者将分享有关最近的一次升级的详细信息,以及新的NVMe Dell硬件如何将已经非常快的系统的性能提高15倍。



17fe582d-7478-4a4c-bedd-9e022c345f27.png
 

 

 

软件工程师Jason Vigil讨论了扩展资源如何不仅节省了成本,还保护了环境:

 

 

走向绿色:使用Greenplum for Kubernetes回收弹性计算资源
Going Green: Recycling Elastic Compute Resources with Greenplum for Kubernetes

在Kubernetes上运行Greenplum具有许多运营优势,包括动态分配计算资源的功能。如何做到呢?该话题将演示如何为重要的,对时间要求严格的工作负载扩展CPU /内存分配,以及如何为稳定状态缩减负载。我们还将探讨第三种情况:根本不需要运行查询的时候。我们将演示如何“缩放到零”,该技术可释放计算资源用于其他工作负载,同时仍保留集群状态和数据。最后,你将学习如何将计算和存储区分开来轻松地扩展以响应用户需求。



05761413-e47c-44e4-b2c7-1c34d1d6dadd.png

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值