什么是Spark、Spark特点、Spark Streaming和Storm的区别

最新推荐文章于 2025-06-20 10:59:17 发布

你好，果儿

最新推荐文章于 2025-06-20 10:59:17 发布

阅读量2.8k

点赞数 4

CC 4.0 BY-SA版权

分类专栏： Spark 文章标签： Spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43358229/article/details/89502166

Spark是一个内存计算的开源框架，专注于大数据处理，提供离线批处理、交互式查询、实时流计算等多种功能。与Hadoop结合，成为大数据热门解决方案。Spark以其高速度、多语言API和多种运行模式脱颖而出。相比Storm，Spark Streaming是基于RDD的批量流处理，虽不是严格意义上的实时，但具有更高吞吐量，并能与Spark生态系统无缝整合，适合对实时性要求不那么高的场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Spark是一个基于内存的开源计算框架

Spark主要应用于大数据的计算,而Hadoop将主要用于大数据的存储（HDFS、HIVE、 Hbase等），Saprk+Hadoop组合，是未来大数据领域最热门的组合.

Apache官方给出的定义是：通用的大数据快速处理引擎

Spsrk使用Spark RDD、Spark SQL、Spark Streaming、Mllib、GraphX成功的解决了大数据领域中：离线批处理、交互式查询、实时流计算、机器学习与图计算等最重要的任务和问题
Spark除了一站式的特点之外，另一个最重要的特点，就是基于内存进行计算，从而让它的速度可以达到MR、Hive的数倍甚至数十倍
Spark导图
在这里插入图片描述 Spark特点
快速
Spark是基于内存的大数据处理框架
Spark具有优秀的作业调度策略
简洁易用
Spark提供了支持多种语言的API，如Scala、Java、Python、R等
Spark是基于Scala语言开发的，由于Scala是一种面向对象的、函数式的静态编程语言
通用
在这里插入图片描述
多运行模式
本地模式

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。