自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 Zookeeper

Zookeeper从设计模式角度来理解:是一个基于观察者模式设计的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应。zookeeper=文件系统+通知机制。

2024-07-01 14:13:05 616

原创 Spark Streaming

SparkStreaming底层还是SparkCore,就是在流式数据处理中进行的封装。窗口:数据的范围,窗口是可以移动的,但是窗口的移动有幅度的,默认移动幅度就是采集周期。第一个参数:数据范围(时间) 第二个参数:表示窗口的移动幅度。SparkStreaming是微批量,准实时的数据处理框架。DStream中的print方法类似于RDD行动算子。注意:数据窗口范围比窗口移动幅度小,数据可能丢失。window方法可以改变窗口的数据范围。从数据处理延迟的角度。

2024-06-28 15:48:52 331

原创 SparkSQL

介绍了SparkSQL

2024-06-26 20:34:48 321

原创 RDD-依赖关系与RDD持久化

介绍了RDD的依赖关系和持久化存储,并做了补充

2024-06-23 20:37:31 614

原创 Spark-RDD行动算子

介绍Spark-RDD的行动算子

2024-06-19 19:57:51 301

原创 Spark-Rdd-KV相关操作

spark rdd对于KV对的操作总结

2024-06-17 21:38:38 396

原创 Spark-初识与Rdd

Spark初始和rdd基本方法介绍

2024-06-17 15:57:19 404 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除