- 博客(7)
- 收藏
- 关注
原创 Zookeeper
Zookeeper从设计模式角度来理解:是一个基于观察者模式设计的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应。zookeeper=文件系统+通知机制。
2024-07-01 14:13:05
616
原创 Spark Streaming
SparkStreaming底层还是SparkCore,就是在流式数据处理中进行的封装。窗口:数据的范围,窗口是可以移动的,但是窗口的移动有幅度的,默认移动幅度就是采集周期。第一个参数:数据范围(时间) 第二个参数:表示窗口的移动幅度。SparkStreaming是微批量,准实时的数据处理框架。DStream中的print方法类似于RDD行动算子。注意:数据窗口范围比窗口移动幅度小,数据可能丢失。window方法可以改变窗口的数据范围。从数据处理延迟的角度。
2024-06-28 15:48:52
331
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人