Flink 简介
- 流批一体:它能够以统一的方式处理流式数据和批量数据,既可以对实时持续流入的数据流进行高效处理,也可以像传统批处理那样对静态数据集进行操作,打破了流处理和批处理之间的界限。
- 状态管理:提供了强大且易用的状态管理机制,允许在处理数据过程中保存和更新中间状态,方便实现诸如窗口聚合、复杂事件处理等功能,并且能保证状态的一致性,在遇到故障等情况时可以准确恢复状态。
- 事件时间处理:很好地支持基于事件实际发生时间来进行处理,而不是数据到达系统的时间,这对于处理乱序数据等场景极为重要,能确保计算结果的准确性。
- 灵活的窗口机制:拥有丰富多样的窗口类型,比如滚动窗口、滑动窗口、会话窗口等,可以根据不同的业务需求灵活地对数据进行分组和聚合操作。