大数据技术AI
Flink/Spark/Hadoop/数仓,数据分析、面试,源码解读等干货学习资料
94篇原创内容
公众号
使用最优算法
_convert/bcd6de69d398473400a879e3e0839213.png)
当TopN的输入是非更新流(例如Source),TopN只有一种算法AppendRank。
当TopN的输入是更新流时(例如经过了AGG/JOIN计算),TopN有2种算法,性能从高到低分别是:UpdateFastRank 和RetractRank。算法名字会显示在拓扑图的节点名字上。
注意:apache社区版的Flink1.12目前还没有UnaryUpdateRank,阿里云实时计算版Flink才有
-
UpdateFastRank :最优算法 需要具备2个条件:
-
输入流有PK(Primary Key)信息,例如ORDER BY AVG。