本文的Flink源码版本为: 1.15-SNAPSHOT,读者可自行从Github clone.
假如 Flink 任务某个算子的并行度为4,该算子的状态做了 checkpoint 后任务停止。该算子的并行度调整为2后重新启动任务,新 task 中的各个 subtask 需要从 checkpoint 中哪些旧的 subtask 中获取数据呢?
Flink 提供了 SubtaskStateMapper 枚举类来定义上述行为。
其核心方法为:
public abstract int[] getOldSubtasks(
int newSubtaskIndex, int oldNumberOfSubtasks, int newNumberOfSubtasks);
其中,newSubtaskIndex 为新 subtask 的索引,oldNumberOfSubtasks 为旧 subtask 的数量,newNumberOfSubtasks 为新 subtask 的数量,返回值为旧 subtask 索引的数组。
SubtaskStateMapper 提供了 ARBITRARY、ROUND_ROBIN、FIRST、FULL、RANGE、UNSUPPORTED 等6类实现。
ARBITRARY
ARBITRARY {
@Override
public int[] getOldSubtasks(
int newSubtaskIndex, int oldNumberOfSubtasks
本文详细介绍了Flink中SubtaskStateMapper的六种策略,包括ARBITRARY、ROUND_ROBIN、FIRST、FULL、RANGE和UNSUPPORTED。在任务并行度变化时,这些策略定义了如何将旧的subtask状态分配给新的subtask。例如,ROUND_ROBIN实现数据的轮询分配,而FIRST则将所有旧subtask的数据发送到第一个新的subtask。RANGE策略通过KeyGroupRange进行索引分配。理解这些策略对于优化Flink作业的恢复和性能至关重要。
订阅专栏 解锁全文
6148

被折叠的 条评论
为什么被折叠?



