Flink源码解析系列--SubtaskStateMapper枚举类

本文详细介绍了Flink中SubtaskStateMapper的六种策略,包括ARBITRARY、ROUND_ROBIN、FIRST、FULL、RANGE和UNSUPPORTED。在任务并行度变化时,这些策略定义了如何将旧的subtask状态分配给新的subtask。例如,ROUND_ROBIN实现数据的轮询分配,而FIRST则将所有旧subtask的数据发送到第一个新的subtask。RANGE策略通过KeyGroupRange进行索引分配。理解这些策略对于优化Flink作业的恢复和性能至关重要。

本文的Flink源码版本为: 1.15-SNAPSHOT,读者可自行从Github clone.

假如 Flink 任务某个算子的并行度为4,该算子的状态做了 checkpoint 后任务停止。该算子的并行度调整为2后重新启动任务,新 task 中的各个 subtask 需要从 checkpoint 中哪些旧的 subtask 中获取数据呢?

Flink 提供了 SubtaskStateMapper 枚举类来定义上述行为。

其核心方法为:

public abstract int[] getOldSubtasks(
		int newSubtaskIndex, int oldNumberOfSubtasks, int newNumberOfSubtasks);

其中,newSubtaskIndex 为新 subtask 的索引,oldNumberOfSubtasks 为旧 subtask 的数量,newNumberOfSubtasks 为新 subtask 的数量,返回值为旧 subtask 索引的数组。

SubtaskStateMapper 提供了 ARBITRARY、ROUND_ROBIN、FIRST、FULL、RANGE、UNSUPPORTED 等6类实现。

ARBITRARY

ARBITRARY {
	@Override
	public int[] getOldSubtasks(
			int newSubtaskIndex, int oldNumberOfSubtasks
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值