因公司发展需要,需半小时统计一次截止到当前时间的关键指标的当日累计值。
v1.0 链路采取的是 kafka-> clickhouse
在设计的时候,一开始本人是想一个flinksql从source到transform到sink完成.
v2.0 链路采取的是 kafka->kafka-> clickhouse
奈何公司平台sink到ck的时候不支持upsert流。因此只能分解到先用一个flinksql加工出dwd.再起一个任务从dwd读数加工到ck.
未完待续
因公司发展需要,需半小时统计一次截止到当前时间的关键指标的当日累计值。
v1.0 链路采取的是 kafka-> clickhouse
在设计的时候,一开始本人是想一个flinksql从source到transform到sink完成.
v2.0 链路采取的是 kafka->kafka-> clickhouse
奈何公司平台sink到ck的时候不支持upsert流。因此只能分解到先用一个flinksql加工出dwd.再起一个任务从dwd读数加工到ck.
未完待续