干货 | 13道精选Flink面试题

最新推荐文章于 2025-06-12 09:48:18 发布

大数据梦想家

最新推荐文章于 2025-06-12 09:48:18 发布

阅读量5.6k

点赞数 44

CC 4.0 BY-SA版权

分类专栏：面试 # Flink 文章标签：大数据 Flink 面试题

本文链接：https://blog.csdn.net/weixin_44318830/article/details/113149695

本文详细介绍了Flink在面试中常见的13个问题，涵盖应用架构、压测监控、使用Flink的原因、Checkpoint机制、exactly-once语义、状态管理、去重策略、与Spark的区别、Watermark机制、CEP编程、时间语义以及应对数据高峰的处理方法。通过这些问题，展示了Flink的关键特性和实际应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文已收录github：https://github.com/BigDataScholar/TheKingOfBigData，里面有大数据高频考点，Java一线大厂面试题资源，上百本免费电子书籍，作者亲绘大数据生态圈思维导图…持续更新，欢迎star！

相信小伙伴们对于Flink一定不会感到陌生，作为连续三年蝉联第一，荣膺全球最活跃的 Apache 开源项目，Flink在中国的热度也一直是居高不下。近几年，在社区的推动下，Flink 技术栈在越来越多的公司开始得到应用，因此在大数据的求职招聘中，对于Flink的着重考察也变得越来越重要。本期文章，菌哥就带大家来总结一下，在面试过程中，Flink常被问到的知识点有哪些？如果本文对你有帮助，记得在看完之后，一键三连(✧◡✧)
在这里插入图片描述

1、应用架构

问题：公司怎么提交的实时任务，有多少 Job Manager？

解答：

1. 我们使用 yarn session 模式提交任务。每次提交都会创建一个新的 Flink 集群，为每一个 job 提供一个 yarn-session，任务之间互相独立，互不影响，方便管理。任务执行完成之后创建的集群也会消失。线上命令脚本如下：

bin/yarn-session.sh -n 7 -s 8 -jm 3072 -tm 32768 -qu root.*.* -nm *-* -d

其中申请 7 个 taskManager，每个 8 核，每个 taskmanager 有 32768M 内存。

2. 集群默认只有一个 Job Manager。但为了防止单点故障，我们配置了高可用。我们公司一般配置一个主 Job Manager，两个备用 Job Manager，然后结合 ZooKeeper 的使用，来达到高可用。

2、压测和监控

问题：怎么做压力测试和监控？

解答：我们一般碰到的压力来自以下几个方面：

一，产生数据流的速度如果过快，而下游的算子消费不过来的话，会产生背压。背压的监控可以使用 Flink Web UI(localhost:8081) 来可视化监控

最低0.47元/天解锁文章

200万优质内容无限畅学