度小满大数据面试题及参考答案

大模型大数据攻城狮

已于 2025-03-13 21:55:11 修改

阅读量620

点赞数 12

CC 4.0 BY-SA版权

分类专栏：大数据最全面试题-Offer直通车文章标签：大数据数据倾斜 flink CEP checkpoint 数据分析数据挖掘数据面试

于 2024-12-01 00:00:38 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/linweidong/article/details/144162976

大数据最全面试题-Offer直通车专栏收录该内容

324 篇文章 ¥39.90 ¥99.00

订阅专栏

Kafka 的工作原理是什么？

Kafka 是一个分布式的消息队列系统，它的核心工作围绕着消息的生产、存储和消费展开。

从生产者角度来看，生产者负责创建消息并将其发送到 Kafka 集群。生产者首先要确定消息所属的主题（Topic），主题类似于一个消息的分类标签。例如，一个电商系统可能有 “订单消息” 主题、“用户注册消息” 主题等。当生产者确定主题后，它会根据配置的分区策略将消息发送到主题中的某个分区（Partition）。分区是 Kafka 实现数据并行处理和存储的基本单位，每个分区在物理上是一个有序的、不可变的消息序列。生产者发送消息时，会根据分区策略（如基于消息键的哈希分区或者轮询分区等）来选择分区。

在消息存储方面，Kafka 将消息持久化存储在磁盘上。每个分区的数据存储在独立的文件中，这些文件按照一定的顺序存储消息。当消息被发送到分区后，Kafka 会将消息追加到分区对应的文件末尾。分区的存储还涉及到副本（Replica）机制，每个分区可以有多个副本，其中一个是领导者副本（Leader Replica），其余是追随者副本（Follower Replica）。领导者副本负责处理所有的读写请求，追随者副本则会从领导者副本同步消息，以保证数据的冗余和高可用性。例如，当生产者发送消息时，消息首先会发送到领导者副本，领导者副本将消息存储后，追随者副本会定期从领导者副本拉取消息进行同步。

<

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大模型大数据攻城狮 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。