一、背景
项目中需要用到Kafka来承接车机上来的接口数据,然后再转存到数据库,客户反馈,需要对生产环境中的Kafka的存储容量进行评估。以下是具体的算法内容
二、Kafka的Topic信息与Kafka架构信息
(1)Kafka的Topic信息
(2)Kafka的架构信息
Kafka架构为集群架构,购买的是阿里云的云Kafka
三台kafka的 连接地址:
K1.alikafka.aliyuncs.com:9092,
K2.alikafka.aliyuncs.com:9092,
K3alikafka.aliyuncs.com:9092
Kafka的副本数量,默认保存三份 (生产需要三个副本,沙箱1个即可)
Kafka保存的天数为 默认的7天
三、开始计算
Step1、计算用户活跃数
假设总的用户数据是60W