雪花算法ID重复了？惨痛教训：请勿轻易造轮子！

最新推荐文章于 2025-08-03 20:20:26 发布

程序员宝库

最新推荐文章于 2025-08-03 20:20:26 发布

阅读量521

点赞数 5

CC 4.0 BY-SA版权

文章标签：机器学习 mysql 人工智能算法 java 程序员

本文链接：https://blog.csdn.net/z1ztai/article/details/148674616

最近我们线上系统发生了一起严重事故：订单号/流水号出现了重复，影响了核心业务流程。最终定位到根源：一个自研的二方包雪花算法ID生成器出现了问题。

下面我们来回顾一下雪花算法的标准结构，分析问题出在哪，并总结一些通用的设计建议。

一、标准雪花算法（Snowflake）

标准的Snowflake ID由一个64位long型整数构成：

txt

代码解读

复制代码

+----------------------------------------------------------------------------------------------------+ | 1 Bit | 41 Bits 时间戳 | 5 Bits 数据中心ID | 5 Bits 机器ID | 12 Bits 序列号 | +----------------------------------------------------------------------------------------------------+

1位符号位：始终为0，确保生成正数。
41位时间戳：记录与固定起始时间的毫秒差，可支持约69年。
10位机器ID：用于标识不同节点。
12位序列号：在同一毫秒内生成多个ID时使用，最多支持每毫秒生成4096个ID。

优点：

高性能生成唯一ID，按时间有序，适用于分布式环境。

二、我们的“定制版”雪花算法：问题在哪？

我们使用的二方包雪花算法结构如下（根据排查推测）：

txt

代码解读

复制代码

看起来字段丰富，但存在严重问题：

1. 时间戳仅保留31位，最多支持24.85天！

左移33位后只用31位时间戳，
超过 2312^{31}231 毫秒后开始循环，
我们自定义的起始时间是2018年，2025年时早已绕了无数圈。

2. BusinessId 用的是 IP 最后一段

使用的IPy用点分隔的最后一位，即192.168.0.1的1，极容易重复。

3. WorkId 和 DataCenterId 未配置，全为0

相当于所有实例共享同一节点标识，唯一性形同虚设。

最终结果：时间轮回 + IP冲突 + 序列重复，ID彻底撞车。

三、教训总结

核心组件不建议自研

雪花算法涉及时钟回拨、位运算、分布式协调等关键细节，成熟组件更稳妥。

不盲信二方包

无论谁写的代码，都要看清实现逻辑，理解其唯一性保障机制。

合理设置机器ID

靠IP后缀太脆弱，建议集中规划，统一分配Worker ID和DataCenter ID。

提前覆盖边界场景

模拟长时间运行、序列号溢出、时间回拨等极端情况，确保系统稳健。

四、推荐做法

使用成熟的开源实现，如 Hutool、Baomidou 等：

java

代码解读

复制代码

// Hutool 示例 Snowflake snowflake = IdUtil.getSnowflake(1, 1); long id = snowflake.nextId(); // Baomidou 示例（支持从 IP/MAC 自动推导，也可手动指定） DefaultIdentifierGenerator generator = new DefaultIdentifierGenerator(1, 1); // workerId=1, dataCenterId=1 long id = generator.nextId("user");

对于中大型系统，DataCenterId 一般用来标识不同的机房或者 AZ (Availability Zone)。

WorkerId 的配置策略可以根据系统规模逐步演进：