概述
ZGC(Z Garbage Collector)是自JDK 11引入的一个具有实验性质的低延迟垃圾收集器,旨在为TB级堆内存提供支持,同时确保最大GC停顿时间不超过10毫秒。它采用了独特的颜色指针、读屏障等技术,实现了并发标记-整理算法,从而在不停止世界(No STW)的情况下完成大部分的垃圾回收工作。
设计目标与特点
- 支持TB级堆:能够处理从几十GB到数百GB甚至更大的堆。
- 极短停顿时间:即使面对大规模堆,也能保证GC停顿时间稳定在10ms以内。
- 吞吐量影响小:最糟糕情况下吞吐量仅降低约15%,可通过扩展硬件资源轻易补偿。
- 不分代:暂时不区分年轻代和老年代,简化了实现逻辑。
- NUMA-aware:自动感知并充分利用非统一内存访问架构(NUMA)特性,提高性能。
内存布局与Region划分
ZGC采用基于Region的内存布局,分为三种不同容量的Region:
- 小型Region(Small Region):2MB,用于放置小于256KB的小对象。
- 中型Region(Medium Region):32MB,用于放置大于等于256KB但小于4MB的对象。
- 大型Region(Large Region):动态大小,必须为2MB整数倍,用于放置4MB或以上的大对象。每个大型Region只存放一个大对象,并且不会被重分配,因为复制大对象的成本非常高。
收集过程详细讲解
ZGC的运作过程大致可以划分为以下四个大的阶段:
-
并发标记(Concurrent Mark)
- 初始标记(Mark Start):短暂暂停所有其他线程,记录下从GC Roots出发可以直接引用到的所有对象。这一阶段非常快,因为它只需要遍历根节点附近的对象。
- 并发标记:应用程序继续运行的同时,ZGC会遍历整个堆中的对象图,更新颜色指针中的标记位(Marked 0/1),以标识哪些对象是存活的。这个过程中,ZGC使用的是指针上的标记而不是对象头中的信息,这是它与传统GC的主要区别之一。
-
并发预备重分配(Concurrent Prepare for Relocate)
- 在此阶段,ZGC扫描所有Region,确定需要清理的Region集合,即重分配集(Relocation Set)。这一步骤避免了G1中记忆集(Remembered Set)的维护成本,通过更广泛的扫描来决定哪些Region应该参与本次收集。
-
并发重分配(Concurrent Relocate)
- 这是ZGC的核心阶段,它将重分配集中存活的对象复制到新的Region上,并为每个Region维护一个转发表(Forward Table),记录旧对象到新对象的映射关系。当用户线程访问位于重分配集中的对象时,读屏障会截获这次访问,根据转发表将请求转发到新位置,并修正该引用指向新对象。这种机制被称为“自愈”(Self-Healing),意味着一旦某个Region的所有存活对象都被移走后,该Region就可以立即释放并重新用于分配新对象,而无需等待整个堆中所有指向它的引用都被修正。
-
并发重映射(Concurrent Remap)
- 此阶段负责修正整个堆中指向重分配集中旧对象的所有引用。然而,由于ZGC的颜色指针具备“自愈”功能,因此重映射操作并不是非常紧迫的任务。实际上,ZGC巧妙地把这部分工作合并到了下一个GC周期的并发标记阶段中,节省了一次遍历对象图的开销。一旦所有指针都被修正完毕,原来记录新旧对象关系的转发表就可以被安全地释放掉。
颜色指针与读屏障
- 颜色指针(Colored Pointers):ZGC利用对象指针的一部分位来存储GC相关信息,如是否已标记、是否可重定位等。这种方式使得ZGC可以在几乎任何时刻开始收集垃圾,而不需要等到所有引用都被修正。每64位指针中有42位用于表示对象地址,支持高达4TB的堆空间;剩下的位则用来保存GC状态和其他元数据。
- 读屏障(Load Barriers):每次从堆中读取对象引用时都会触发读屏障检查,判断对象是否已经被移动过。如果是,则通过读屏障修正指针到新的位置,并更新原字段中的值。这种方法保证了应用代码始终持有有效的对象引用,即便是在并发GC期间也是如此。
存在的问题及解决方案
尽管ZGC在许多方面表现出色,但它也存在一些挑战,比如浮动垃圾问题——由于GC执行时间较长,在此期间创建的新对象难以进入当前的GC周期,只能留待下次处理。为了解决这个问题,通常建议增大堆的容量,给程序更多喘息的时间。长远来看,引入分代收集机制可能是更好的解决办法,这样可以让新生对象集中在特定区域,并进行更频繁、更快捷的回收。
参数设置与调优
启用ZGC相对简单,只需设置JVM参数-XX:+UnlockExperimentalVMOptions
和-XX:+UseZGC
即可。相比其他收集器,ZGC的调优参数较少,大多数情况下JVM能很好地自动完成优化工作。不过,对于特定应用场景,还可以调整诸如-XX:SoftMaxHeapSize
(软最大堆大小)、-XX:MinHeapFreeRatio
和-XX:MaxHeapFreeRatio
(最小/最大空闲堆比率)等参数来进一步微调性能。
触发时机
ZGC提供了多种机制来决定何时启动GC:
- 定时触发:可以通过
ZCollectionInterval
参数配置定期触发GC,默认关闭。 - 预热触发:最多三次,在堆内存达到一定百分比时触发,主要用于统计GC时间,为其他机制提供参考。
- 分配速率:基于正态分布统计计算内存耗尽前的最佳GC时机。
- 主动触发:默认开启,根据堆增长情况动态决定是否需要提前触发GC。
综上所述,ZGC是一款面向未来的垃圾收集器,特别适合于拥有巨大堆内存的应用程序,以及对响应时间和吞吐量有严格要求的场景。其创新的设计和技术手段,不仅提高了GC效率,还显著降低了停顿时间,为Java应用的高性能运行提供了坚实保障。