JVM虚拟机篇（四）：彻底搞懂堆栈与直接内存

本文链接：https://blog.csdn.net/Chenchen0905_/article/details/147016734

JVM虚拟机篇（四）：彻底搞懂堆栈与直接内存

JVM虚拟机篇（四）：彻底搞懂堆栈与直接内存

JVM虚拟机篇（四）：彻底搞懂堆栈与直接内存

一、引言

在Java编程的世界里，内存管理是一个至关重要却又常常让人困惑的领域。堆栈（Stack和Heap）以及直接内存（Direct Memory）作为内存管理中的关键概念，深刻影响着Java程序的性能、稳定性以及资源利用效率。无论是编写高效的算法，还是构建大型的企业级应用，理解它们的工作原理和特性都必不可少。本文将深入剖析堆栈与直接内存，带您揭开它们神秘的面纱。

二、栈（Stack）

2.1 栈的基本概念

栈在Java中是线程私有的内存区域，它的生命周期与线程紧密相连。当线程启动时，栈随之创建；线程结束，栈也会被销毁。栈的主要作用是存储方法执行时的上下文信息，其以栈帧（Stack Frame）为单位进行管理。

每个方法在被调用执行时，都会在栈中创建一个对应的栈帧。栈帧中包含了以下几个关键部分：

局部变量表：用于存储方法中的局部变量，包括基本数据类型（如int、double等）以及对象的引用。局部变量表的大小在编译期就已经确定，它以变量槽（Slot）为单位，每个Slot可以存储一个32位的数据类型，对于64位的数据类型（如long、double）则需要占用两个Slot。例如，在一个方法中定义了int a = 10;和Object obj = new Object();，a会直接存储在局部变量表的Slot中，而obj存储的是指向堆中实际对象的引用。
操作数栈：它是一个后入先出（LIFO）的栈结构，主要用于存储字节码指令执行过程中的操作数。在方法执行过程中，字节码指令会从局部变量表或其他地方获取操作数，并将其压入操作数栈，然后根据指令的要求对操作数进行运算，运算结果也会存储在操作数栈中。例如，对于int b = 5 + 3;这条语句，在编译后的字节码执行时，会先将5和3压入操作数栈，然后执行加法指令，将结果8再压入操作数栈，最后将结果赋值给b。
动态链接：每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的符号引用，通过这个引用，JVM可以在运行时将符号引用转换为直接引用，从而实现方法的动态绑定。例如，当调用一个方法时，JVM会根据栈帧中的动态链接信息，在运行时常量池中查找对应的方法实现，并进行调用。
方法返回地址：用于记录方法执行完毕后返回的位置。当方法执行结束时，JVM会根据这个地址返回到调用该方法的位置，继续执行后续的字节码指令。

2.2 栈的工作原理

当一个方法被调用时，JVM会在当前线程的栈中为其创建一个栈帧，并将该栈帧压入栈顶。随着方法的执行，栈帧中的局部变量表会被填充，操作数栈会根据字节码指令进行操作数的压入和弹出等操作。当方法执行完毕时，对应的栈帧会从栈顶弹出，释放其所占用的内存空间，线程则根据栈帧中记录的方法返回地址继续执行调用该方法之后的代码。

例如，有以下代码：

public class StackExample {
    public static void main(String[] args) {
        int result = add(3, 5);
        System.out.println(result);
    }

    public static int add(int a, int b) {
        return a + b;
    }
}

在执行main方法时，JVM会为main方法创建一个栈帧并压入栈中。当调用add方法时，又会为add方法创建一个新的栈帧并压入栈顶。在add方法执行过程中，局部变量表存储a和b的值，操作数栈进行加法运算，最后add方法执行完毕，其栈帧弹出，main方法继续执行后续的System.out.println(result);语句，此时main方法栈帧中的result变量已经被赋值为add方法的返回值8。

2.3 栈的特点与优势

快速访问：由于栈的操作遵循后进先出原则，并且局部变量的访问是基于索引的直接访问，所以栈的访问速度非常快。这使得方法内的局部变量能够被高效地读取和修改，对于一些对性能要求极高的场景，如内层循环中的局部变量操作，栈的快速访问特性能够显著提升程序的执行效率。
自动管理内存：栈的内存管理是自动的，随着方法的调用和结束，栈帧会自动入栈和出栈，无需开发者手动进行内存的分配和释放操作。这大大减少了因手动管理内存不当而导致的内存泄漏、悬空指针等问题，提高了程序的稳定性和可靠性。

2.4 栈的局限性

内存大小有限：栈的大小是有限的，其大小可以通过JVM参数-Xss来设置。如果方法调用层次过深，或者局部变量占用空间过大，就可能导致栈内存不足，抛出java.lang.StackOverflowError异常。例如，一个递归方法如果没有正确设置终止条件，就可能不断地在栈中创建栈帧，最终耗尽栈内存。
数据生命周期短：栈中存储的局部变量的生命周期与方法的执行周期相同。当方法执行结束，栈帧弹出，局部变量所占用的内存空间就会被释放。这意味着栈中数据的作用范围相对较窄，对于需要长期保存的数据，栈并不是一个合适的存储位置。

三、堆（Heap）

3.1 堆的基本概念

堆是Java中被所有线程共享的内存区域，它是Java程序运行时最大的一块内存空间，主要用于存储对象实例和数组。几乎所有通过new关键字创建的对象都在堆中分配内存。

堆可以根据对象的存活周期划分为不同的区域，常见的划分方式是将其分为新生代和老年代，而新生代又进一步细分为伊甸园区（Eden Space）、幸存0区（Survivor 0 Space）和幸存1区（Survivor 1 Space）。

伊甸园区：大多数新创建的对象首先会在伊甸园区分配内存。伊甸园区是对象诞生的地方，但由于其空间相对有限，当伊甸园区被对象填满时，就会触发新生代垃圾回收（Minor GC）。
幸存区：在进行Minor GC时，伊甸园区中存活的对象会被移动到幸存区。幸存区分为幸存0区和幸存1区，每次GC后，存活的对象会在两个幸存区之间来回移动，并且对象的年龄会增加。当对象在幸存区中经过多次GC后仍然存活，其年龄达到一定阈值（可通过-XX:MaxTenuringThreshold参数设置，默认值为15）时，就会被晋升到老年代。
老年代：老年代用于存储生命周期较长的对象。当老年代的内存空间也被填满时，就会触发全堆垃圾回收（Full GC），对整个堆内存进行垃圾回收操作。

3.2 堆的工作原理

当Java程序执行到new操作创建对象时，JVM会首先在伊甸园区尝试为对象分配内存。如果伊甸园区空间足够，对象就会被成功分配在伊甸园区；如果伊甸园区空间不足，就会触发Minor GC。在Minor GC过程中，垃圾回收器会标记并回收伊甸园区中不再使用的对象，将存活的对象移动到幸存区。

随着程序的继续运行，幸存区中的对象也可能因为空间不足等原因再次触发GC，对象在幸存区之间移动并不断增加年龄，最终晋升到老年代。老年代中的对象相对较为稳定，但当老年代内存被占满时，Full GC就会被触发，垃圾回收器会对老年代以及新生代进行全面的垃圾回收，标记并回收不再使用的对象，释放内存空间。

例如：

public class HeapExample {
    public static void main(String[] args) {
        while (true) {
            new Object();
        }
    }
}

在上述代码中，不断创建Object对象，随着对象的持续创建，伊甸园区很快会被填满，进而触发Minor GC。如果垃圾回收后仍然无法满足新对象的分配需求，对象会逐渐晋升到老年代，当老年代也被填满时，就会触发Full GC。如果程序持续运行且没有有效的垃圾回收机制，最终可能会导致堆内存溢出，抛出java.lang.OutOfMemoryError: Java heap space异常。

3.3 堆的特点与优势

大容量存储：堆具有较大的内存空间，能够存储大量的对象实例和数组，满足Java程序在运行过程中对对象存储的需求。这使得Java可以处理复杂的业务逻辑，创建大量的对象来表示各种实体和关系。
灵活的数据生命周期管理：与栈中数据的短生命周期不同，堆中的对象生命周期由垃圾回收器管理。只要对象还有引用指向它，就会一直存活在堆中，直到没有任何引用时才会被垃圾回收器回收。这种灵活的管理方式适应了不同对象在程序中不同的生命周期需求。

3.4 堆的局限性

垃圾回收开销：由于堆中对象的创建和销毁较为频繁，垃圾回收器需要不断地进行对象的标记、回收等操作，这会带来一定的性能开销。尤其是在进行Full GC时，可能会暂停所有用户线程（即Stop The World，简称STW），导致应用程序出现短暂的停顿，影响用户体验。
内存碎片化：在垃圾回收过程中，尤其是采用标记 - 清除算法时，可能会产生内存碎片化问题。即堆中会出现大量不连续的空闲内存块，当需要分配较大的对象时，即使堆中总的空闲内存足够，但由于没有连续的内存空间，也可能导致内存分配失败。

四、堆栈的比较

4.1 内存分配方式

栈的内存分配是自动的，随着方法的调用和结束，栈帧自动入栈和出栈，局部变量在栈帧的局部变量表中直接分配内存。而堆的内存分配则是通过new关键字动态进行的，JVM会在堆中寻找合适的内存空间来创建对象实例。

4.2 数据访问速度

栈的访问速度极快，因为其操作简单且基于索引直接访问。而堆由于需要进行垃圾回收等复杂操作，并且对象的访问需要通过引用间接进行，所以访问速度相对较慢。

4.3 内存管理方式

栈的内存管理由JVM自动完成，无需开发者干预。堆的内存管理则依赖于垃圾回收器，虽然垃圾回收器会自动回收不再使用的对象，但开发者可以通过一些JVM参数来调整垃圾回收策略，以优化堆内存的使用。

4.4 生命周期

栈中局部变量的生命周期与方法的执行周期一致，方法结束，变量内存释放。堆中对象的生命周期则取决于对象的引用情况，只要有引用存在，对象就会一直存活在堆中。

五、直接内存（Direct Memory）

5.1 直接内存的基本概念

直接内存并不是JVM运行时数据区的一部分，但它与Java程序密切相关。直接内存是Java通过JNI（Java Native Interface）直接在操作系统的堆内存上分配的内存空间，它不受JVM堆内存大小的限制。

在Java中，通过java.nio.DirectByteBuffer等类可以操作直接内存。例如，使用DirectByteBuffer.allocateDirect(size)方法可以分配指定大小的直接内存。直接内存常用于一些对性能要求极高的场景，如NIO（New I/O）操作、高性能计算等。

5.2 直接内存的工作原理

当Java程序需要使用直接内存时，会通过JNI调用本地方法，在操作系统的堆内存中分配一块内存空间。这块内存空间可以直接与底层操作系统进行交互，避免了Java堆内存与本地内存之间的数据拷贝，从而提高了数据传输和处理的效率。

以NIO中的文件读写操作为例，使用直接内存可以将文件数据直接映射到直接内存中，然后Java程序可以直接对这块内存进行操作，而不需要先将数据从文件读取到Java堆内存，再进行处理。这样减少了数据在不同内存区域之间的拷贝开销，大大提高了文件读写的性能。

5.3 直接内存的特点与优势

高性能：直接内存避免了Java堆内存与本地内存之间的数据拷贝，减少了内存拷贝的开销，提高了数据传输和处理的速度。在一些对性能要求极高的场景，如网络通信、大数据处理等，直接内存的高性能优势尤为明显。
不受JVM堆内存限制：直接内存的大小不受JVM堆内存大小的限制，只要操作系统有足够的可用内存，就可以分配较大的直接内存空间。这使得Java程序可以处理超出JVM堆内存容量的数据，拓展了Java程序的应用范围。

5.4 直接内存的局限性

内存管理复杂：直接内存的分配和释放需要开发者手动进行管理。如果在分配了直接内存后，没有及时释放，就会导致内存泄漏，最终耗尽操作系统的内存资源。与JVM自动管理的堆内存相比，直接内存的管理难度较大，需要开发者具备较高的内存管理能力。
垃圾回收不直接参与：JVM的垃圾回收器不会直接管理直接内存。虽然可以通过一些方式（如在DirectByteBuffer对象被回收时，其关联的直接内存会被自动释放）来间接管理直接内存的释放，但这仍然需要开发者了解相关机制并进行合理的代码设计，否则容易出现内存管理问题。

六、堆栈与直接内存的应用场景

6.1 栈的应用场景

方法调用与局部变量存储：栈主要用于方法调用时存储方法的上下文信息以及局部变量。在日常的Java编程中，几乎所有的方法执行都依赖栈来管理局部变量和执行流程。例如，在一个排序算法的实现方法中，栈用于存储排序过程中的临时变量、递归调用的上下文等信息。
简单数据的快速处理：由于栈的快速访问特性，对于一些简单的数据处理任务，如简单的算术运算、局部变量的临时存储等，栈是非常合适的选择。例如，在一个计算阶乘的方法中，局部变量n以及计算过程中的中间结果可以存储在栈中，快速进行计算。

6.2 堆的应用场景

对象存储与复杂数据结构：堆是对象存储的主要场所，适用于存储各种复杂的数据结构和对象实例。例如，在一个电商系统中，商品对象、订单对象等都存储在堆中。这些对象包含了丰富的属性和方法，需要较大的内存空间来存储，并且其生命周期可能与方法的执行周期不同，适合在堆中进行管理。
数据共享与持久化：由于堆是被所有线程共享的内存区域，所以对于需要在多个线程之间共享的数据，通常会存储在堆中。此外，一些需要持久保存的数据，如数据库连接池中的连接对象等，也会存储在堆中，以便在程序运行过程中持续使用。

6.3 直接内存的应用场景

高性能I/O操作：在NIO编程中，直接内存被广泛应用于文件读写、网络通信等场景。例如，在进行大规模文件传输时，使用直接内存可以将文件数据直接映射到内存中，提高读写速度，减少I/O操作的开销。
高性能计算：在一些高性能计算场景，如科学计算、机器学习等，直接内存可以用于存储大规模的数据矩阵、模型参数等。通过直接内存，程序可以直接对这些数据进行高效的计算和处理，避免了数据在不同内存区域之间的频繁拷贝。

七、堆栈与直接内存的性能优化

7.1 栈的性能优化

避免深度递归：由于栈的大小有限，深度递归可能会导致栈内存溢出。在编写递归算法时，要确保有正确的终止条件，并且可以考虑使用迭代算法来替代递归算法，以减少栈帧的创建数量。例如，对于计算斐波那契数列的问题，除了使用递归算法外，还可以使用迭代算法来实现，避免栈溢出风险。
合理定义局部变量：尽量减少方法中不必要的局部变量定义，尤其是占用空间较大的局部变量。合理规划局部变量的作用域，避免在方法中定义过多生命周期较长的局部变量，以减少栈内存的占用。

7.2 堆的性能优化

优化对象创建与销毁：尽量减少不必要的对象创建，避免在循环中频繁创建临时对象。可以通过对象池等技术来复用对象，减少垃圾回收的压力。例如，在数据库连接管理中，可以使用数据库连接池来复用连接对象，而不是每次需要连接时都创建新的连接对象。
调整垃圾回收策略：根据应用程序的特点，合理调整JVM的垃圾回收参数，选择合适的垃圾回收器。对于对响应时间要求较高的应用，可以选择CMS（Concurrent Mark Sweep）或G1（Garbage - First）等垃圾回收器，并通过调整参数来优化垃圾回收的性能，减少垃圾回收时的停顿时间。

7.3 直接内存的性能优化

精确控制内存分配与释放：在使用直接内存时，要精确控制内存的分配和释放时机。确保在使用完直接内存后及时释放，避免内存泄漏。可以通过try - finally语句块来保证直接内存的正确释放，例如：

DirectByteBuffer buffer = null;
try {
    buffer = DirectByteBuffer.allocateDirect(1024);
    // 使用buffer进行相关操作
} finally {
    if (buffer != null) {
        // 释放直接内存
        ((DirectBuffer) buffer).cleaner().clean();
    }