一、对象
1、对象创建的过程
- 类加载检查
- 虚拟机遇到一条new指令时,首先将去检查这个指令的参数是否能在常量池定位到类的符号引用,并且检查这个符号引用代表的类是否被加载、解析和初始化过。若没有,必须先执行类加载过程。
- 分配内存
- 类加载检查通过后,jvm将为新生对象分配内存,对象所需的内存大小在类加载完成后便可确定,为对象分配空间的任务等同于把一块确定大小的内存从java堆中划分出来。分配方式有 “指针碰撞” 和 “空闲列表” 两种,选择哪种分配方式由 Java 堆是否规整决定,而 Java 堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定。
- 指针碰撞
- 适合场景:堆内存规整(即没有内存碎片)的情况下
- 原理:用过的内存全部整合到一边,没用过的放在另一边,中间有一个分界值指针,只需要向着没用过的内存方向将该指针移动对象内存大小位置即可:
- GC收集器:Serial、ParNew
- 空闲列表
- 适合场景:堆内存不规整的情况下
- 原理:JVM会维护一个列表,该列表中会记录哪些内存块是可用的,在分配的时候,找一块足够大的内存块来划分给对象实例,最后更新列表记录。
- GC收集器:CMS
- 并发的时候
- 采用CAS 配上失败重试的方式保证更新操作的原子性
- TLAB:为每一个线程预先在 Eden 区分配一块儿内存,JVM 在给线程中的对象分配内存时,首先在 TLAB 分配,当对象大于 TLAB 中的剩余内存或 TLAB 的内存己用尽时,再采用上述的 CAS 进行内存分配
- 指针碰撞
- 类加载检查通过后,jvm将为新生对象分配内存,对象所需的内存大小在类加载完成后便可确定,为对象分配空间的任务等同于把一块确定大小的内存从java堆中划分出来。分配方式有 “指针碰撞” 和 “空闲列表” 两种,选择哪种分配方式由 Java 堆是否规整决定,而 Java 堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定。
- 初始化零值
- 内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值 (不包括对象头),这一步操作保证了对象的实例字段在 Java 代码中可以不賦初始值就直接使用,程序能访问到这些字段的数据类型所对应的零值。
- 设置对象头
- 初始化零值完成之后,虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的 GC 分代年龄等信息。这些信息存放在对象头中。另外,根据虚拟机当前运行状态的不同,如是否启用偏向锁等,对象头会有不同的设置方式。
- 执行init()方法
- 在上面工作都完成之后,从jvm的视角来看,一个新的对象已经产生了,但从Java 程序的视角来看,对象创建才刚开始,init方法还没有执行,所有的字段都还为零。所以一般来说,执行 new指令之后会接者执行init方法,把对象按照程序员的意愿进行初始化。
2、对象在内存的布局
- 对象头:第一部分Mark word用于存储对象自身的运行时数据(哈希码、GC分代年龄、锁状态等),另一部分时类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。
- 实例数据:对象真正存储的有效信息,也是在程序中所定义的各种类型的字段内容
- 对齐填充:仅仅起占位作用(Hotspot 虚拟机的自动内存管理系统要求对象起始地址必须是 8 字节的整数倍)
3、对象访问
- Java 程序通过栈上的 reference 数据来操作堆上的具体对象。对象的访问方式由虚拟机实现而定,目前主流的访问方式有:使用句柄、直接指针
- 句柄:Java 堆中将会划分出一块内存来作为句柄池,reference 中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自的具体地址信息
- 直接指针:reference 中存储的直接就是对象的地址(HotSpot)
- 优点:句柄-reference 中存储的是稳定的句柄地址,在对象被移动时只会改变句柄中的实例数据指针,而reference 本身不需要修改。使用直接指针访问方式最大的好处就是速度快,它节省了一次指针定位的时问开销。
二、类文件结构
1、字节码
- 在 Java 中,JVM 可以理解的代码就叫做
字节码
(即扩展名为.class
的文件),它不面向任何特定的处理器,只面向虚拟机。Java 语言通过字节码的方式,在一定程度上解决了传统解释型语言执行效率低的问题,同时又保留了解释型语言可移植的特点。所以 Java 程序运行时比较高效,而且,由于字节码并不针对一种特定的机器,因此,Java 程序无须重新编译便可在多种不同操作系统的计算机上运行。
2、Class文件结构
ClassFile {
u4 magic; //Class 文件的标志
u2 minor_version;//Class 的小版本号
u2 major_version;//Class 的大版本号
u2 constant_pool_count;//常量池的数量
cp_info constant_pool[constant_pool_count-1];//常量池
u2 access_flags;//Class 的访问标记
u2 this_class;//当前类
u2 super_class;//父类
u2 interfaces_count;//接口数量
u2 interfaces[interfaces_count];//一个类可以实现多个接口
u2 fields_count;//字段数量
field_info fields[fields_count];//一个类可以有多个字段
u2 methods_count;//方法数量
method_info methods[methods_count];//一个类可以有个多个方法
u2 attributes_count;//此类的属性表中的属性数
attribute_info attributes[attributes_count];//属性表集合
}
- magic:每个 Class 文件的头 4 个字节称为魔数(Magic Number),它的唯一作用是确定这个文件是否为一个能被虚拟机接收的 Class 文件。Java 规范规定魔数为固定值:0xCAFEBABE。如果读取的文件不是以这个魔数开头,Java 虚拟机将拒绝加载它。
- Class文件版本号:第 5 和第 6 个字节是次版本号,第 7 和第 8 个字节是主版本号。每当 Java 发布大版本(比如 Java 8,Java9)的时候,主版本号都会加 1。你可以使用
javap -v
命令来快速查看 Class 文件的版本号信息。高版本的 Java 虚拟机可以执行低版本编译器生成的 Class 文件,但是低版本的 Java 虚拟机不能执行高版本编译器生成的 Class 文件。 - 常量池(Class常量池):常量池主要存放两大常量:字面量和符号引用。字面量比较接近于 Java 语言层面的的常量概念,如文本字符串、声明为 final 的常量值等。而符号引用则属于编译原理方面的概念。包括下面三类常量:类和接口的全限定名;字段的名称和描述符;方法的名称和描述符。
- 访问标志位:用于识别一些类或者接口层次的访问信息,包括:这个 Class 是类还是接口,是否为
public
或者abstract
类型,如果是类的话是否声明为final
等等。
三、类加载
1、类生命周期
- 类从被加载到虚拟机内存中开始到卸载出内存为止,它的整个生命周期可以简单概括为 7 个阶段:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)和卸载(Unloading)。其中,验证、准备和解析这三个阶段可以统称为连接(Linking)。
2、类加载过程
- 加载:
- 通过全类名获取定义此类的二进制字节流。
- 将字节流所代表的静态存储结构转换为方法区的运行时数据结构。
- 在堆内存中生成一个代表该类的
Class
对象,作为方法区这些数据的访问入口。
- 链接
- 验证:确保被加载的类的信息符合JVM规范;文件格式验证(Class 文件格式检查);元数据验证(字节码语义检查);字节码验证(程序语义检查);符号引用验证(类的正确性检查)
- 准备:类变量(静态变量)分配内存并设置类变量初始值的阶段,这些内存都将在方法区