在接触了类加载的基本知识以后,我们已经清楚了类加载大体分为3个阶段:
今天我们主要讲解类加载的第二个阶段-连接阶段。连接阶段又可以分为三个部分:
1. 验证
由于我们的字节码来源多样化,并不一定来源于Class文件,所以我们需要通过一些措施来保证字节码的二进制流是正确的安全的,因此我们需要通过验证来避免虚拟机受到攻击。通过验证阶段的字节码也并不是百分之百安全的。
验证阶段大体会有4个阶段的验证:
1.1 文件格式验证
由于我们的字节码文件来源多样化,因此我们需要对其进行验证,验证的方向主要由以下几个方面:
文件格式验证是唯一根据字节码二进制流进行验证的阶段,当文件格式阶段验证通过以后,字节码二进制流会进入内存的方法区(元数据区)进行存储。所以后面的3个验证阶段都是基于方法区(元数据区)的结构进行验证的。
1.2 元数据格式验证
元数据格式验证主要是对字节码描述的信息进行语义分析,保证其描述的信息符合Java语言的规范,主要包含以下几个方面的验证:
1.3 字节码验证
字节码验证主要是对类的方法体进行校验分析,保证方法在运行时不会做出危害虚拟机的事情:
字节码验证的流程相对复杂,在JDK1.6之前都是采用基于数据流进行推导验证,为了减少该阶段的性能消耗,JDK1.6以后在Code属性的属性表上增加了StackMapTable属性,该属性描述了方法体中所有基本块(按照控制流拆分的代码块)开始时本地变量表和操作数栈应有的状态,字节码验证期间就不需要根据程序进行推导,而是直接检查StackMapTable属性中的记录是否合法。
理论上StackMapTable属性存在错误和被篡改的可能,如果同时修改Code属性和StackMapTable属性可以绕过虚拟机的类型校验,因此没有通过验证的字节码肯定是有问题的,但是通过验证的字节码也不是百分之百安全的。
JDK1.7,主版本号大于50的Class文件,使用StackMapTable进行分析校验是唯一的选择,不允许根据数据流进行推导。
1.4 符号引用验证
符号引用验证阶段通常发生在虚拟机将符号引用转换为直接引用的过程,这个过程将在连接的第三阶段解析阶段发生。
符号引用验证是对类自身以外的常量池中的各种符号引用进行匹配校验:
符号验证如果无法通过,将会抛出java.lang.IncompatibleClassChangeError异常的子类,如java.lang.IllegalAccessError、java.lang.NoSuchFieldError、java.lang.NoSuchMethodError等。
2. 准备
准备阶段是为类变量(static)设置内存并分配初始值的阶段,这里强调以下两点:
这里我们来简单说一下变量分配,Java中的变量按其引用类型可以划分为原始类型,和引用类型。变量内存的占用其实有两部分,一部分是变量的内存占用,还有一部分是变量所指向的数据占用的内存,分别称为变量内存和数据内存。
原始类型的变量内存和数据内存往往是分配在同一区域,但引用类型的变量内存和数据内存是不一定位于相同的区域的。
3. 解析
解析阶段是虚拟机将常量池中的符号引用替换为直接引用的过程,符号引用在Class文件中以CONSTANT_Class_info、CONSTANT_Fieldref_info、CONSTANT_Methodref_info等类型的常量出现。
符号引用:以一组符号表示引用的目标,可以是任何形式的字面量,只要可以定位到目标即可。
直接引用:直接指向目标的指针、相对偏移量或是一个能间接定位到目标的句柄。
如果有了直接引用,那么引用的目标必定已经在内存中存在。
虚拟机要求在执行以下16个命令之前必须对所使用的符号引用进行解析:
除了使用invokedynamic指令,虚拟机可以对符号引用的结果可以进行缓存(在运行时常量池记录直接引用),避免解析动作重复进行。无论是否执行了多次解析,虚拟机需要保证在同一个实体中,如果一个符号引用曾经被成功解析,那么后续的解析也必须成功,如果失败,后续的其他指令对该符号引用的解析请求也必须相应的失败。
解析动作主要针对类、接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符,分别对应常量池的:
3.1 类和接口的解析
我们假设我们所处的类为A,要把一个从未解析的符号引用M解析为一个类或者接口B的直接引用,步骤如下:
3.2 字段的解析
解析一个未被解析过的字段的符号引用时,首先要对其CONSTANT_Class_info进行解析。如果解析失败,则字段的符号引用解析失败。解析成功以后,这里假设类B被成功解析,接着会对B的字段进行解析:
3.3 类方法解析
解析一个未被解析过的方法的符号引用时,首先要对其CONSTANT_Class_info进行解析。如果解析失败,则方法的符号引用解析失败。解析成功以后,这里假设类B被成功解析,接着会对B的方法进行解析:
3.4 接口方法解析
解析一个未被解析过的接口方法的符号引用时,首先要对其CONSTANT_Class_info进行解析。如果解析失败,则接口方法的符号引用解析失败。解析成功以后,这里假接口B被成功解析,接着会对B的方法进行解析:
接口方法不会对权限进行校验,因为接口方法默认是public。
本期类加载的连接阶段就介绍到这,下期我们会讲解类加载的初始化阶段,我们下期再见!!!