前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >深入浅出JVM(九、十)之字节码指令

深入浅出JVM(九、十)之字节码指令

原创
作者头像
菜菜的后端私房菜
发布2024-10-14 09:36:45
190
发布2024-10-14 09:36:45
举报
文章被收录于专栏:深入浅出JVM

深入浅出JVM(九、十)之字节码指令

本篇文章主要围绕字节码的指令,深入浅出的解析各种类型字节码指令,如:加载存储、算术、类型转换、对象创建与访问、方法调用与返回、控制转义、异常处理、同步等

由于字节码指令种类太多,本文作为上篇概述加载存储、算术、类型转换的字节码指令

使用idea中的插件jclasslib查看编译后的字节码指令

大部分指令先以i(int)、l(long)、f(float)、d(double)、a(引用)开头

其中byte、char、short、boolean在hotspot中都是转成int去执行(使用int类型的字节码指令)

字节码指令大致分为:

  1. 加载与存储指令
  2. 算术指令
  3. 类型转换指令
  4. 对象创建与访问指令
  5. 方法调用与返回指令
  6. 操作数栈管理指令
  7. 控制转义指令
  8. 异常处理指令
  9. 同步控制指令

在hotspot中每个方法对应的一组字节码指令

这组字节码指令在该方法所对应的栈帧中的局部变量表和操作数栈上进行操作

字节码指令包含字节码操作指令 和 操作数 (操作数可能是在局部变量表上也可能在常量池中还可能就是常数)

加载与存储指令

加载

加载指令就是把操作数加载到操作数栈中(可以从局部变量表,常量池中加载到操作数栈)

  • 局部变量表加载指令
  • i/l/f/d/aload 后面跟的操作数就是要去局部变量表的哪个槽取值
  • iload_0: 去局部变量表0号槽取出int类型值
  • 常量加载指令
  • 可以根据加载的常量范围分为三种(从小到大) const < push < ldc

存储

存储指令就是将操作数栈顶元素出栈后,存储到局部变量表的某个槽中

  • 存储指令
    • i/l/f/d/astore 后面跟的操作数就是要存到局部变量表的哪个槽
    • istore_1:出栈栈顶int类型的元素保存到局部变量表的1号槽

注意: 编译时就知道了局部变量表应该有多少槽的位置 和 操作数栈的最大深度(为节省空间,局部变量槽还会复用)

从常量池加载100存储到局部变量表1号槽,从常量池加载200存储到局部变量表2号槽(其中局部变量表0号槽存储this)

算术指令

算术指令将操作数栈中的俩个栈顶元素出栈作运算再将运算结果入栈

使用的是后缀表达式(逆波兰表达式),比如 3 4 + => 3 + 4

注意

  1. 当除数是0时会抛出ArithmeticException异常
  2. 浮点数转整数向0取整
  3. 浮点数计算精度丢失
  4. Infinity 计算结果无穷大
  5. Nan 计算结果不确定计算值
代码语言:java
复制
     public void test1() {
         double d1 = 10 / 0.0;
         //Infinity
         System.out.println(d1);
 
         double d2 = 0.0 / 0.0;
         //NaN
         System.out.println(d2);
 
         //向0取整模式:浮点数转整数
         //5
         System.out.println((int) 5.9);
         //-5
         System.out.println((int) -5.9);
 
 
         //向最接近数舍入模式:浮点数运算
         //0.060000000000000005
         System.out.println(0.05+0.01);
 
         //抛出ArithmeticException: / by zero异常
         System.out.println(1/0);
     }

类型转换指令

类型转换指令可以分为宽化类型转换窄化类型转换(对应基本类型的非强制转换和强制转换)

宽化类型转换

小范围向大范围转换

  • int -> long -> float -> double
    • i2li2fi2d
    • l2fl2d
    • f2d

byte、short、char 使用int类型的指令

注意: long转换为float或double时可能发生精度丢失

代码语言:java
复制
     public void test2(){
         long l1 =  123412345L;
         long l2 =  1234567891234567899L;
 
         float f1 = l1;
         //结果: 1.23412344E8 => 123412344
         //                l1 =  123412345L
         System.out.println(f1);
 
         double d1 = l2;
         //结果: 1.23456789123456794E18 => 1234567891234567940
         //                          l2 =  1234567891234567899L
         System.out.println(d1);
     }

窄化类型转换

大范围向小范围转换

  • int->byte、char、short: i2bi2ci2s
  • long->int: l2i
  • float->long、int: f2lf2i
  • double->float、long、int: d2fd2ld2i

如果long,float,double要转换为byte,char,short可以先转为int再转为相对应类型

窄化类型转换会发生精度丢失

NaN和Infinity的特殊情况:

代码语言:java
复制
     public void test3(){
         double d1 = Double.NaN;
         double d2 = Double.POSITIVE_INFINITY;
 
         int i1 = (int) d1;
         int i2 = (int) d2;
         //0
         System.out.println(i1);
         //true
         System.out.println(i2==Integer.MAX_VALUE);
 
         long l1 = (long) d1;
         long l2 = (long) d2;
         //0
         System.out.println(l1);
         //true
         System.out.println(l2==Long.MAX_VALUE);
 
         float f1 = (float) d1;
         float f2 = (float) d2;
         //NaN
         System.out.println(f1);
         //Infinity
         System.out.println(f2);
     }

NaN转为整型会变成0

正无穷或负无穷转为整型会变成那个类型的最大值或最小值

对象创建与访问指令

对象创建与访问指令: 创建指令、字段访问指令、数组操作指令、类型检查指令

创建指令

new: 创建实例

newarray: 创建一维基本类型数组

anewarray: 创建一维引用类型数组

multianewarray: 创建多维数组

注意: 这里的创建可以理解为分配内存,当多维数组只分配了一维数组时使用的是anewarray

字段访问指令

getstatic: 对静态字段进行读操作

putstatic: 对静态字段进行写操作

getfield: 对实例字段进行读操作

putfield: 对实例字段进行写操作

读操作: 把要进行读操作的字段入栈

写操作: 把要写操作的值出栈再写到对应的字段

数组操作指令
  • b/c/s/i/l/f/d/a aload : 表示将数组中某索引元素入栈 (读)
    • 需要的参数从栈顶依次向下: 索引位置、数组引用
  • b/c/s/i/l/f/d/a astore: 表示将某值出栈并写入数组某索引元素 (写)
    • 需要的参数从栈顶依次向下: 要写入的值、索引位置、数组引用

注意: b开头的指令对byte和boolean通用

  • arraylength: 先将数组引用出栈再将获得的数组长度入栈
类型检查指令

instanceof: 判断某对象是否为某类的实例

checkcast: 检查引用类型是否可以强制转换

总结

由于字节码指令种类多篇幅长,将会分为上、下篇来深入浅出解析字节码指令,本篇作为上篇深入浅出的解析字节码指令介绍、加载存储指令、算术指令、类型转换指令以及对象创建与访问指令

字节码指令大部分以i、l、f、d、a开头,分别含义对应int、long、float、double、引用,其中byte、char、short、boolean会转换为int来执行

字节码指令分为字节码操作指令和需要操作的数据,数据可能来源于局部变量表或常量池

加载指令从局部变量表或者常量池中加载数据,存储指令将存储到对应局部变量表的槽中,实例方法的局部变量表的0号槽常用来存储this,如果方法中变量是局部存在的还可能会复用槽

算术指令为各种类型和各种算术提供算术规则,在操作数栈中使用后缀表达式对操作数进行算术

类型转换分为宽化与窄化,都可能存在精度损失

对象创建与访问指令中包含创建对象,访问实例、静态字段,操作数组,类型检查等指令

上篇文章深入浅出JVM(九)之字节码指令(上篇)已经深入浅出说明加载存储、算术、类型转换的字节码指令,本篇文章作为字节码的指令的下篇,深入浅出的解析各种类型字节码指令,如:方法调用与返回、控制转义、异常处理、同步等

使用idea中的插件jclasslib查看编译后的字节码指令

方法调用与返回指令

方法调用指令

非虚方法: 静态方法,私有方法,父类中的方法,被final修饰的方法,实例构造器

与之对应不是非虚方法的就是虚方法了

  • 普通调用指令
  • invokestatic: 调用静态方法
  • invokespecial: 调用私有方法,父类中的方法,实例构造器<init>方法,final方法
  • invokeinterface: 调用接口方法
  • invokevirtual: 调用虚方法

使用invokestaticinvokespecial指令的一定是非虚方法

使用invokeinterface指令一定是虚方法(因为接口方法需要具体的实现类去实现)

使用invokevirtual指令可能是虚方法

  • 动态调用指令
  • invokedynamic: 动态解析出需要调用的方法再执行

jdk 7 出现invokedynamic,支持动态语言

测试虚方法代码

  • 父类
代码语言:java
复制
 public class Father {
     public static void staticMethod(){
         System.out.println("father static method");
     }
 
     public final void finalMethod(){
         System.out.println("father final method");
     }
 
     public Father() {
         System.out.println("father init method");
     }
 
     public void overrideMethod(){
         System.out.println("father override method");
     }
 }
  • 接口
代码语言:java
复制
 public interface TestInterfaceMethod {
     void testInterfaceMethod();
 }
  • 子类
代码语言:java
复制
 public class Son extends Father{
 
     public Son() {
         //invokespecial 调用父类init 非虚方法
         super();
         //invokestatic 调用父类静态方法 非虚方法
         staticMethod();
         //invokespecial 调用子类私有方法 特殊的非虚方法
         privateMethod();
         //invokevirtual 调用子类的重写方法 虚方法
         overrideMethod();
         //invokespecial 调用父类方法 非虚方法
         super.overrideMethod();
         //invokespecial 调用父类final方法 非虚方法
         super.finalMethod();
         //invokedynamic 动态生成接口的实现类 动态调用
         TestInterfaceMethod test = ()->{
             System.out.println("testInterfaceMethod");
         };
         //invokeinterface 调用接口方法 虚方法
         test.testInterfaceMethod();
     }
 
     @Override
     public void overrideMethod(){
         System.out.println("son override method");
     }
 
     private void privateMethod(){
         System.out.println("son private method");
     }
 
     public static void main(String[] args) {
         new Son();
     }
 }
方法返回指令

方法返回指令: 方法结束前,将栈顶元素(最后一个元素)出栈 ,返回给调用者

根据方法的返回类型划分多种指令

操作数栈管理指令

通用型指令,不区分类型

  • 出栈
    • pop/pop2出栈1个/2个栈顶元素
  • 入栈
    • dup/dup2 复制栈顶1个/2个slot并重新入栈
    • dup_x1 复制栈顶1个slot并插入到栈顶开始的第2个slot下
    • dup_x2复制栈顶1个slot并插入到栈顶开始的第3个slot下
    • dup2_x1复制栈顶2个slot并插入到栈顶开始的第3个slot下
    • dup2_x2复制栈顶2个slot并插入到栈顶开始的第4个slot下
      • 插入到具体的slot计算: dup的系数 + _x的系数

控制转义指令

条件跳转指令

通常先进行比较指令,再进行条件跳转指令

比较指令比较结果-1,0,1再进行判断是否要跳转

条件跳转指令: 出栈栈顶元素,判断它是否满足条件,若满足条件则跳转到指定位置

注意: 这种跳转指令一般都"取反",比如代码中第一个条件语句是d>100,它第一个条件跳转指令就是ifle小于等于0,满足则跳转,不满足则按照顺序往下走

比较条件跳转指令

比较条件跳转指令 类似 比较指令和条件跳转指令 的结合体

多条件分支跳转指令

多条件分支跳转指令是为了switch-case提出的

tableswitch用于case值连续的switch多条件分支跳转指令,效率好

lookupswitch用于case值不连续的switch多条件分支跳转指令(虽然case值不连续,但最后会对case值进行排序)

tableswitch

lookupswitch

对于String类型是先找到对应的哈希值再equals比较确定走哪个case的

无条件跳转指令

无条件跳转指令就是跳转到某个字节码指令处

goto经常使用

jsr,jsr_w,ret不怎么使用了

异常处理指令

throw抛出异常对应athrow: 清除该操作数栈上所有内容,将异常实例压入调用者操作数栈上

使用try-catch/try-final/throws时会产生异常表

异常表保存了异常处理信息 (起始、结束位置、字节码指令偏移地址、异常类在常量池中的索引等信息)

athrow

异常表

异常还会被压入栈或者保存到异常表中

同步控制指令

synchronized作用于方法时,方法的访问标识会有ACC_SYNCHRONIZED表示该方法需要加锁

synchronized作用于某个对象时,对应着monitorentry加锁字节码指令和monitorexit`解锁字节码指令

Java中的synchronized默认是可重入锁

  • 当线程要访问需要加锁的对象时 (执行monitorentry)
  1. 先查看对象头中加锁次数,如果为0说明未加锁,获取后,加锁次数自增
  2. 如果不为0,再查看获取锁的线程是不是自己,如果是自己就可以访问,加锁次数自增
  3. 如果不为0且获取锁线程不是自己,就阻塞

当线程释放锁时 (执行monitorexit)会让加锁次数自减

为什么会有2个monitorexit ?

程序正常执行应该是一个monitorentry对应一个monitorexit的

如果程序在加锁的代码中抛出了异常,没有释放锁,那不就会造成其他阻塞的线程永远也拿不到锁了吗

所以在程序抛出异常时(跳转PC偏移量为15的指令)继续往下执行,抛出异常前要释放锁

总结

本篇文章作为字节码指令的下篇,深入浅出的解析方法调用与返回,操作数栈的入栈、出栈,控制转义,异常和同步相关字节码指令

方法调用指令分为静态、私有、接口、虚、动态方法等,返回指令则主要是以i、l、f、d、a开头的return指令分别处理不同类型的返回值

操作数栈中的出栈指令常用pop相关指令,入栈(复制栈顶元素并插入)常用dup相关指令

控制转义指令中条件跳转指令是判断栈顶元素来进行跳转,比较条件跳转指令是通过两个栈顶元素比较来判断跳转,多条件分支跳转是满足switch,常在异常时进行goto无条件跳转

异常处理指令用于抛出异常,清除操作数栈并将异常压入调用者操作数栈顶

同步控制指令常使用monitorentrymonitoryexit,为了防止异常时死锁,抛异常前执行monitoryexit

最后

  • 参考资料
    • 《深入理解Java虚拟机》

本篇文章将被收入JVM专栏,觉得不错感兴趣的同学可以收藏专栏哟~

觉得菜菜写的不错,可以点赞、关注支持哟~

有什么问题可以在评论区交流喔~

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 深入浅出JVM(九、十)之字节码指令
    • 加载与存储指令
      • 算术指令
        • 类型转换指令
          • 对象创建与访问指令
            • 创建指令
            • 字段访问指令
            • 数组操作指令
            • 类型检查指令
          • 总结
            • 方法调用与返回指令
              • 方法调用指令
              • 方法返回指令
            • 操作数栈管理指令
              • 控制转义指令
                • 条件跳转指令
                • 比较条件跳转指令
                • 多条件分支跳转指令
                • 无条件跳转指令
              • 异常处理指令
                • 同步控制指令
                  • 总结
                    • 最后
                    领券
                    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档