每个java开发同学不管是日常工作中还是面试里,都会遇到JDK、JVM和GC的问题。本文会从以下10个问题为切入点,带着大家一起全面了解一下JVM的方方面面。
这个基本是步入java世界的入门级知识认知,首先我们来看一下来自java官网的一张图:
从这张图里我们基本就可以看出“JRE”是运行Java语言编写的程序所不可缺少的运行环境。有了JRE我们写的java程序才可以运行起来被用户所使用。
而“JDK”俗称java开发工具包,它包括了Java运行环境JRE(Java Runtime Envirnment)以及一堆Java工具(javac/java/jdb等)和Java基础的类库(即Java API 包括rt.jar)。
但不管是JRE还是JDK都是以JVM为基石的。可以说JVM是java程序可以在某台机器上得以运行的最底层的保障。
JVM 是 Java Virtual Machine(Java 虚拟机)的缩写,它的用途简单的说就是它能让我们写的 java 程序在不同的操作系统的不同 CPU 上运行。我们写的 java 程序会利用开发工具(如 Intellij idea)把它编译成.class 文件,但这个 class 文件是不能直接被操作系统识别运行的,需要利用 jvm 按 jvm 规范将编译好的.class 文件转变成机器语言,再交由操作系统提交给 cpu 去执行。
用一句话评价 JVM 的主要作用就是:JVM 屏蔽了与具体操作系统平台相关的信息,使得 Java 程序只需生成在 Java 虚拟机上运行的目标代码(字节码),就可以在多种平台上不加修改地运行。
JVM 中核心的功能总体有三块:
首先,我们谈谈开发工具编译生成的 class 文件是如何被 JVM 加载的。所谓的类加载机制其实就是:虚拟机(JVM)把 class 文件加载到内存中,然后对它进行正确性的校验,检查通过再进行解析和初始化,最终把 class 文件变成一个内存中可以直接使用的 java.lang.Class 对象。
从一个 class 文件的装载到销毁,它的生命周期基本可以分为以下五个阶段:装载、链接(验证、准备和解析)、初始化、使用和卸载。
(3)解析(Resolve),解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用限定符 7 类符号引用进行。
比如上面的静态变量 age 初始化之后的值变为了 10。
在装载阶段的第 (2),(3) 步可以发现有运行时数据区,堆,方法区等名词,那么究竟什么是“运行时数据区”,它有哪些结构构成?
“运行时数据区”是 JVM 在执行 Java 程序的过程中出于内存管理方面的目的,在设计上把内存分为若干个不同的区域。这些区域有着各自的用途,有的区域生命周期跟虚拟机一样,随着虚拟机进程的启动而存在,伴随这虚拟机的进程结束而消亡。而有些区域则依赖用户线程的启动和结束而建立和销毁。具体如下图:
1、方法区(Method Area):
(1)用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据;
(2)方法区是各个线程共享的内存区域,在虚拟机启动时创建,因为同一个 class 类信息只需要加载一份就够了;
(3)java 虚拟机规范中把方法区描述为堆内存的一个逻辑部分,但它有另外一个别名叫“非堆”,用于与 java 堆区分开来。在 JDK8 之前方法区叫做 Perm space,在 JDK8 及以后叫做 Metaspace(即元数据区)。
2、堆(Heap):Java 堆是被所有线程共享,虚拟机启动时创建,此内存区域唯一的目的就是存放对象实例,在 Java 虚拟机规范中的描述是:所有的对象实例以及数组都要在堆上分配,但是随着 JIT 编译器的发展和逃逸分析技术逐渐成熟,栈上分配,标量替换优化技术将会导致一些微妙的变化发生,所有的对象都分配在堆上也就变得不那么绝对了。
3、虚拟机栈(Java Virtual Machine Stacks):虚拟机栈是线程私有的或者说是独有的,随着线程的创建而创建。一个线程的运行状态(正在调用哪个方法),就是由这个线程对应的虚拟机栈来保存的。
每一个被线程执行的方法,为虚拟机栈中的一个栈帧,调用一个方法,就会向栈中压入一个栈帧;一个方法调用完成,就会把该栈帧从栈中弹出。如下图解:
4、程序计数器(The Pc Register):我们都知道一个 JVM 进程中有多个线程在执行,而线程中的内容是否能够拥有执行权,是根据 CPU 调度来的。假如线程 A 正在执行到某个地方,突然失去了 CPU 的执行权,切换到线程 B 了,然后当线程 A 再获得 CPU 执行权的时候,怎么能继续执行呢?这就是需要在线程中维护一个变量,记录线程执行到的位置,这就是程序计数器。
5、本地方法栈(Native Method Stacks):本地方法栈与虚拟机栈所发挥的作用非常相似,他们之间的区别不过是虚拟机栈为虚拟机执行 Java 方法(字节码)服务,而本地方法栈则为虚拟机中使用到的 native 方法服务。即如果当前线程执行的方法是 Native 类型的,这些方法就会在本地方法栈中执行。
总结一下,就 JVM 的设计规范,从使用用途角度 JVM 的内存大体的分为:线程私有内存区 和 线程共享内存区。
线程私有内存区在类加载器编译某个 class 文件时就确定了执行时需要的“程序计数器”和“虚拟栈帧”等所需的空间,并且会伴随着当前执行线程的产生而产生,执行线程的消亡而消亡,因此“线程私有内存区”并不需要考虑内存管理和垃圾回收的问题。线程共享内存区在虚拟机启动时创建,被所有线程共享,是 Java 虚拟机所管理内存中最应该关注的和最大的一块。
那么 JVM 内存模型是如何设计的?JVM 又是如何进行内存管理(也就是垃圾回收)的?垃圾回收算法有哪些?目前常用的垃圾回收器又有哪些?我会在下篇文章跟您共同解答这些问题。
领取专属 10元无门槛券
私享最新 技术干货