前言

JVM系列文章如无特殊说明,一些特性均是基于Hot Spot虚拟机和JDK1.8版本讲述。

下面这张图我想对于每个学习Java的人来说再熟悉不过了,这就是整个JDK的关系图:



从上图我们可以看到,Java Virtual Machine位于最底层,所有的Java应用都是基于JVM来运行的,所以学习JVM对任何一个想要深入了解Java的人是必不可少的。

Java的口号是:Write once,run anywhere(一次编写,到处运行)。之所以能实现这个口号的原因就是因为JVM的存在,JVM帮我们处理好了不同平台的兼容性问题,只要我们安装对应系统的JDK,就可以运行,而无需关心其他问题。

什么是JVM

JVM全称Java Virtual Machine,即Java虚拟机,是一种抽象计算机。与真正的计算机一样,它有一个指令集,并在运行时操作各种内存区域。虚拟机有很多种,不同的厂商提供了不同的实现,只要遵循虚拟机规范即可。目前我们常说的虚拟机一般都指的是Hot Spot

JVM对Java编程语言一无所知,只知道一种特定的二进制格式,即类文件格式。类文件包含Java虚拟机指令(或字节码)和符号表,以及其他辅助信息。也就是说,我们写好的程序最终交给JVM执行的时候会被编译成为二进制格式

注意:Java虚拟机只认二进制格式文件,所以,任何语言,只要编译之后的格式符合要求,都可以在Java虚拟机上运行,如Kotlin,Groovy等。

Java程序执行流程

从我们写好的.java文件到最终在JVM上运行时,大致是如下一个流程:



一个java类在经过编译和类加载机制之后,会将加载后得到的数据放到运行时数据区内,这样我们在运行程序的时候直接从JVM内存中读取对应信息就可以了。

运行时数据区

运行时数据区:Run-Time Data Areas。Java虚拟机定义了在程序执行期间使用的各种运行时数据区域。其中一些数据区域是在Java虚拟机启动时创建的,只在Java虚拟机退出时销毁,这些区域是所有线程共享的,所以会有线程不安全的问题发生。而有一些数据区域为每个线程独占的,每个线程独占数据区域在线程创建时创建,在线程退出时销毁,线程独占的数据区就不会有安全性问题。

Run-Time Data Areas主要包括如下部分:pc寄存器,堆,方法区,虚拟机栈,本地方法栈。

PC(program counter) Register(程序计数器)

PC Register是每个线程独占的空间。

Java虚拟机可以支持同时执行多个线程,而在任何一个确定的时刻,一个处理器只会执行一个线程中的一个指令,又因为线程具有随机性,操作系统会一直切换线程去执行不同的指令,所以为了切换线程之后能回到原先执行的位置,每个JVM线程都必须要有自己的pc(程序计数器)寄存器来独立存储执行信息,这样才能继续之前的位置往后运行。

在任何时候,每个Java虚拟机线程都在执行单个方法的代码,即该线程的当前方法。如果该方法不是Native方法,则pc寄存器会记录当前正在执行的Java虚拟机指令的地址。如果线程当前执行的方法是本地的,那么Java虚拟机的pc寄存器的值是Undefined。

Heap(堆)

堆是Java虚拟机所管理内存中最大的一块,在虚拟机启动时创建,被所有线程共享

堆在虚拟机启动时创建,用于存储所有的对象实例和数组(在某些特殊情况下不是)。

堆中的对象永远不会显式地释放,必须由GC自动回收。所以GC也主要是回收堆中的对象实例,我们平常讨论垃圾回收主要也是回收堆内存。

堆可以处于物理上不连续的内存空间,可以固定大小,也可以动态扩展,通过参数-Xms和Xmx两个参数来控制堆内存的最小和最大值。

堆可能存在如下异常情况:

  • 如果计算需要的堆比自动存储管理系统提供的堆多,将抛出OutOfMemoryError错误。

模拟堆内OutOfMemoryError

为了方便模拟,我们把堆固定一下大小,设置为:

-Xms20m -Xmx20m
 

然后新建一个测试类来测试一下:

package com.zwx.jvm.oom;

import java.util.ArrayList;
import java.util.List; public class Heap {
public static void main(String[] args) {
List<Integer> list = new ArrayList<>();
while (true){
list.add(99999);
}
}
}
 

输出结果为(后面的Java heap space,表示堆空间溢出):

Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
at java.util.Arrays.copyOf(Arrays.java:3210)
at java.util.Arrays.copyOf(Arrays.java:3181)
 

注意:堆不能设置的太小,太小的话会启动失败,如上我们把参数大小都修改为2m,会出现下面的错误:

Error occurred during initialization of VM
GC triggered before VM initialization completed. Try increasing NewSize, current value 1536K.


Method Area(方法区)

方法区是各个线程共享的内存区域,在虚拟机启动时创建。它存储每个类的结构,比如:运行时常量池、属性和方法数据,以及方法和构造函数的代码,包括在类和实例初始化以及接口初始化中使用的特殊方法。

方法区在逻辑上是堆的一部分,但是它却又一个别名叫做Non-Heap(非堆),目的是与Java堆区分开来。

方法区域可以是固定大小,也可以根据计算的需要进行扩展,如果不需要更大的方法区域,则可以收缩。方法区域的内存不需要是连续的。

方法区中可能出现如下异常:

  • 如果方法区域中的内存无法满足分配请求时,将抛出OutOfMemoryError错误。

Run-Time Constant Pool(运行时常量池)

运行时常量池是方法区中的一部分,用于存储编译生成的字面量符号引用。类或接口的运行时常量池是在Java虚拟机创建类或接口时构建的。

字面量

在计算机科学中,字面量(literal)是用于表达源代码中一个固定值的表示法(notation)。几乎所有计算机编程语言都具有对基本值的字面量表示,诸如:整数、浮点数以及字符串等。在Java中常用的字面量就是基本数据类型或者被final修饰的常量或者字符串等。

String字符串去哪了

字符串这里值得拿出来单独解释一下,在jdk1.6以及之前的版本,Java中的字符串就是放在方法区中的运行时常量池内,但是在jdk1.7和jdk1.8版本(jdk1.8之后本人没有深入去了解过,所以不讨论),将字符串常量池拿出来放到了堆(heap)里。

我们来通过一个例子来演示一下区别:

package com.zwx;

public class demo {
public static void main(String[] args) {
String str1 = new String("lonely") + new String("wolf");
System.out.println(str1==str1.intern());
}
}
 

这个语句的运行结果在不同的JDK版本中输出的结果会不一样:

JDK1.6中会输出false:



JDK1.7中输出true:



JDK1.8中也会输出true:

intern()方法
  • jdk1.6及之前的版本中:

    调用String.intern()方法,会先去常量池检查是否存在当前字符串,如果不存在,则会在方法区中创建一个字符串,而new String("")方法创建的字符串在堆里面,两个字符串的地址不相等,故而返回false。

  • 在jdk1.7及1.8版本中:

    字符串常量池从方法区中的运行时常量池移到了堆内存中,而intern()方法也随之做了改变。调用String.intern()方法,首先还是会去常量池中检查是否存在,如果不存在,那么就会创建一个常量,并将引用指向堆,也就是说不会再重新创建一个字符串对象了,两者都会指向堆中的对象,所以返回true。

    不过有一点还是需要注意,我们把上面的构造字符串的代码改造一下:

    String str1 = new String("ja") + new String("va");
    System.out.println(str1==str1.intern());
    12

这时候在jdk1.7和jdk1.8中也会返回false。

这个差异在《深入理解Java虚拟机》一书中给出的解释是java这个字符串已经存在常量池了,所以我个人的推测是可能初始化的时候jdk本身需要使用到java字符串,所以常量池中就提前已经创建好了,如果理解错了,还请大家指正,感谢!

new String(“lonely”)创建了几个对象

上面的例子中我用了两个new String(“lonely”)和new String(“wolf”)相加,而如果去掉其中一个new String()语句的话,那么实际上jdk1.7和jdk1.8中返回的也会是false,而不是true。

这是为什么?看下面(

我们假设一开始字符串常量池没有任何字符串

):

  • 只执行一个new String(“lonely”)会产生2个对象,1个在堆,1个在字符串常量池

这时候执行了String.intern()方法,String.intern()会去检查字符串常量池,发现字符串常量池存在longly字符串,所以会直接返回,不管是jdk1.6还是jdk1.7和jdk1.8都是检查到字符串存在就会直接返回,所以str1==str1.intern()得到的结果就是都是false,因为一个在堆,一个在字符串常量池。

  • 执行new String(“lonely”)+new String(“wolf”)会产生5个对象,3个在堆,2个在字符串常量池

好了,这时候执行String.intern()方法会怎么样呢,如果在jdk1.7和jdk1.8会去检查字符串常量池,发现没有lonelywolf字符串,所以会创建一个指向堆中的字符串放到字符串常量池:

而如果是jdk1.6中,不会指向堆,会重新创建一个lonelywolf字符串放到字符串常量池,所以才会产生不同的运行结果。

注意:+号的底层执行的是new StringBuild().append()语句,所以我们再看下面一个例子:

String s1 = new StringBuilder("aa").toString();
System.out.println(s1==s1.intern());
String s2 = new StringBuilder("aa").append("bb").toString();
System.out.println(s2==s2.intern());//1.6返回false,1.7和1.8返回true
 

这个在jdk1.6版本全部返回false,而在jdk1.7和jdk1.8中一个返回false,一个返回true。多了一个append相当于上面的多了一个+号,原理是一样的。

符号引用

符号引用在下篇讲述类加载机制的时候会进行解释,这里暂不做解释,

**感兴趣的可以关注我,留意我的JVM系列下一篇文章**

jdk1.7和1.8的实现方法区的差异

方法区是Java虚拟机规范中的规范,但是具体如何实现并没有规定,所以虚拟机厂商完全可以采用不同的方式实现方法区的。

在HotSpot虚拟机中:

  • jdk1.7及之前版本

方法区采用永久代(Permanent Generation)的方式来实现,方法区的大小我们可以通过参数-XX:PermSize和-XX:MaxPermSize来控制方法区的大小和所能允许最大值。

  • jdk1.8版本

移除了永久代,采用元空间(Metaspace)来实现方法区,所以在jdk1.8中关于永久代的参数-XX:PermSize和-XX:MaxPermSize已经被废弃却代之的是参数-XX:MetaspaceSize和-XX:MaxMetaspaceSize。元空间和永久代的一个很大的区别就是元空间已经不在jvm内存在,而是直接存储到了本地内存中。

如下,我们再jdk1.8中设置-XX:PermSize和-XX:MaxPermSize会给出警告:

Java HotSpot(TM) 64-Bit Server VM warning: ignoring option PermSize1m; support was removed in 8.0
Java HotSpot(TM) 64-Bit Server VM warning: ignoring option MaxPermSize1m; support was removed in 8.0
 

模拟方法区OutOfMemoryError

jdk1.7及之前版本

因为jdk1.7及之前都是永久代来实现方法区,所以我们可以通过设置永久代参数来模拟内存溢出:

设置永久代最大为2M:

-XX:PermSize=2m -XX:MaxPermSize=2m
 



然后执行如下代码:

package com.zwx;

import java.util.ArrayList;
import java.util.List; public class demo {
public static void main(String[] args) {
List<String> list = new ArrayList<>();
int i = 0;
while (true){
list.add(String.valueOf(i++).intern());
}
}
}
 

最后报错OOM:PermGen space(永久代溢出)。

Error occurred during initialization of VM
java.lang.OutOfMemoryError: PermGen space
at sun.misc.Launcher$ExtClassLoader.getExtClassLoader(Launcher.java:141)
at sun.misc.Launcher.<init>(Launcher.java:71)
at sun.misc.Launcher.<clinit>(Launcher.java:57)
 

jdk1.8

jdk1.8版本,因为永久代被取消了,所以模拟方式会不一样。

首先引入asm字节码框架依赖(前面介绍动态代理的时候提到cglib动态代理也是利用了asm框架来生成字节码,所以也可以直接cglib的api来生成):

<dependency>
<groupId>asm</groupId>
<artifactId>asm</artifactId>
<version>3.3.1</version>
</dependency>
 

创建一个工具类去生成class文件:

package com.zwx.jvm.oom;

import jdk.internal.org.objectweb.asm.ClassWriter;
import jdk.internal.org.objectweb.asm.MethodVisitor;
import org.objectweb.asm.Opcodes; import java.util.ArrayList;
import java.util.List; public class MetaspaceUtil extends ClassLoader { public static List<Class<?>> createClasses() {
List<Class<?>> classes = new ArrayList<Class<?>>();
for (int i = 0; i < 10000000; ++i) {
ClassWriter cw = new ClassWriter(0);
cw.visit(Opcodes.V1_1, Opcodes.ACC_PUBLIC, "Class" + i, null,
"java/lang/Object", null);
MethodVisitor mw = cw.visitMethod(Opcodes.ACC_PUBLIC, "<init>",
"()V", null, null);
mw.visitVarInsn(Opcodes.ALOAD, 0);
mw.visitMethodInsn(Opcodes.INVOKESPECIAL, "java/lang/Object",
"<init>", "()V");
mw.visitInsn(Opcodes.RETURN);
mw.visitMaxs(1, 1);
mw.visitEnd();
MetaspaceUtil test = new MetaspaceUtil();
byte[] code = cw.toByteArray();
Class<?> exampleClass = test.defineClass("Class" + i, code, 0, code.length);
classes.add(exampleClass);
}
return classes;
}
}
 

设置元空间大小

-XX:MetaspaceSize=5M -XX:MaxMetaspaceSize=5M 
 

然后运行测试类模拟:

package com.zwx.jvm.oom;

import java.util.ArrayList;
import java.util.List; public class MethodArea {
public static void main(String[] args) {
//jdk1.8
List<Class<?>> list=new ArrayList<Class<?>>();
while(true){
list.addAll(MetaspaceUtil.createClasses());
}
}
}


抛出如下异常OOM:Metaspace:

Java Virtual Machine Stacks(Java虚拟机栈)

每个Java虚拟机线程都有一个与线程同时创建的私有Java虚拟机栈。

Java虚拟机栈存储栈帧(Frame)。每个被调用的方法就会产生一个栈帧,栈帧中保存了一个方法的状态信息,如:局部变量,操作栈帧,方出出口等。

调用一个方法,就会产生一个栈帧,并压入栈内;一个方法调用完成,就会把该栈帧从栈中弹出,大致调用过程如下图所示:



Java虚拟机栈中可能有下面两种异常情况:

  • 如果线程执行所需栈深度大于Java虚拟机栈深度,则会抛出StackOverflowError

    上图可以知道,其实方法的调用就是入栈和出栈的过程,如果一直入栈而不出栈就容易发生异常(如递归)。
  • 如果Java虚拟机栈可以动态地扩展,但是扩展大小的时候无法申请到足够的内存,则会抛出一个OutOfMemoryError。

    大部分Java虚拟机栈都是支持动态扩展大小的,也允许设置固定大小(在Java虚拟机规范中两种都是可以的,具体要看虚拟机的实现)。

注:我们经常说的JVM中的栈,一般指的就是Java虚拟机栈。

模拟栈内StackOverflowError

下面是一个简单的递归方法,没有跳出递归条件:

package com.zwx.jvm.oom;

public class JMVStack {
public static void main(String[] args) {
test();
} static void test(){
test();
}
}
 

输出结果为:

Exception in thread "main" java.lang.StackOverflowError
at com.zwx.jvm.oom.JMVStack.test(JMVStack.java:15)
at com.zwx.jvm.oom.JMVStack.test(JMVStack.java:15)
.....
 

Native Method Stacks(本地方法栈)

本地方发栈类似于Java虚拟机栈,区别就是本地方法栈存储的是Native方法。本地方发栈和Java虚拟机栈在有的虚拟机中是合在一起的,并没有分开,如:Hot Spot虚拟机。

本地方法栈可能出现如下异常:

  • 如果线程执行所需栈深度大于本地方法栈深度,则会抛出StackOverflowError。
  • 如果可以动态扩展本地方法栈,但是扩展大小的时候无法申请到足够的内存,则会抛出OutOfMemoryError。

总结

本文主要介绍了jvm运行时数据区的构造,以及每部分区域到底都存了哪些数据,然后去模拟了一下常见异常的产生方式,当然,模拟异常的方式很多,关键要知道每个区域存了哪些东西,模拟的时候对应生成就可以。

本文主要从总体上介绍运行时数据区,主要是有一个概念上的认识,下一篇,将会介绍类加载机制,以及双亲委派模式,介绍类加载模式的同时会对运行时数据区做更详细的介绍。

**请关注我,一起学习进步**
 
 

最新文章

  1. Bad Request - Request Too Long
  2. ruby发送邮件方法
  3. .Net的错误机制
  4. 此项目的默认Web访问模式设置为文件共享, 但是无法从路径(此为转贴)
  5. Samba匿名用戶仅仅唯读访问
  6. java接口测试入门
  7. 2.11 while循环的嵌套以及应用(难)
  8. python一些语法糖用法
  9. Lecture6.概率极限理论
  10. HashSet源码
  11. 分布式系统ID生成方案
  12. Set接口——HashSet集合
  13. mysql生成不重复随机数(unique number generation)
  14. linux手工释放内存
  15. [.NET开发] C#连接MySQL的两个简单代码示例
  16. [转发]CPU个数、CPU核心数、CPU线程数
  17. C#网络编程(二)应用篇
  18. iOS No suitable application records were found. Verify your bundle identifier &#39;xxx&#39; is correct.
  19. 【Android】9.0活动的生命周期(二)——实际代码演示
  20. HTML基础全荟

热门文章

  1. ImportError: No module named git
  2. fsck知识点记录
  3. Linux基本命令及编程环境实验
  4. Spring Cloud--尚硅谷2020最新版
  5. 求求大厂给个Offer:Map面试题
  6. 使用 Python破解大众点评字体加密(SVG反扒)
  7. Python开发的入门教程(六)-函数
  8. 记录laravelchina中的微信小程序教程的npm install安装报错
  9. PyCharm 中文教程 01:运行 Python 的四种方式
  10. Labview学习之路(一)程序框图中的修饰