1 概述

1.1 程序计数器(线程私有)

程序计数器(Program Count Register)是一块较小的内存空间,它可以看作是当前线程所执行的字节码行号的指示器。

如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是Native方法,这个计数器值则为空(Undefined)。此内存区域是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError情况的区域。

1.2 Java虚拟机栈(线程私有)

Java虚拟机栈(Java Virtual Machine Stacks)也是线程私有的。它的生命周期与线程相同。每个方法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。

我们常说的“栈”指的就是Java虚拟机栈,或者说是虚拟机栈中局部变量表的部分。

局部变量表存放了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(reference类型,它本身不等同于对象本身,可能是一个指向对象起始地址的引用指针等)、returnAddress类型(指向了一条字节码指令的地址)。

局部变量表所需的内存空间在编译期间完成分配,在方法运行期间不会改变局部变量表的大小。

1.3 本地方法栈(线程私有)

本地方法栈(Native Method Stack)与虚拟机栈所发挥的作用是非常类似的,甚至有的虚拟机(例如Sun HotSpot虚拟机)直接就把本地方法栈和虚拟机栈合二为一。

1.4 Java堆(线程共享)

Java堆(Java Heap)是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象的实例,几乎所有的对象实例都在这里进行分配。

Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。

1.5 方法区(线程共享)

方法区(Method Area)与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。

Java虚拟机规范对方法区的限制非常宽松,除了和Java堆一样不需要连续的内存和可以选择固定大小或者可扩展外,还可以选择不实现垃圾收集。

1.6 运行时常量池(线程共享)

运行时常量池(Runtime Constant Pool)是方法区的一部分。

2.对象

2.1 对象的创建

1.虚拟机遇到一条new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程。

2.在类加载通过检查后,接下来虚拟机将为新生对象分类内存。

为对象分配空间的任务等同于把一块确定大小的内存从Java堆中划分出来。假设Java堆中内存是绝对规整的所有用过的内存都放在一边,空闲的内存放在另一边,中间放着一个指针作为分界点的指示器,哪所分配的内存就仅仅是把那个指针向空闲空间那边挪动一段与对象大小相同的距离,这种分配方式称为“指针碰撞”(Bump the Point)。

如果Java堆中的内存并不是规整的,已使用的内存和空闲的内存相互交错,那就没有办法简单地进行指针碰撞了。虚拟机就必须维护一个列表,记录上哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录,这种分配方式称为“空闲列表”(Free List)。

那么如何确保分配内存过程中的线程安全呢?

解决这个问题有两种方案。一种是对分配空间内存的动作进行同步处理。另一种是把内存分配的动作按照线程划分在不同的空间之中进行——即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(Thread Local Allocation Buffer,TLAB)。哪个线程要分配内存,就在哪个线程的TLAB上进行分配,只有TLAB用完并分配新的TLAB时才需要 同步锁定。

3.内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零(不包括对象头),如果使用TLAB,这一工作过程也可以提前到TLAB分配时进行。这一步骤保证了对象实例字段在Java代码中可以不赋初始值就直接使用,程序访问到这些字段的数据类型所对应的零值。

4.虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存放在对象的对象头(Object Header)之中。根据虚拟机当前的运行状态的不同,如是否启用偏向锁等,对象头会有不同的设置方式。

5.在上面工作都完成之后,从虚拟机的角度来说一个新的对象已经完成了。但是从Java程序的角度来说,还需要调用<init>方法,这样一个真正的对象才算完全产生出来。

2.2 对象的内存布局

在HotSpot虚拟机中,对象在内存中存储的布局可以分为3块区域:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)。

HotSpot虚拟机的对象头包括两部分信息,第一部分用于存储对象自身的运行时数据,如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等等。这部分数据的长度在32位和64位的虚拟机中分别为32bit和64bit(未开启压缩指针),官方称他为“Mark word”。

对象头的另外一部分是类型指针,即对象指向他的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。如果对象是一个Java数据,那在对象头中还必须有一块用于记录数组长度的数据,因为虚拟机可以通过普通Java对象的元数据信息确定Java对象的大小,但是从数组的元数据中却无法确定数组的大小。

接下来的实例数据部分是对象真正存储的有效信息,也是处在程序代码中所定义的各种类型的字段内容。无论是从父类继承下来的,还是在子类中定义的,都需要记录下来。这部分的存储顺序会受到虚拟机分配策略参数(FieldsAllocationStyle)和字段在Java源码中定义顺序的影响。

第三部分对齐填充并不是必然存在的,也没有什么特别的含义,它仅仅起着占位符的作用。由于HotSpot VM自动内存管理系统要求对象起始地址必须是8的整数倍,也就是说对象的大小必须是8字节的整数倍,而对象头部分正好是8字节的倍数,因此,当对象实例数据部分没有对齐时,就需要通过对齐填充来补全。

2.3 对象的访问定位

建立对象是为了使用对象,我们的Java程序需要通过栈上的reference数据来操作堆上的具体对象。目前主流的访问方式有使用句柄和直接指针两种。

如果使用句柄访问的话,那么Java堆中将会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自的具体地址信息。

使用句柄来访问的最大好处就是reference中存储的信息是稳定的句柄地址,在对象被移动(垃圾收集时移动对象是非常普遍的行为)时,只会改变句柄中的实例数据指针。

如果使用指针直接访问,那么Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,而reference中存储的直接就是对象地址。

使用直接指针访问方式最大的好处就是速度更快,它节省了一次指针定位时的开销,由于对象的访问在Java中非常频繁,因此这类开销积少成多后也是一项非常可观的执行成本。

目前Sun HotSpot主要使用第二种,即直接指针访问方式进行。

3 OutOfMemoryError异常

3.1 Java堆溢出

当出现Java堆溢出时,异常堆栈信息会显示“java.lang.OutOfMemoryError”并且会进一步提示“Java heap space”。

要解决这个问题,一般式通过内存映像分析工具,分析是发生了内存泄露还是内存溢出,如果内存泄露,可进一步通过工具查看GC Roots引用链,找到泄露位置。如果是内存溢出,可以通过修改Xmx和Xms参数来修改堆大小。

3.2 虚拟机栈和本地方方法栈溢出

如果线程请求的栈深度大于虚拟机所允许的最大深度,将会抛出StackOverFlowError异常。

如果虚拟机在扩展时无法申请到足够多的内存空间,则抛出OutOfMemoryError异常。

3.3 方法区和运行时常量池溢出

运行时常量池溢出后会显示“OutOfMemoryError”后面跟着“PermGen space”。

需要注意的是:在书中的代码中:

后写:这段代码在JDK1.6中运行会得到两个flase,而在JDK1.7(或更高)中运行会得到一个true和一个flase。

产生差异的原因是:在JDK1.6中,intern()方法会把首次遇到的字符串实例复制到永久代中,返回的也是永久代中这个字符串实例的引用,而由StringBuilder创建的字符串实例在Java堆上,所以必然不是同一个引用。将返回flase。

而JDK1.7以及上的intern()不会再复制实例,只是在常量池中记录首次出现的实例引用。因此intern()和StringBuilder创建的是同一个。

但是为什么会有一个true呢?

因为虚拟机在初始化的时候,会生成例如JDK1.8、java这类字符串到常量池中,因此自然会产生一个true。

那么众所周知,字符串对象应该是在堆中的,为什么会在常量池中呢?

那是因为在生成字符串对象时,实际上产生了两个对象,会在常量池中生成,然后在堆中生存对象,并指向常量池中常量。因此“相同”的字符串对象因为堆中地址不同,equals会是false,但是实际上他们堆中都指向同一个常量池常量。


0 条评论

发表回复

Avatar placeholder

您的电子邮箱地址不会被公开。 必填项已用 * 标注