上一篇介绍了Java内存运行时区域的各个部分,其中程序计数器、虚拟机栈、本地方法栈3个区域随线程而生,随线程而灭:栈中的栈帧随着方法的进入和退出而有条不紊地执行着出栈和入栈操作。每一个栈帧中分配多少内存基本上是在类结构确定下来时就已知的,因此这几个区域的内存分配和回收都具备确定性,在这几个区域内就不需要过多考虑回收的问题,因为方法结束或者线程结束时,内存自然就跟随着回收了。而Java堆和方法区则不一样,一个接口中的多个实现类需要的内存可能不一样,一个方法中的多个分支需要的内存也可能不一样,我们只有在程序处于运行期间时才能知道会创建哪些对象,这部分内存的分配和回收都是动态的,垃圾收集器所关注的就是这部分。

1.对象已死么

1.1 引用计数算法

在对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就+1,当引用时效时,计数器值就-1.任何时刻计数器为0的对象就是不可能再被使用的。

引用计数法(Reference Counting)的实现简单,判定效率也很高,在大部分情况下它都是一个不错的选择。但是,至少主流的Java虚拟机里都没有选用引用计数算法来管理内存,其中最主要的原因是它很难解决对象之间相互循环引用的问题。

1.2 可达性分析算法

在主流的商用程序语言的主流实现中都是使用可达性分析(Reachability Analysis)来判断对象是否存活的。这个算法的基本思路就是通过一系列的称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的。

如图:对象object 5、object 6、object 7虽然互有关联,但是他们到GC Roots是不可达的,所以他们将会判定为是可回收的对象。

1.3 引用

在JDK1.2之后,Java对引用的概念进行了扩充,将引用分为强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Phantom Reference)4种,这4种引用强度依次减弱。

强引用就是指在程序代码之中普遍存在的,类似“Object obj = new Object()”这类的引用,只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。

软引用是用来描述一些还有用但并非必需品的对象。对于软引用关联着的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行二次回收。如果这次回收还没有足够的内存,才会抛出内存溢出异常。在JDK1.2之后,提供了SoftReference类来实现软引用。

弱引用也是用来描述非必需对象的,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存岛下一次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。在JDK1.2之后提供了WeakReference类来实现弱引用。

虚引用也称为幽灵引用或者幻影引用,它是最弱的一种引用关系。一个对象是否具有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知。在JDK1.2之后,提供了PhantomReference类来实现虚引用。

1.4 生存还是死亡

即使在可达性分析算法中不可达的对象,也并非是“非死不可”的,这时候它们暂时处于“缓刑”阶段,要真正宣告一个对象死亡,至少要经历两次标记过程:如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链,那将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。当对象覆盖finalize()方法或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为“没有必要执行”。

如果这个对象被判定为有必要执行finalize()方法,那么这个对象将会放置一个叫做F-Queue的队列之中,并在稍后有一个由虚拟机自动建立的、优先级低的Finalizer线程去执行它。这里所谓的执行是指虚拟机会触发这个方法,但是并不承诺会等待它运行结束,这样做的原因是,如果一个对象在finalize()方法中执行缓慢,或者发生了死循环,将很可能会导致F-Queue队列中其他对象永远处于等待,甚至导致整个内存回收系统崩溃。finalize()方法是对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模的标记,如果对想要在finalize()中成功拯救自己——只要重新与引用链上的任何一个对象建立关联即可。

可以看出:SAVE_HOOK对象的finalize()方法确实被GC收集器触发过,并且在收集前成功逃脱了。

代码中有两段完全一样的代码片段,执行结果却是一次逃脱成功,一次失败,这是因为任何一个对象的finalize()方法都只会被系统自动的调用一次,如果对象面临下一次回收,它的finalize()方法不会被再次执行,因此第二段代码的自救行动失效了。

但是在任何时候不建议使用finalize()方法。

1.5 回收方法区

永久代的垃圾手机主要回收两部分内容:废弃常量和无用的类。回收废弃常量与回收Java堆中的对象十分类似。以常量池中字面量的回收为例,加入一个字符串“abc”已经进入了常量池,但是当前系统中没有人格一个String对象是叫做“abc”的,如果这时候发生了内存回收,而且必要的话,这个“abc”常量就会被系统清理出常量池。常量池中其他类(接口)、方法、字段的符号引用也与此类似。

判定一个常量是否是“废弃常量”比较简单,而要判断一个类是否是“无用的类”的条件则相对苛刻很多。类需要同时满足以下三个条件才算是“无用的类”:

1.该类的所有实例都已经被回收,也就是Java堆中不存在该类的任何实例。

2.加载该类的ClassLoader已经被回收。

3.该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。

虚拟机可以对满足上述三个条件的无用类进行回收,这里说的仅仅是“可以”,而并不是和对象一样,不使用了就必然会被回收。

2.垃圾收集算法

2.1 标记-清除算法

标记-清除(Mark-Sweep)算法,如同他的名字一样,算法分为标记和清除两个阶段:首先标记处所有需要回收的对象,在标记完成后统一回收所有被标记的对象。

它主要有两个不足,一个是效率问题,标记和清除两个过程的效率都不太高;另一个是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

2.2 复制算法

为了解决效率问题,一种称为复制(Copying)的收集算法出现了,它将可用内存按容量划分为大小相等的两块,每次只使用其中一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次性清理掉。这样是的每次都是对整个半区进行回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。只是这种算法的代价是将内存缩小为了原来的一半,代价有点太高。

现代的商业虚拟机并不是按照1:1的比例来划分内存空间,是将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块的Survivor。当被回收时,将Eden和Survivor中还存活着的对象一次性地复制到另一个Survivor区域中,最后清理掉Eden和刚刚用过的Survivor区域。HotSpot默认的Eden和Survivor比例为8:1。当Survivor空间不够时,需要依赖其他内存(老年代)进行分配担保。

2.2 标记-整理算法

根据老年代的特点,有人提出了另一种标记-清理(Mark-Compact)算法,标记过程仍然与标记-清除算法一样,但后续步骤不是直接对可回收对象进行整理,而是让所有存活的对象都向一端进行移动,然后直接清理掉端边界以外的内存。

2.3 分代收集算法

当代商业虚拟机的垃圾收集都采用“分代收集”(Generational Collection)算法,这种算法并没有什么新的思路,只是根据对象存货周期的不同将内存划分为几块。一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中,每次垃圾收集时都发现有大批对象死去,只有少数存活,那就选用复制算法,只需要付出少量存货对象的复制成本就可以完成收集。而老年代中因为对象存活率高,没有额外空间对它进行分配担保,就必须使用标记-清理或者标记-整理算法来进行回收。

3 HotSpot的算法实现

3.1 枚举根节点

可达性分析对执行时间的敏感还体现在GC停顿上,因为这项分析工作必须在一个能确保一致性的快照中进行——这里的一致性的意思是指在整个分析期间整个执行系统看起来就像被冻结在某个时间一样,不可以出现分析过程中对象引用关系还在不断变化的情况,该店不满足的话分析结果准确性就无法保证。这点是导致GC进行时必须停顿所有Java执行线程(Sun公司将其称作为Stop The World)的其中一个重要原因,即使是在号称(几乎)不会发生停顿的CMS收集器中,枚举根节点时也是必须要停顿的。

目前主流是虚拟机使用的都是准确式GC:在HotSpot的实现中,是使用一组称为OopMap的数据结构来打到这个目的的,在类加载完成的时候,HotSpot就把对象内什么偏移量上是什么类型的数据计算出来,在JIT编译过程中,也会在特定的位置(VM知道每个地方的数据是什么类型)记录下栈和寄存器中哪些位置是引用。

3.2 安全点

实际上,HotSpot并没有为每条指令都生成OopMap,正如前面提到的,会在“特定的位置”记录这些信息,这些位置称为安全点(Safepoint),即程序执行时并非在所有地方都能停顿下来开始GC,只有到达安全点时才能暂停。

所以,安全点的选定基本上是以程序“是否具有让程序长时间执行的特征”为标准进行选定的——因为每条指令执行的时间都非常短暂,程序不太可能因为指令流长度太长这个原因而过长时间运行,“长时间执行”的最明显特征就是指令序列重复,例如方法调用、循环跳转、异常跳转等,所以具有这些功能的指令才会产生Safepoint。

对于Safepoint,另一个问题是如何在GC发生时如何让所有线程都“跑”打跑最近的安全点上再停顿下来。这里有两种方案可供选择:抢先式中断(Preemptive Suspension)和主动式中断(Voluntary Suspension)。

抢先式中断不需要现成的执行代码主动去配合,在GC发生时,首先把所有线程全部中断,如果发现有线程中断的地方不在安全点上,就恢复线程,让它跑到安全点上。现在几乎没有虚拟机采用抢先式中断来暂停线程从而响应GC事件。

主动式中断的思想是当GC需要中断线程的时候,不直接对线程操作,仅仅简单地设置一个标志,各个线程执行时主动去轮询这个标志,发现中断标志为真时就自己中断挂起。轮询标志的地方和安全点是重合的,另外再加上创建对象需要分配内存的地方。

3.3 安全区域

使用Safepoint似乎已经完美解决了如何进入GC的问题,但实际情况却并不一定。Safepoint机制保证了程序执行时,在不太长的时间内就会遇到可进入的GC的Safepoint。但是,程序“不执行”的时候呢?所谓的程序不执行就是没有分配CPU时间,典型的例子就是线程处于Sleep状态或者Blocked状态,这时候线程无法响应JVM的中断请求,“走”到安全的地方去中断挂起,JVM也显然不太可能等待线程重新被分配CPU时间。对于这种情况,就需要安全区域(Safe Region)来解决。

安全区域是指在一段代码片段之中,引用关系不会发生变化。在这个区域中的任意地方开始GC都是安全的。我们也可以把Safe Region看作是被扩展了的Safepoint。

在线程执行到Safe Region中的代码时,首先标识自己已经进入到了Safe Region,那样,当在这段时间里JVM要发起GC时,就不用管表示自己为Safe Region的线程了。在线程要离开安全区域时,它要检查系统是否已经完成了根节点枚举(或者是整个GC过程)。如果完成了,那线程就继续执行,否则它必须等待直到收到可以安全离开安全区域的信号为止。

4.垃圾收集器

如果两种收集器之间存在连线,就说明他们可以搭配使用。

4.1 Serial 收集器

Serial手机其实最基本、发展历史最悠久的收集器,曾经是新生代收集器的唯一选择。这个收集器是一个单线程的收集器,但它的“单线程”的意义并不仅仅说明他只会使用一个CPU或一条收集线程去完成垃圾收集工作,更重要的是他进行垃圾收集时,必须暂停其他所有的工作线程,直到它收集结束。

虽然进行垃圾收集时,会“Stop the World”,但它依然是虚拟机运行在Client模式下默认的新生代收集器。他的优点在于简单高效。

对于限定单个CPU的环境来说,Serial收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。在用户的桌面应用场景中,分配给虚拟机管理的内存一般来说不会很大,收集几十兆甚至一两百兆的新生代,停顿时间完全可以控制在几十毫秒最多一百多毫秒以内,只要不是频繁发生,这点停顿是可以接受的。所以Serial收集器对于运行在Client模式下的虚拟机来说是一个很好的选择。

4.2 ParNew 收集器

ParNew收集器其实就是Serial收集器的多线程版本。

ParNew收集器在单CPU的环境中绝对不会比Serial收集器的效果更好,甚至由于存在线程交互的开销,该收集器在通过超线程技术实现两个CPU的环境中都不能百分百地保证可以超越Serial收集器。当然,随着可以使用的CPU数量的增加,它对于GC时系统资源的有效利用还是很有好处的。它默认开启的收集线程数和CPU个数相同。

4.3 Parallel Scavenge 收集器

Parallel Scavenge收集器是一个新生代收集器,它也是使用复制算法的收集器,又是并行的多线程收集器。

Parallel Scavenge收集器的特点是它的关注点与其他收集器不同,CMS等收集器的关注点是尽可能地缩短垃圾收集时用户线程的停顿时间,而Parallel Scavenge收集器的目标则是达到一个可控制的吞吐量(Throughput)。所谓吞吐量就是CPU用于运行用户代码的时间与CPU总消耗时间的比值。例如虚拟机总共运行了100分钟,其中垃圾回收花费了1分钟,那吞吐量就是99%。

Parallel Scavenge收集器也常常被称作“吞吐量优先”收集器。

4.4 Serial Old 收集器

Serial Old是Serial收集器的老年代版本,它同样是一个单线程收集器,使用“标记-清理”算法。这个收集器的主要意义也是在于给Client模式下的虚拟机使用。

4.5 Parallel Old 收集器

Parallel Old是Parallel Scavenge收集器的老年代版本,使用多线程和“标记-整理”算法,这个 收集器是在JDK1.6之后才开始提供的。

4.6 CMS 收集器

CMS(Concurrent Mark Sweep)收集器是一种以获取最短停顿时间为目标的收集器。目前很大一部分的Java应用集中在互联网站或者B/S系统的服务端上,这类应用尤其重视服务的响应速度,希望系统停顿时间最短,以给用户来较好的体验。CMS收集器就非常符合这类应用的需求。

CMS收集器对资源十分敏感。在并发阶段,它虽然不会导致用户线程停顿,但是会因为占用率一部分线程而导致应用程序变慢,总吞吐量会降低。CMS默认启动的收集线程数量是(CPU数量+3)/4,也就是当CPU在4个以上时,并发回收时垃圾收集线程不少于25%的CPU资源,并且随着CPU数量的增加而下降。但是当不足4个CPU时,性能下降的就比较大。

CMS收集器无法处理浮动垃圾(Floating Garbage)。由于CMS并发清理阶段用户线程还在运行着,伴随程序运行自然就还会有新的垃圾不断产生,这一部分垃圾出现在标记过程之后,CMS无法在当次收集中处理掉它们,只好留待下一次GC时再清理掉。这一部分垃圾就成为“浮动垃圾”。

CMS还有一个缺点,由于是基于“标记-清除”算法实现的收集器,手机结束时会产生大量的空间碎片,空间碎片过多时,将会给大对象分配带来很大的麻烦,往往会出现老年代还有很大的空间剩余,但是无法找到足够大的连续空间来分配当前对象,不得不提前出发一次Full GC。

4.7 G1 收集器

G1(Garbage-First)收集器是当今收集器技术发展的最前沿技术。

并行与并发:G1能充分利用多CPU、多核环境下的硬件优势,使用多个CPU来缩短Stop the World停顿的时间,部分其他收集器原本需要停顿Java线程执行的GC动作,G1收集器仍然可以用过并发的方式让Java程序继续执行。

分代收集:与其他收集器一样,分代概念在G1中依然得以保留。虽然G1可以不需要其他收集器配合就能独立管理整个堆,但它能够采用不同的方式去处理新创建的对性爱那个和已经存活了一段时间、熬过多次GC的旧对象以获得更好的收集效果。

空间整合:与CMS的标记-清理算法不同,G1整体上采用标记-整理算法,从局部(两个Region之间)采用复制算法。但无论如何,这两种算法都意味着G1运行期间不会产生内存空间碎片,收集后能提供规整的可用内存。这种特性有利于程序长时间运行,分配大对象时不会因为无法找到连续内存空间而提前触发下一次GC。

可预测的停顿点,这是G1相对于CMS的另一大优势,降低停顿时间是G1和CMS共同的关注点,但G1除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片段内,小号在垃圾收集上的时间不超过N毫秒,这几乎已经是实时Java(RTSJ)的垃圾收集器的特征了。

使用G1收集器时,它将整个Java堆分为多个大小相等的独立区域(Region),虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,他们都是一部分Region(不需要连续)的集合。

G1收集器之所以能建立可预测的停顿时间模型,是因为它可以有计划地避免在整个Java堆中进行全区域的垃圾收集。G1跟踪各个Region里面的垃圾堆积的价值大小(回收所获得的空间大小以及回收所需要的时间的经验值),在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的Region(这也就是Garbage-First名称的由来)。这种使用Region划分内存空间以及有优先级的区域回收方式,保证了G1收集器在有限的时间内可以获取尽可能高的收集效率。

在G1收集器中,Region之间的对象引用以及其他收集器中的新生代与老年代之间的对象引用,虚拟机都是使用Remembered Set来避免全盘扫描的。G1中每个Region都有一个与之对应的Remembered Set,虚拟机发现程序在对Reference类型的数据进行写操作时,会产生一个Write Barrier暂时中断写操作,检查Reference引用的对象是否处于不同的Region之中(在分代的例子中就是检查是否老年代中的对象引用了新生代中的对象),如果是,便通过CardTable把相关引用信息记录到被引用对象所属的Region的Remembered Set中。当进行内存回收时,在GC根节点的枚举范围中加入Remembered Set即可保证不对全堆扫描也不会有遗漏。

在G1工作时,初始标记阶段仅仅是标记一下GC Roots能直接关联到的对性爱那个,这个阶段需要停顿线程,但是耗时很短。并发标记阶段是从GC Roots开始对堆中的对象进行可达性分析,找出存活的对象,这阶段耗时较长,但可与用户程序并发执行。最终标记阶段则是为了修正正在并发标记期间因用户程序继续运作而导致标记产生变动的那一部分标记记录,虚拟机将这段时间对象变化记录在线程Remembered Set Logs里面,最终标记阶段需要把Remembered Set Logs的数据合并到Remembered Set中,这阶段需要停顿线程,但是可并行执行。最后再筛选回首阶段首先对各个Region的回收价值和成本进行排序,根据用户所期望的GC停顿时间来制定回收计划。

4.8 理解GC日志

最前面的数字33.125和100.667代表了GC发生的时间,这个数字的含义是从Java虚拟机启动以来经过的秒数。

[GC和[FullGC说了这次垃圾收集的停顿类型。

3324K->152K(3712K)含义是GC前该内存区域已使用容量 -> GC后该内存区域已使用容量(该内存区域总容量)。

3324K -> 152K(11904K)表示GC前Java堆已使用容量 -> GC后Java堆已使用容量(Java堆总容量)。

0.0025925 secs表示该内存区域GC所占用的时间,单位是秒。

5. 内存分配与回收策略

Java技术体系中所提倡的自动内存管理最终可以归结为自动化地解决了两个问题:给对象分配内存以及回收分配给对象的内存。

5.1 对象优先在Eden分配

这次GC发生的原因是allocation4分配内存的时候,发现Eden已经被占用了6MB,剩余空间已经不足以分配 allocation4所需的4MB内存,因此发生Minor GC。GC期间虚拟机又发现自己有的3个2MB大小的对象全部无法放入Survivor空间(Survivor只有1MB大小),所以只好通过分配担保机制提前转移到老年代去。

5.2 大对象直接进入老年代

虚拟机提供一个-XX:PretenureSizeThreshold参数,令大于这个设置值的对象直接在老年代分配。这样做的目的是避免在Eden区以及Survivor区之间发生大量的内存复制(复习一下,新生代采用复制算法收集内存)。

5.3 长期存活的对象将进入老年代

为了做到这一点,虚拟机给每个对象定义了一个对象年龄(Age)计数器。如果对象在Eden出生并经过第一次Minor GC后仍然存活,并且能被Survivor容纳的话,将被移动到Survivor空间中,并且对象年龄设为1。对象在Survivor区中每熬过一次Minor GC,年龄就会增加1岁,当他的年龄增加到一定程度(默认为15岁),就将会被晋升到老年代中。

5.4 动态对象年龄绑定

虚拟机并不是永远地要求对象的年龄必须达到了MaxTenuringThreshold才能晋升老年代,如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象就可以直接进入老年代,无须等待 MaxTenuringThreshold 中要求的年龄。

5.5 空间分配担保

在发生Minor GC之前,虚拟机会先检查老年代最大可用的连续空间是否大于新生代所有对象总空间,如果这个条件成立,那么Minor GC可以确保是安全的。如果不成立,则虚拟机会查看HandlePromotionFailure设置值是否允许担保失败。如果允许,那么会继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小,如果大于将尝试着进行一次Minor GC,尽管这次Minor GC是有风险的;如果小于,或者HandlePromotionFailure设置不允许冒险,那么这时候要改为一次Full GC。

JDK6 update24之后的规定变为只要老年代的连续空间大于新生代对象总大小或者历次晋升的平均大小就会进行Minor GC,否则将进行Full GC。


0 条评论

发表回复

Avatar placeholder

您的电子邮箱地址不会被公开。 必填项已用 * 标注