JVM的垃圾回收机制

1. 基本概念

1.1 什么是垃圾回收

垃圾回收(Garbage Collection, GC)是Java虚拟机(JVM)自动管理内存的核心机制，它的主要任务是自动回收不再使用的对象所占用的内存，以避免内存泄漏和内存溢出问题。

在C++等语言中，开发者需要手动分配和释放内存，而在Java中，开发者只需创建对象，JVM会通过垃圾回收器自动回收不再使用的对象，大大降低了内存管理的复杂性。

1.2 为什么需要垃圾回收

简化开发：开发者无需关心内存释放，降低编程难度
提高安全性：避免忘记释放内存导致的内存泄漏
增强健壮性：减少因内存管理不当导致的程序崩溃
优化内存使用：自动回收可以更高效地利用内存资源

1.3 垃圾回收的基本原理

垃圾回收的基本原理是识别哪些对象是"垃圾"（即不再被使用的对象），然后回收这些对象占用的内存。判断对象是否为垃圾的主要方法有两种：

引用计数法：为每个对象维护一个引用计数器，当引用计数为0时，对象即为垃圾。
可达性分析法：从一组称为"GC Roots"的根节点出发，搜索所有可达的对象，不可达的对象即为垃圾。

JVM主要使用可达性分析法来判断对象是否存活。

2. JVM内存结构

在深入理解垃圾回收之前，需要了解JVM的内存结构，特别是堆内存的划分。

--- title: JVM内存结构 --- graph TD A["JVM内存"] --> B["方法区/元空间"] A --> C["堆内存"] A --> D["虚拟机栈"] A --> E["本地方法栈"] A --> F["程序计数器"] C --> G["新生代"] C --> H["老年代"] G --> I["Eden区"] G --> J["Survivor区"] J --> K["S0区"] J --> L["S1区"]

2.1 堆内存

堆内存是JVM中最大的一块内存区域，也是垃圾回收的主要区域。堆内存被划分为两个主要区域：

新生代(Young Generation)：
- Eden区：新对象首先被分配在这里
- Survivor区：分为S0和S1两个区域，用于存放从Eden区经过一次GC后仍然存活的对象
老年代(Old Generation)：
- 存放长期存活的对象
- 当对象在新生代中经过一定次数的GC后仍然存活，就会被移到老年代

2.2 非堆内存

方法区/元空间：存储类信息、常量、静态变量等数据
虚拟机栈：存储局部变量表、操作数栈、动态链接、方法出口等
本地方法栈：为虚拟机使用到的Native方法服务
程序计数器：记录当前线程执行的位置

3. 垃圾回收算法

3.1 标记-清除算法(Mark-Sweep)

标记-清除算法是最基础的垃圾回收算法，分为两个阶段：

标记阶段：从GC Roots出发，标记所有可达的对象。
清除阶段：遍历整个堆内存，回收未被标记的对象。

--- title: 标记-清除算法 --- graph TD A["开始"] --> B["标记阶段"] B --> C["从GC Roots出发，标记所有可达对象"] C --> D["清除阶段"] D --> E["遍历堆内存，回收未标记对象"] E --> F["结束"]

优点：

实现简单，容易理解

缺点：

产生内存碎片
标记和清除的效率不高

3.2 复制算法(Copying)

复制算法将可用内存按容量划分为大小相等的两块，每次只使用其中一块。当这一块内存用完了，就将还存活的对象复制到另一块上，然后一次性清理掉这一块内存。

--- title: 复制算法 --- graph TD A["内存分为A、B两块"] --> B["使用A块"] B --> C["A块满时触发GC"] C --> D["将A块中存活对象复制到B块"] D --> E["一次性清理A块"] E --> F["切换使用B块"]

优点：

实现简单，运行高效
不会产生内存碎片
回收时不用考虑内存碎片等复杂情况

缺点：

内存利用率低，只能使用一半的内存
如果存活对象较多，复制成本较高

3.3 标记-整理算法(Mark-Compact)

标记-整理算法结合了标记-清除和复制算法的优点。标记阶段与标记-清除算法相同，但在清理阶段不是直接回收垃圾对象，而是将所有存活对象向一端移动，然后直接清理掉端边界以外的内存。

--- title: 标记-整理算法 --- graph TD A["开始"] --> B["标记阶段"] B --> C["从GC Roots出发，标记所有可达对象"] C --> D["整理阶段"] D --> E["将存活对象向一端移动"] E --> F["清理端边界以外的内存"] F --> G["结束"]

优点：

不会产生内存碎片
不需要像复制算法那样预留一半内存

缺点：

移动对象并更新所有引用指针的成本较高

3.4 分代收集算法(Generational Collection)

分代收集算法是目前商业JVM普遍采用的垃圾回收算法。它基于"分代假说"：绝大多数对象都是"朝生夕死"的，存活时间长的对象倾向于更长时间存活。

根据这个假说，JVM将堆内存划分为新生代和老年代，针对不同代采用不同的回收算法：

新生代：
- 大部分对象在这里分配和回收
- 采用复制算法
- GC频率高，但回收速度快
老年代：
- 存放长期存活的对象
- 采用标记-清除或标记-整理算法
- GC频率低，但回收时间长

--- title: 分代收集算法 --- graph TD A["对象创建"] --> B["在新生代Eden区分配"] B --> C["Eden区满时触发Minor GC"] C --> D["存活对象移到Survivor区"] D --> E["经过多次Minor GC仍存活的对象"] E --> F["晋升到老年代"] F --> G["老年代空间不足时触发Major GC/Full GC"] G --> H["使用标记-清除或标记-整理算法回收"]

4. 垃圾收集器

JVM提供了多种垃圾收集器实现，以适应不同的应用场景。以下是主要的垃圾收集器：

4.1 Serial收集器

Serial收集器是最基本、历史最悠久的收集器，它是一个单线程收集器，在进行垃圾回收时，必须暂停所有用户线程。

特点：

单线程工作
使用复制算法（新生代）和标记-整理算法（老年代）
适合客户端模式或内存较小的环境

4.2 Parallel收集器

Parallel收集器是Serial收集器的多线程版本，能够充分利用多核CPU的性能，缩短"Stop-The-World"时间。

特点：

多线程工作
使用复制算法（新生代）和标记-整理算法（老年代）
也称为"吞吐量优先收集器"
适合在后台计算而不需要太多交互的任务

4.3 CMS(Concurrent Mark Sweep)收集器

CMS收集器是一种以获取最短回收停顿时间为目标的收集器，它是基于标记-清除算法实现的。

特点：

并发标记、并发清除
大部分时间与用户线程并发执行
产生内存碎片
适合对响应时间有高要求的应用

4.4 G1(Garbage-First)收集器

G1收集器是JDK 7u4版本引入的一种新型垃圾收集器，它是一款面向服务端的收集器，旨在替换CMS收集器。

特点：

并行与并发
分代收集
空间整合（整体上基于标记-整理算法，局部基于复制算法）
可预测的停顿时间模型
将堆划分为多个Region，优先回收价值最大的Region（Garbage-First名称由来）

--- title: G1收集器Region划分 --- graph TD A["堆内存"] --> B["Region 1"] A --> C["Region 2"] A --> D["Region 3"] A --> E["Region 4"] A --> F["Region 5"] A --> G["..."] B --> H["Eden"] C --> I["Survivor"] D --> J["Old"] E --> K["Humongous"] F --> L["Free"]

4.5 ZGC和Shenandoah收集器

ZGC和Shenandoah是JDK 11及以后版本引入的低延迟垃圾收集器，它们的共同目标是实现无论堆内存多大，都能将垃圾收集的停顿时间控制在几毫秒以内。

ZGC特点：

并发标记、并发转移
支持TB级别的堆内存
停顿时间不超过10ms

Shenandoah特点：

并发整理算法
与用户线程并发进行对象移动
降低停顿时间

5. 垃圾回收触发条件

5.1 Minor GC触发条件

当Eden区空间不足时，会触发Minor GC
Minor GC会回收新生代的垃圾对象，并将存活对象复制到Survivor区

5.2 Major GC/Full GC触发条件

老年代空间不足时
方法区空间不足时
通过System.gc()方法调用（不推荐使用，不保证立即执行）
上次GC后Heap大小分配的动态变化

6. GC日志与调优

6.1 GC日志参数

常用JVM参数用于开启GC日志：

# 开启GC日志
-XX:+PrintGC
-XX:+PrintGCDetails
-XX:+PrintGCTimeStamps
-XX:+PrintGCApplicationStoppedTime

# 将GC日志输出到文件
-Xloggc:/path/to/gc.log

# 日志格式控制（JDK 9+）
-Xlog:gc*:file=/path/to/gc.log:tags,uptime,time,level

6.2 GC调优原则

明确目标：是追求高吞吐量还是低延迟
数据驱动：通过GC日志和监控工具分析问题
逐步调整：一次只调整一个参数，观察效果
全面考虑：考虑应用特点、硬件资源等因素

6.3 常用调优参数

# 设置堆大小
-Xms512m  # 初始堆大小
-Xmx2g    # 最大堆大小

# 设置新生代比例
-XX:NewRatio=2  # 新生代与老年代比例为1:2

# 设置Survivor区比例
-XX:SurvivorRatio=8  # Eden区与Survivor区比例为8:1

# 设置对象晋升到老年代的年龄
-XX:MaxTenuringThreshold=15

# 选择垃圾收集器
-XX:+UseSerialGC       # Serial收集器
-XX:+UseParallelGC     # Parallel收集器
-XX:+UseConcMarkSweepGC  # CMS收集器
-XX:+UseG1GC           # G1收集器
-XX:+UseZGC            # ZGC收集器(JDK 11+)

7. 内存分配与回收策略

7.1 对象优先在Eden区分配

大多数情况下，对象在新生代的Eden区中分配。当Eden区没有足够空间进行分配时，JVM将发起一次Minor GC。

7.2 大对象直接进入老年代

大对象是指需要大量连续内存空间的Java对象（如很长的字符串或数组）。JVM提供了-XX:PretenureSizeThreshold参数，大于这个设置值的对象将直接在老年代分配，避免在Eden区和Survivor区之间来回复制。

7.3 长期存活的对象将进入老年代

JVM给每个对象定义了一个对象年龄计数器。如果对象在Eden出生并经过第一次Minor GC后仍然存活，并且能被Survivor容纳，将被移动到Survivor区，对象年龄设为1。对象在Survivor区中每经过一次Minor GC，年龄就增加1，当年龄增加到一定程度（默认为15），就会被晋升到老年代。

7.4 动态对象年龄判定

为了更好地适应不同程序的内存状况，JVM并不要求对象年龄必须达到MaxTenuringThreshold才能晋升老年代。如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半，年龄大于或等于该年龄的对象就可以直接进入老年代。

7.5 空间分配担保

在发生Minor GC之前，JVM会检查老年代最大可用连续空间是否大于新生代所有对象总空间，如果条件成立，那么Minor GC可以确保是安全的。如果不成立，则JVM会查看HandlePromotionFailure设置值是否允许担保失败。如果允许，那么会继续检查老年代最大可用连续空间是否大于历次晋升到老年代对象的平均大小，如果大于，将尝试进行一次Minor GC，尽管这次Minor GC是有风险的；如果小于，或者HandlePromotionFailure设置不允许冒险，那这时也要改为进行一次Full GC。

8. 常见问题与解决方案

8.1 内存溢出(OutOfMemoryError)

原因：

堆内存不足：对象太多或对象太大
永久代/元空间不足：加载的类信息太多
栈内存不足：线程过多或递归调用太深

解决方案：

增加相应内存区域的JVM参数
优化代码，减少不必要的对象创建
检查是否有内存泄漏

8.2 内存泄漏(Memory Leak)

原因：

长生命周期对象持有短生命周期对象的引用
未关闭的资源（如数据库连接、文件流等）
静态集合类不断添加元素

解决方案：

及时释放对象引用
使用try-with-resources或确保资源被正确关闭
定期清理静态集合

8.3 GC频繁或停顿时间长

原因：

堆内存设置不合理
对象创建速率过高
垃圾收集器选择不当

解决方案：

调整堆内存大小和比例
优化代码，减少对象创建
选择合适的垃圾收集器
调整GC参数

9. 总结

JVM的垃圾回收机制是Java自动内存管理的核心，它通过自动回收不再使用的对象，大大简化了内存管理，提高了开发效率和程序稳定性。理解垃圾回收机制对于Java开发者来说至关重要，特别是在性能调优和故障排查方面。

垃圾回收机制涉及多个方面，包括内存结构、回收算法、垃圾收集器、内存分配策略等。开发者需要根据应用的特点和需求，选择合适的垃圾收集器和参数，以达到最佳的性能表现。

account_tree

思维导图

Interview AiBoxInterview AiBox — 面试搭档

不只是准备，更是实时陪练

Interview AiBox 在面试过程中提供实时屏幕提示、AI 模拟面试和智能复盘，让你每一次回答都更有信心。

免费下载 Interview AiBoxdownload 查看价格方案sell

AI 助读

一键发送到常用 AI

JVM垃圾回收机制是Java自动内存管理的核心，通过自动回收不再使用的对象来避免内存泄漏和溢出。它基于可达性分析算法判断对象是否存活，主要采用分代收集策略，将堆内存分为新生代和老年代，针对不同代采用不同回收算法。常见垃圾收集器包括Serial、Parallel、CMS、G1、ZGC等，各有特点适用于不同场景。垃圾回收的触发条件、内存分配策略、GC调优等都是理解JVM垃圾回收机制的重要内容。掌握这些知识对于Java开发者进行性能调优和故障排查至关重要。

智能总结

深度解读

考点定位

思路启发