Java中的垃圾回收机制及其工作原理

1. Java垃圾回收概述

Java中的垃圾回收(Garbage Collection, GC)是自动内存管理的核心机制，它负责自动识别和回收不再使用的对象，从而释放内存空间。与C++等需要手动管理内存的语言不同，Java通过垃圾回收机制大大简化了内存管理，减少了内存泄漏和悬空指针等问题。

垃圾回收的主要目标：

自动释放不再使用的内存
避免内存泄漏
提高开发效率
保证程序稳定性

2. JVM内存结构

要理解垃圾回收，首先需要了解Java虚拟机(JVM)的内存结构。JVM内存主要分为以下几个区域：

--- title: JVM内存结构 --- graph TD A["JVM内存"] --> B["方法区(Method Area)"] A --> C["堆内存(Heap)"] A --> D["虚拟机栈(VM Stack)"] A --> E["本地方法栈(Native Method Stack)"] A --> F["程序计数器(Program Counter Register)"] C --> G["新生代(Young Generation)"] C --> H["老年代(Old Generation)"] G --> I["Eden区"] G --> J["Survivor区"] J --> K["Survivor 0"] J --> L["Survivor 1"]

方法区：存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码缓存等数据。
堆内存：Java中最大的一块内存，所有对象实例以及数组都在这里分配内存。是垃圾回收的主要区域。
- 新生代(Young Generation)：新创建的对象首先存放在这里。
  - Eden区：对象刚创建时存放的地方。
  - Survivor区：分为Survivor 0和Survivor 1，存放从Eden区经过一次Minor GC后仍然存活的对象。
- 老年代(Old Generation)：存放长期存活的对象。
虚拟机栈：存储局部变量表、操作数栈、动态链接、方法出口等信息。
本地方法栈：为虚拟机使用到的Native方法服务。
程序计数器：记录当前线程所执行的字节码行号指示器。

3. 垃圾判断算法

JVM如何判断哪些对象是"垃圾"呢？主要有以下几种算法：

3.1 引用计数算法

原理：给对象添加一个引用计数器，每当有一个地方引用它时，计数器值加1；当引用失效时，计数器值减1；任何时刻计数器为0的对象就是不可能再被使用的。
优点：实现简单，判定效率高。
缺点：很难解决对象之间相互循环引用的问题。

3.2 可达性分析算法

原理：通过一系列称为"GC Roots"的对象作为起始点，从这些节点开始向下搜索，搜索所走过的路径称为引用链(Reference Chain)，当一个对象到GC Roots没有任何引用链相连时，则证明此对象是不可用的。

--- title: 可达性分析算法 --- graph TD A["GC Roots"] --> B["对象1"] A --> C["对象2"] B --> D["对象3"] C --> D D --> E["对象4"] F["对象5"] --> G["对象6"] G --> F style A fill:#f9f,stroke:#333,stroke-width:2px style F fill:#ff9999,stroke:#333,stroke-width:2px style G fill:#ff9999,stroke:#333,stroke-width:2px A -.->|引用链| B B -.->|引用链| D C -.->|引用链| D D -.->|引用链| E F -.->|引用链| G G -.->|引用链| F

GC Roots对象包括：
- 虚拟机栈（栈帧中的本地变量表）中引用的对象。
- 方法区中类静态属性引用的对象。
- 方法区中常量引用的对象。
- 本地方法栈中JNI（即一般说的Native方法）引用的对象。
- Java虚拟机内部的引用（如基本数据类型对应的Class对象，一些常驻的异常对象等）。

4. 垃圾回收算法

4.1 标记-清除算法(Mark-Sweep)

原理：分为"标记"和"清除"两个阶段。首先标记出所有需要回收的对象，在标记完成后统一回收所有被标记的对象。
优点：实现简单，不需要对象进行移动。
缺点：
- 标记和清除两个过程效率都不高。
- 标记清除之后会产生大量不连续的内存碎片，空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时，无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

--- title: 标记-清除算法 --- graph TD subgraph "第一阶段：标记" direction LR A["内存区域"] --> B["标记存活对象"] end subgraph "第二阶段：清除" direction LR C["内存区域"] --> D["清除未标记对象"] end style B fill:#9f9,stroke:#333,stroke-width:2px style D fill:#f99,stroke:#333,stroke-width:2px

4.2 复制算法(Copying)

原理：将可用内存按容量划分为大小相等的两块，每次只使用其中的一块。当这一块的内存用完了，就将还存活着的对象复制到另外一块上面，然后再把已使用过的内存空间一次清理掉。
优点：实现简单，运行高效，不需要考虑内存碎片，只要移动堆顶指针，按顺序分配内存即可。
缺点：将内存缩小为原来的一半，空间代价太高。

--- title: 复制算法 --- graph TD subgraph "复制前" direction TB A["内存块A"] --> B["存活对象1"] A --> C["存活对象2"] A --> D["垃圾对象1"] A --> E["垃圾对象2"] end subgraph "复制后" direction TB F["内存块B"] --> G["存活对象1"] F --> H["存活对象2"] I["内存块A"] end style B fill:#9f9,stroke:#333,stroke-width:2px style C fill:#9f9,stroke:#333,stroke-width:2px style D fill:#f99,stroke:#333,stroke-width:2px style E fill:#f99,stroke:#333,stroke-width:2px style G fill:#9f9,stroke:#333,stroke-width:2px style H fill:#9f9,stroke:#333,stroke-width:2px

4.3 标记-整理算法(Mark-Compact)

原理：标记过程与"标记-清除"算法一样，但后续步骤不是直接对可回收对象进行清理，而是让所有存活的对象都向一端移动，然后直接清理掉端边界以外的内存。
优点：解决了标记-清除算法的碎片问题，也解决了复制算法的空间利用率问题。
缺点：移动对象并更新所有引用这些对象的地方，相对复杂且有一定的性能开销。

--- title: 标记-整理算法 --- graph TD subgraph "第一阶段：标记" direction LR A["内存区域"] --> B["标记存活对象"] end subgraph "第二阶段：整理" direction LR C["内存区域"] --> D["移动存活对象到一端"] end subgraph "第三阶段：清除" direction LR E["内存区域"] --> F["清除边界外内存"] end style B fill:#9f9,stroke:#333,stroke-width:2px style D fill:#9f9,stroke:#333,stroke-width:2px style F fill:#f99,stroke:#333,stroke-width:2px

4.4 分代收集算法(Generational Collection)

原理：根据对象存活周期的不同将内存划分为几块，一般是把Java堆分为新生代和老年代，这样就可以根据各个年代的特点采用最适当的收集算法。
- 新生代：每次垃圾收集时都有大批对象死去，只有少量存活，使用复制算法。
- 老年代：对象存活率高、没有额外空间对它进行分配担保，使用标记-清除或标记-整理算法。

--- title: 分代收集算法 --- graph TD A["Java堆"] --> B["新生代(Young Generation)"] A --> C["老年代(Old Generation)"] B --> D["Eden区"] B --> E["Survivor区"] E --> F["Survivor 0"] E --> G["Survivor 1"] H["新对象"] --> I["分配在Eden区"] I --> J["Eden区满时触发Minor GC"] J --> K["存活对象移至Survivor区"] K --> L["经历多次Minor GC仍存活的对象"] L --> M["晋升至老年代"] N["老年代空间不足"] --> O["触发Major GC/Full GC"] O --> P["使用标记-清除或标记-整理算法"] style J fill:#ff9,stroke:#333,stroke-width:2px style O fill:#ff9,stroke:#333,stroke-width:2px

5. 垃圾回收器类型

Java提供了多种垃圾回收器，不同的垃圾回收器适用于不同的场景：

5.1 Serial收集器

特点：单线程收集器，进行垃圾收集时，必须暂停其他所有工作线程。
适用场景：客户端模式下的默认收集器，对内存消耗和停顿时间要求不高的场景。
回收算法：新生代使用复制算法，老年代使用标记-整理算法。

5.2 ParNew收集器

特点：Serial收集器的多线程版本，除了使用多线程进行垃圾收集外，其余行为与Serial收集器完全一样。
适用场景：运行在Server模式下的虚拟机中首选的新生代收集器，能与CMS收集器配合使用。
回收算法：新生代使用复制算法。

5.3 Parallel Scavenge收集器

特点：新生代收集器，使用复制算法，并行的多线程收集器。它的目标是达到一个可控制的吞吐量(Throughput)。
适用场景：在后台运算而不需要太多交互的任务。
回收算法：新生代使用复制算法。

5.4 Serial Old收集器

特点：Serial收集器的老年代版本，单线程收集器，使用"标记-整理"算法。
适用场景：Client模式下的虚拟机使用，或者在Server模式下与Parallel Scavenge收集器搭配使用，或者作为CMS收集器的后备预案。

5.5 Parallel Old收集器

特点：Parallel Scavenge收集器的老年代版本，使用多线程和"标记-整理"算法。
适用场景：注重吞吐量以及CPU资源敏感的场合。

5.6 CMS(Concurrent Mark Sweep)收集器

特点：一种以获取最短回收停顿时间为目标的收集器，基于"标记-清除"算法，整个过程分为4个步骤：
1. 初始标记(CMS initial mark)
2. 并发标记(CMS concurrent mark)
3. 重新标记(CMS remark)
4. 并发清除(CMS concurrent sweep)
优点：并发收集、低停顿。
缺点：
- 对CPU资源非常敏感。
- 无法处理浮动垃圾(Floating Garbage)，可能出现"Concurrent Mode Failure"失败而导致另一次Full GC。
- 基于"标记-清除"算法，会产生大量空间碎片。

--- title: CMS收集器工作流程 --- graph TD A["CMS收集器开始"] --> B["初始标记(STW)"] B --> C["并发标记"] C --> D["重新标记(STW)"] D --> E["并发清除"] E --> F["重置线程"] F --> G["结束"] style B fill:#ff9,stroke:#333,stroke-width:2px style D fill:#ff9,stroke:#333,stroke-width:2px

5.7 G1(Garbage-First)收集器

特点：面向服务端的垃圾收集器，设计目标是在延迟可控的情况下获得尽可能高的吞吐量。将整个Java堆划分为多个大小相等的独立区域(Region)，并跟踪每个Region里的垃圾价值大小，在有限的时间内尽可能回收价值最大的Region。
适用场景：大内存(>4G)的服务器应用，需要低延迟和高吞吐量的场景。
回收算法：整体上基于"标记-整理"算法，局部(两个Region之间)基于复制算法。

--- title: G1收集器Region划分 --- graph TD A["Java堆"] --> B["Region 1"] A --> C["Region 2"] A --> D["Region 3"] A --> E["Region 4"] A --> F["Region 5"] A --> G["Region 6"] A --> H["Region 7"] A --> I["Region 8"] B --> J["Eden"] C --> J D --> K["Survivor"] E --> K F --> L["Old"] G --> L H --> M["Humongous"] I --> N["Free"] style J fill:#9f9,stroke:#333,stroke-width:2px style K fill:#99f,stroke:#333,stroke-width:2px style L fill:#f99,stroke:#333,stroke-width:2px style M fill:#ff9,stroke:#333,stroke-width:2px style N fill:#fff,stroke:#333,stroke-width:2px

6. 垃圾回收过程

6.1 Minor GC

触发条件：当Eden区空间不足时触发。
回收过程：
1. 新对象首先分配在Eden区。
2. 当Eden区满时，触发Minor GC。
3. 将Eden区和From Survivor区中存活的对象复制到To Survivor区。
4. 清空Eden区和From Survivor区。
5. 交换From Survivor区和To Survivor区的角色。
特点：频繁发生，回收速度快。

6.2 Major GC/Full GC

触发条件：
- 老年代空间不足。
- 方法区空间不足。
- 通过Minor GC后进入老年代的对象大小大于老年代的可用内存。
- 由System.gc()方法调用（不推荐）。
回收过程：对整个堆（包括新生代、老年代和方法区）进行垃圾回收。
特点：速度慢，可能导致较长时间的应用暂停。

--- title: 垃圾回收过程 --- graph TD A["新对象创建"] --> B["分配在Eden区"] B --> C["Eden区满?"] C -->|是| D["触发Minor GC"] C -->|否| B D --> E["标记Eden区和From Survivor区中的存活对象"] E --> F["将存活对象复制到To Survivor区"] F --> G["清空Eden区和From Survivor区"] G --> H["交换From和To Survivor区"] H --> I["对象年龄达到阈值?"] I -->|是| J["晋升至老年代"] I -->|否| B J --> K["老年代空间不足?"] K -->|是| L["触发Major GC/Full GC"] K -->|否| B L --> M["标记整个堆中的存活对象"] M --> N["执行回收算法(标记-清除或标记-整理)"] N --> O["回收完成"] style D fill:#ff9,stroke:#333,stroke-width:2px style L fill:#ff9,stroke:#333,stroke-width:2px

7. 优化与调优

7.1 垃圾回收调优目标

低延迟(Low Latency)：减少单次GC的停顿时间。
高吞吐量(High Throughput)：减少GC的总时间占比。
低内存占用(Low Memory Footprint)：减少应用程序的内存使用。

7.2 常用JVM参数

堆大小设置：
- -Xms：初始堆大小。
- -Xmx：最大堆大小。
新生代大小设置：
- -Xmn：新生代大小。
- -XX:NewRatio：新生代与老年代的比例。
Survivor区设置：
- -XX:SurvivorRatio：Eden区与Survivor区的比例。
垃圾回收器选择：
- -XX:+UseSerialGC：使用Serial收集器。
- -XX:+UseParallelGC：使用Parallel Scavenge收集器。
- -XX:+UseParNewGC：使用ParNew收集器。
- -XX:+UseConcMarkSweepGC：使用CMS收集器。
- -XX:+UseG1GC：使用G1收集器。

7.3 调优策略

内存大小调优：
- 根据应用程序的内存需求设置合理的堆大小。
- 避免堆设置过大，导致GC时间过长。
- 避免堆设置过小，导致频繁GC。
新生代与老年代比例调优：
- 如果对象生命周期短，增大新生代比例。
- 如果对象生命周期长，增大老年代比例。
选择合适的垃圾回收器：
- 客户端应用：Serial或ParNew收集器。
- 高吞吐量应用：Parallel Scavenge收集器。
- 低延迟应用：CMS或G1收集器。
监控与分析：
- 使用jstat、jmap、jvisualvm等工具监控GC情况。
- 分析GC日志，找出GC频繁或停顿时间长的原因。

8. 总结

Java垃圾回收机制是自动内存管理的核心，通过自动识别和回收不再使用的对象，大大简化了内存管理。垃圾回收主要基于可达性分析算法判断对象是否存活，并采用分代收集策略，针对不同年代使用不同的回收算法。Java提供了多种垃圾回收器，如Serial、ParNew、Parallel Scavenge、CMS、G1等，适用于不同的应用场景。通过合理的JVM参数调优，可以在低延迟、高吞吐量和低内存占用之间取得平衡，提高应用程序的性能。

垃圾回收机制虽然自动化了内存管理，但了解其工作原理对于开发高性能、稳定的Java应用程序仍然至关重要。通过深入理解垃圾回收机制，开发者可以更好地进行内存管理、性能调优和问题排查。

参考文档

account_tree

思维导图

Interview AiBoxInterview AiBox — 面试搭档

不只是准备，更是实时陪练

Interview AiBox 在面试过程中提供实时屏幕提示、AI 模拟面试和智能复盘，让你每一次回答都更有信心。

免费下载 Interview AiBoxdownload 查看价格方案sell

AI 助读

一键发送到常用 AI

Java垃圾回收(GC)是自动内存管理的核心机制，负责自动识别和回收不再使用的对象。JVM内存分为方法区、堆内存、虚拟机栈等，其中堆是GC的主要区域，又分为新生代和老年代。GC通过可达性分析算法判断对象是否存活，采用分代收集策略：新生代使用复制算法，老年代使用标记-清除或标记-整理算法。Java提供了多种垃圾回收器，如Serial、ParNew、Parallel Scavenge、CMS和G1等，适用于不同场景。GC过程包括Minor GC(针对新生代)和Major GC/Full GC(针对整个堆)。通过合理设置JVM参数和选择合适的垃圾回收器，可以在低延迟、高吞吐量和低内存占用之间取得平衡，提高应用程序性能。

智能总结

深度解读

考点定位

思路启发