缓存中的三大问题：缓存击穿、缓存穿透和缓存雪崩

在分布式系统和高并发场景中，缓存是提高系统性能的重要手段，但同时也带来了一些常见问题。本文将详细介绍缓存中的三大问题：缓存击穿、缓存穿透和缓存雪崩，以及相应的解决方案。

一、缓存击穿（Cache Breakdown）

1. 定义

缓存击穿是指一个热点key（访问非常频繁的key）在失效的瞬间，有大量并发请求直接访问数据库，导致数据库压力瞬间增大，甚至可能导致数据库崩溃。

2. 原因

热点key设置了过期时间
key过期瞬间，大量并发请求同时访问该key
缓存中没有该key，所有请求直接打到数据库

3. 影响

数据库压力骤增
可能导致数据库连接池耗尽
系统响应变慢，甚至不可用

4. 解决方案

4.1 互斥锁（Mutex Lock）

当缓存失效时，使用分布式锁（如Redis的SETNX）保证只有一个线程去查询数据库并重建缓存
其他线程等待或返回默认值/旧数据

// 伪代码示例
public Object getData(String key) {
    Object value = cache.get(key);
    if (value == null) {
        // 尝试获取分布式锁
        if (lock.tryLock(key)) {
            try {
                // 双重检查，防止其他线程已经重建了缓存
                value = cache.get(key);
                if (value == null) {
                    value = database.query(key);
                    cache.set(key, value, expireTime);
                }
            } finally {
                lock.unlock(key);
            }
        } else {
            // 未获取到锁，等待或返回默认值/旧数据
            return getDefaultValueOrOldData(key);
        }
    }
    return value;
}

4.2 热点数据永不过期

对于热点数据，可以不设置过期时间
通过后台任务定期更新这些数据
缺点是数据可能不是最新的

4.3 逻辑过期时间

在缓存值中存储逻辑过期时间
当发现逻辑过期时，异步更新缓存
期间可以返回旧数据

--- title: 缓存击穿解决方案流程图 --- flowchart TD A[客户端请求] --> B{缓存是否存在?} B -->|是| C[返回缓存数据] B -->|否| D{能否获取分布式锁?} D -->|是| E[查询数据库] E --> F[更新缓存] F --> G[释放锁] G --> C D -->|否| H[等待或返回默认值/旧数据] H --> I[返回结果] C --> J[结束] I --> J

二、缓存穿透（Cache Penetration）

1. 定义

缓存穿透是指查询一个不存在的数据，由于缓存中没有，请求会直接访问数据库，而当大量这样的请求出现时，会给数据库带来巨大压力。

2. 原因

恶意攻击：故意查询大量不存在的数据
业务逻辑错误：查询条件不正确导致查询不存在的数据
缓存未存储空值或不存在标记

3. 影响

数据库压力增大
缓存命中率降低
系统资源被无效查询占用

4. 解决方案

4.1 缓存空对象（Null Caching）

当查询结果为空时，仍然将空结果缓存起来
设置较短的过期时间（如30秒到几分钟）

// 伪代码示例
public Object getData(String key) {
    Object value = cache.get(key);
    if (value == null) {
        value = database.query(key);
        // 即使查询结果为空，也缓存起来
        cache.set(key, value != null ? value : EMPTY_OBJECT, expireTime);
    }
    return value != EMPTY_OBJECT ? value : null;
}

4.2 布隆过滤器（Bloom Filter）

在访问缓存前，使用布隆过滤器判断key是否存在
布隆过滤器可以快速判断一个元素是否在集合中
优点是空间效率高，缺点是有一定的误判率

// 伪代码示例
public Object getData(String key) {
    // 先通过布隆过滤器判断key是否存在
    if (!bloomFilter.mightContain(key)) {
        return null; // 直接返回，不查询数据库
    }
    
    Object value = cache.get(key);
    if (value == null) {
        value = database.query(key);
        cache.set(key, value, expireTime);
    }
    return value;
}

4.3 接口层校验

在接口层对请求参数进行合法性校验
过滤掉明显不合法的请求

4.4 限流

对异常请求进行限流，保护数据库

--- title: 缓存穿透解决方案流程图 --- flowchart TD A[客户端请求] --> B{布隆过滤器判断key是否存在?} B -->|不存在| C[直接返回null] B -->|存在| D{缓存是否存在?} D -->|是| E[返回缓存数据] D -->|否| F[查询数据库] F --> G{数据库是否存在数据?} G -->|是| H[将真实数据存入缓存] G -->|否| I[将空对象存入缓存] H --> J[返回数据] I --> K[返回null] E --> L[结束] J --> L K --> L C --> L

三、缓存雪崩（Cache Avalanche）

1. 定义

缓存雪崩是指大量缓存在同一时间集体失效，导致所有请求直接访问数据库，造成数据库压力骤增，甚至崩溃。

2. 原因

缓存服务器宕机
大量key设置了相同的过期时间
缓存网络问题，导致短时间内无法访问缓存

3. 影响

数据库压力骤增
系统响应变慢，甚至不可用
可能引发连锁反应，导致整个系统崩溃

4. 解决方案

4.1 过期时间随机化

在基础过期时间上增加随机值
避免大量key同时失效

// 伪代码示例
int baseExpireTime = 3600; // 基础过期时间1小时
int randomExpireTime = baseExpireTime + new Random().nextInt(600); // 随机增加0~10分钟
cache.set(key, value, randomExpireTime);

4.2 缓存集群

使用缓存集群（如Redis Cluster）提高可用性
避免单点故障

4.3 多级缓存

使用多级缓存策略，如本地缓存+分布式缓存
当分布式缓存失效时，本地缓存仍可提供服务

示例架构：

客户端 -> 本地缓存（Caffeine/Guava Cache）-> 分布式缓存（Redis）-> 数据库

4.4 服务降级与熔断

当检测到缓存不可用时，启动降级策略
可以返回默认值、静态数据或提示信息
使用熔断机制保护系统

4.5 缓存预热

系统启动或重启后，提前加载热点数据到缓存
避免系统刚启动时的缓存空白期

4.6 持久化机制

使用缓存的持久化机制（如Redis的RDB和AOF）
缓存重启后可以快速恢复数据

--- title: 缓存雪崩解决方案架构图 --- flowchart LR A[客户端] --> B[负载均衡] B --> C[应用服务器1] B --> D[应用服务器2] B --> E[应用服务器N] C --> F[本地缓存1] D --> G[本地缓存2] E --> H[本地缓存N] F --> I[Redis集群1] G --> I H --> I I --> J[Redis集群2] I --> K[Redis集群N] J --> L[数据库主从集群] K --> L subgraph "缓存预热" M[定时任务] --> N[加载热点数据到缓存] N --> I N --> J N --> K end subgraph "服务降级与熔断" O[监控缓存状态] --> P{缓存是否可用?} P -->|否| Q[启动降级策略] Q --> R[返回默认值/静态数据] end

四、三大问题对比

--- title: 缓存三大问题对比 --- classDiagram class CacheIssue { <<abstract>> +定义 +原因 +影响 +解决方案 } class CacheBreakdown { +定义：热点key失效瞬间，大量并发请求直接访问数据库 +原因：热点key过期、大量并发请求 +影响：数据库压力骤增、可能崩溃 +解决方案：互斥锁、热点数据永不过期、逻辑过期时间 } class CachePenetration { +定义：查询不存在的数据，绕过缓存直接访问数据库 +原因：恶意攻击、业务逻辑错误 +影响：数据库压力大、缓存命中率低 +解决方案：缓存空对象、布隆过滤器、接口层校验、限流 } class CacheAvalanche { +定义：大量缓存在同一时间集体失效 +原因：缓存服务器宕机、大量key同时过期 +影响：数据库压力骤增、系统可能崩溃 +解决方案：过期时间随机化、缓存集群、多级缓存、服务降级 } CacheIssue <|-- CacheBreakdown CacheIssue <|-- CachePenetration CacheIssue <|-- CacheAvalanche