LRU缓存算法详解

定义与基本原理

LRU（Least Recently Used，最近最少使用）是一种常见的缓存淘汰算法。它的基本原理是：当缓存满了需要淘汰数据时，优先淘汰最近最少使用的数据。这种策略基于"局部性原理"，即最近被访问的数据在未来被再次访问的概率较高，而很久没有被访问的数据在未来被访问的概率较低。

应用场景

LRU算法广泛应用于各种需要缓存管理的场景，如：

操作系统的页面置换
数据库的缓冲区管理
Web浏览器的缓存管理
CDN内容缓存
应用程序的数据缓存层

数据结构选择

实现LRU算法通常需要结合两种数据结构：

哈希表（Hash Map）：用于提供O(1)时间复杂度的数据查找。
双向链表（Doubly Linked List）：用于维护数据访问的顺序，支持O(1)时间复杂度的插入和删除操作。

为什么选择这种组合？

哈希表可以快速定位到数据，但不维护顺序。
双向链表可以维护数据访问顺序，但查找需要O(n)时间。
两者的结合可以同时实现快速查找和顺序维护。

具体实现步骤

初始化一个固定大小的缓存，使用哈希表存储键值对，同时使用双向链表维护访问顺序。
当访问一个数据时：
- 如果数据在缓存中，将其移动到链表头部（表示最近使用）。
- 如果数据不在缓存中，将其添加到缓存并放在链表头部。
当添加新数据导致缓存满时：
- 删除链表尾部的数据（最近最少使用的数据）。
- 同时从哈希表中删除对应的键值对。
- 将新数据添加到缓存并放在链表头部。

代码实现示例

import java.util.HashMap;
import java.util.Map;

public class LRUCache<K, V> {
    private final int capacity;
    private final Map<K, Node<K, V>> cache;
    private final DoublyLinkedList<K, V> list;

    public LRUCache(int capacity) {
        this.capacity = capacity;
        this.cache = new HashMap<>();
        this.list = new DoublyLinkedList<>();
    }

    public V get(K key) {
        if (!cache.containsKey(key)) {
            return null;
        }
        Node<K, V> node = cache.get(key);
        // 将访问的节点移到链表头部
        list.moveToHead(node);
        return node.value;
    }

    public void put(K key, V value) {
        if (cache.containsKey(key)) {
            Node<K, V> node = cache.get(key);
            node.value = value;
            // 更新节点值后，将其移到链表头部
            list.moveToHead(node);
        } else {
            if (cache.size() >= capacity) {
                // 缓存已满，删除链表尾部节点
                Node<K, V> tail = list.removeTail();
                cache.remove(tail.key);
            }
            // 创建新节点并添加到链表头部
            Node<K, V> newNode = new Node<>(key, value);
            list.addToHead(newNode);
            cache.put(key, newNode);
        }
    }

    // 双向链表节点
    private static class Node<K, V> {
        K key;
        V value;
        Node<K, V> prev;
        Node<K, V> next;

        public Node(K key, V value) {
            this.key = key;
            this.value = value;
        }
    }

    // 双向链表
    private static class DoublyLinkedList<K, V> {
        private Node<K, V> head;
        private Node<K, V> tail;

        public DoublyLinkedList() {
            head = new Node<>(null, null);
            tail = new Node<>(null, null);
            head.next = tail;
            tail.prev = head;
        }

        public void addToHead(Node<K, V> node) {
            node.prev = head;
            node.next = head.next;
            head.next.prev = node;
            head.next = node;
        }

        public void removeNode(Node<K, V> node) {
            node.prev.next = node.next;
            node.next.prev = node.prev;
        }

        public void moveToHead(Node<K, V> node) {
            removeNode(node);
            addToHead(node);
        }

        public Node<K, V> removeTail() {
            if (tail.prev == head) {
                return null;
            }
            Node<K, V> node = tail.prev;
            removeNode(node);
            return node;
        }
    }
}

时间复杂度分析

get操作：O(1)，因为哈希表查找是O(1)，移动节点到链表头部也是O(1)。
put操作：O(1)，因为哈希表插入/删除是O(1)，链表操作也是O(1)。

LRU算法的优缺点

优点

实现简单，易于理解。
对于具有时间局部性的数据访问模式表现良好。
get和put操作的时间复杂度都是O(1)，效率高。

缺点

对于循环访问模式（如A-B-C-D-A-B-C-D...）表现不佳，会导致频繁的缓存淘汰。
实现需要额外的空间来维护链表结构。
当缓存容量很大时，链表操作可能成为性能瓶颈。

LRU算法的变体和优化

2Q算法：结合了LRU和FIFO的特点，将缓存分为FIFO和LRU两部分。
LRU-K算法：考虑最近K次访问的时间，而不仅仅是最近一次。
分段LRU：将缓存分为多个段，每个段使用独立的LRU策略。
基于时钟的近似LRU：使用时钟算法近似LRU，减少实现复杂度。

可视化LRU算法的工作流程

--- title: LRU缓存算法工作流程 --- graph TD A[开始] --> B[初始化缓存] B --> C{操作类型} C -->|get| D[查找键] C -->|put| E[检查键是否存在] D --> F{键存在?} F -->|是| G[获取值] F -->|否| H[返回null] G --> I[将对应节点移到链表头部] I --> J[返回值] E --> K{键存在?} K -->|是| L[更新节点值] K -->|否| M{缓存已满?} L --> N[将节点移到链表头部] N --> O[结束] M -->|是| P[删除链表尾部节点] M -->|否| Q[创建新节点] P --> R[从哈希表删除对应键] R --> Q Q --> S[将新节点添加到链表头部] S --> T[将新节点添加到哈希表] T --> O

LRU缓存的数据结构图

--- title: LRU缓存的数据结构 --- classDiagram class LRUCache { -int capacity -Map cache -DoublyLinkedList list +get(key) +put(key, value) } class Map { +get(key) +put(key, value) +remove(key) +containsKey(key) } class DoublyLinkedList { -Node head -Node tail +addToHead(node) +removeNode(node) +moveToHead(node) +removeTail() } class Node { -K key -V value -Node prev -Node next } LRUCache --> Map LRUCache --> DoublyLinkedList DoublyLinkedList --> Node

LRU缓存的访问时序图

--- title: LRU缓存访问时序示例 --- sequenceDiagram participant Client participant LRUCache participant HashMap participant LinkedList Client->>LRUCache: get(key1) LRUCache->>HashMap: containsKey(key1) HashMap-->>LRUCache: true LRUCache->>HashMap: get(key1) HashMap-->>LRUCache: node1 LRUCache->>LinkedList: moveToHead(node1) LinkedList-->>LRUCache: OK LRUCache-->>Client: value1 Client->>LRUCache: put(key2, value2) LRUCache->>HashMap: containsKey(key2) HashMap-->>LRUCache: false LRUCache->>LRUCache: isFull? Note over LRUCache: 假设缓存已满 LRUCache->>LinkedList: removeTail() LinkedList-->>LRUCache: tailNode LRUCache->>HashMap: remove(tailNode.key) HashMap-->>LRUCache: OK LRUCache->>LRUCache: create newNode(key2, value2) LRUCache->>LinkedList: addToHead(newNode) LinkedList-->>LRUCache: OK LRUCache->>HashMap: put(key2, newNode) HashMap-->>LRUCache: OK LRUCache-->>Client: OK

account_tree

思维导图

Interview AiBoxInterview AiBox — 面试搭档

不只是准备，更是实时陪练

Interview AiBox 在面试过程中提供实时屏幕提示、AI 模拟面试和智能复盘，让你每一次回答都更有信心。

免费下载 Interview AiBoxdownload 查看价格方案sell

AI 助读

一键发送到常用 AI

LRU（最近最少使用）缓存算法是一种基于时间局部性原理的缓存淘汰策略，当缓存满时优先淘汰最近最少使用的数据。实现LRU算法通常结合哈希表（提供O(1)查找）和双向链表（维护访问顺序，支持O(1)插入和删除）。当访问数据时，将其移到链表头部；当缓存满时，删除链表尾部数据。这种实现使get和put操作的时间复杂度均为O(1)。LRU算法适用于各种缓存管理场景，但对循环访问模式表现不佳，且需要额外空间维护链表结构。

智能总结

深度解读

考点定位

思路启发