Interview AiBoxInterview AiBox 实时 AI 助手，让你自信应答每一场面试

4•local_fire_department30 次面试•更新于 2025-08-23•account_tree思维导图

HashMap的底层原理是什么？它是线程安全的吗？在多线程环境下会遇到什么问题？如果要保证线程安全应该使用什么？ConcurrentHashMap是怎么保证线程安全的？请详细说明。

lightbulb

题型摘要

HashMap基于数组+链表/红黑树实现，通过哈希函数计算元素位置，使用链地址法解决哈希冲突。HashMap是非线程安全的，多线程环境下可能导致死循环、数据覆盖等问题。线程安全的替代方案包括Hashtable、Collections.synchronizedMap()和ConcurrentHashMap。ConcurrentHashMap在JDK 1.7采用分段锁实现，JDK 1.8改用CAS+synchronized，锁粒度更细，并发性能更好。

HashMap底层原理与线程安全分析

HashMap的底层原理

数据结构

HashMap的底层数据结构是数组+链表/红黑树。在JDK 1.8之前，HashMap采用数组+链表的方式解决哈希冲突；从JDK 1.8开始，当链表长度超过8（且数组长度超过64）时，链表会转换为红黑树，以提高查询效率。

// JDK 1.8 HashMap部分源码
static class Node<K,V> implements Map.Entry<K,V> {
    final int hash;
    final K key;
    V value;
    Node<K,V> next;
    // ...
}

// 红黑树节点
static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
    TreeNode<K,V> parent;  // red-black tree links
    TreeNode<K,V> left;
    TreeNode<K,V> right;
    TreeNode<K,V> prev;    // needed to unlink next upon deletion
    boolean red;
    // ...
}

put()方法的执行流程

当调用put(key, value)方法时，HashMap会执行以下步骤：

计算key的hashCode值，然后通过哈希函数处理得到哈希值
通过(n - 1) & hash计算数组下标（n为数组长度）
判断该位置是否为空：
- 如果为空，直接创建新Node插入
- 如果不为空，发生哈希冲突，进行下一步处理
判断该位置是链表还是红黑树：
- 如果是链表，遍历链表，如果找到相同的key，则替换value；否则在链表尾部插入新节点
- 如果是红黑树，按照红黑树的规则插入节点
判断是否需要扩容：如果元素数量超过阈值（容量*负载因子），则进行扩容

get()方法的执行流程

当调用get(key)方法时，HashMap会执行以下步骤：

计算key的hashCode值，然后通过哈希函数处理得到哈希值
通过(n - 1) & hash计算数组下标
判断该位置是否为空：
- 如果为空，返回null
- 如果不为空，进行下一步处理
判断该位置是链表还是红黑树：
- 如果是链表，遍历链表，通过equals()方法查找key
- 如果是红黑树，在红黑树中查找key
找到则返回对应的value，否则返回null

扩容机制

HashMap的扩容机制是其核心功能之一，当元素数量超过阈值（容量*负载因子）时，HashMap会进行扩容。扩容过程如下：

创建一个新的数组，长度为原数组的2倍
将原数组中的元素重新计算哈希值并放入新数组中
在JDK 1.8中，扩容时采用了优化算法，利用(e.hash & oldCap) == 0判断元素在新数组中的位置是否需要改变，避免了重新计算哈希值

哈希冲突解决方法

哈希冲突是指不同的key通过哈希函数计算得到相同的哈希值。HashMap解决哈希冲突的方法是链地址法（Separate Chaining），即将哈希值相同的元素放在同一个链表（或红黑树）中。

在JDK 1.8中，当链表长度超过8（且数组长度超过64）时，链表会转换为红黑树，以提高查询效率。当红黑树中的节点数量减少到6时，红黑树会重新转换为链表。

--- title: HashMap底层数据结构 --- graph TD A["HashMap"] --> B["数组 Node[] table"] B --> C["索引 0"] B --> D["索引 1"] B --> E["索引 2"] B --> F["索引 n-1"] C --> G["Node1"] G --> H["Node2"] H --> I["Node3"] D --> J["TreeNode1"] J --> K["TreeNode2"] K --> L["TreeNode3"] E --> M["null"] F --> N["Node4"] N --> O["Node5"] style A fill:#f9f,stroke:#333,stroke-width:2px style B fill:#bbf,stroke:#333,stroke-width:2px style G fill:#bfb,stroke:#333,stroke-width:1px style J fill:#fbb,stroke:#333,stroke-width:1px

HashMap的线程安全性

HashMap是非线程安全的，如果在多线程环境下使用HashMap，可能会导致以下问题：

多线程环境下的问题

死循环（JDK 1.7及之前）
- 在JDK 1.7及之前，HashMap在扩容时可能会导致死循环
- 原因是多个线程同时进行扩容操作，可能导致链表形成环形结构
- 在JDK 1.8中，通过改进扩容算法解决了这个问题
数据覆盖
- 多个线程同时执行put操作，如果计算出的索引位置相同，可能导致一个线程的插入操作被另一个线程覆盖
- 例如：线程A和线程B同时put一个key，可能导致只有一个value被保存
size不准确
- HashMap的size操作不是原子性的
- 在多线程环境下，一个线程正在修改HashMap（如put操作），另一个线程执行size操作，可能得到不准确的结果
get操作可能获取到null
- 在多线程环境下，一个线程正在执行put操作（可能导致扩容），另一个线程执行get操作，可能获取到null值

--- title: HashMap多线程问题示例 --- sequenceDiagram participant ThreadA participant ThreadB participant HashMap ThreadA->>HashMap: put(key1, value1) ThreadB->>HashMap: put(key2, value2) Note over ThreadA,HashMap: 计算索引位置，假设相同 ThreadA->>HashMap: 检查位置是否为空 ThreadB->>HashMap: 检查位置是否为空 ThreadA->>HashMap: 创建新节点并插入 ThreadB->>HashMap: 创建新节点并插入 Note over HashMap: ThreadB的插入覆盖了ThreadA的插入

线程安全的替代方案

在多线程环境下，如果需要使用Map，可以考虑以下几种线程安全的替代方案：

1. Hashtable

Hashtable是Java早期提供的线程安全的Map实现，它通过在所有公共方法上使用synchronized关键字来保证线程安全。

优点：

实现简单，所有操作都是线程安全的
兼容性较好，是Java早期版本中唯一的线程安全Map

缺点：

性能较差，所有操作都使用同一个锁，并发度低
不允许null键和null值

public synchronized V put(K key, V value) {
    // ...
}

public synchronized V get(Object key) {
    // ...
}

2. Collections.synchronizedMap()

Collections.synchronizedMap()是一个包装方法，可以将任何Map包装成线程安全的Map。

优点：

可以将任何Map实现转换为线程安全的Map
使用简单，只需要调用一个静态方法

缺点：

性能较差，所有操作都使用同一个锁，并发度低
需要手动同步复合操作

Map<String, String> map = new HashMap<>();
Map<String, String> synchronizedMap = Collections.synchronizedMap(map);

3. ConcurrentHashMap

ConcurrentHashMap是Java并发包中提供的线程安全的Map实现，它通过更精细的锁机制来提高并发性能。

优点：

并发性能好，支持高并发读写
允许null值，但不允许null键
在迭代时不需要加锁，不会抛出ConcurrentModificationException

缺点：

实现复杂，理解起来有一定难度
某些复合操作需要手动同步

--- title: 线程安全Map对比 --- graph TD A["线程安全Map"] --> B["Hashtable"] A --> C["Collections.synchronizedMap"] A --> D["ConcurrentHashMap"] B --> E["所有方法使用synchronized"] B --> F["性能差，并发度低"] B --> G["不允许null键和null值"] C --> H["包装任何Map实现"] C --> I["所有操作使用同一个锁"] C --> J["需要手动同步复合操作"] D --> K["JDK 1.7: 分段锁"] D --> L["JDK 1.8: CAS+synchronized"] D --> M["高并发性能"] D --> N["允许null值，不允许null键"] style A fill:#f9f,stroke:#333,stroke-width:2px

ConcurrentHashMap的线程安全实现

ConcurrentHashMap是Java并发包中提供的线程安全的Map实现，它在不同版本中有不同的实现方式。

JDK 1.7的实现：分段锁

在JDK 1.7中，ConcurrentHashMap采用**分段锁（Segment）**的设计来保证线程安全。

核心思想：

将整个Map分为多个段（Segment），每个段类似于一个小型的Hashtable
每个段有自己的锁，不同段的操作可以并行执行
默认分为16个段，支持最多16个线程同时写入

数据结构：

ConcurrentHashMap包含一个Segment数组
每个Segment包含一个HashEntry数组
每个HashEntry是一个链表节点

// JDK 1.7 ConcurrentHashMap部分源码
public class ConcurrentHashMap<K, V> extends AbstractMap<K, V>
        implements ConcurrentMap<K, V>, Serializable {
    // Segment数组
    final Segment<K,V>[] segments;
    
    // Segment类
    static final class Segment<K,V> extends ReentrantLock implements Serializable {
        transient volatile HashEntry<K,V>[] table;
        // ...
    }
    
    // HashEntry类
    static final class HashEntry<K,V> {
        final int hash;
        final K key;
        volatile V value;
        volatile HashEntry<K,V> next;
        // ...
    }
}

put()方法的执行流程：

计算key的hashCode值，然后通过哈希函数处理得到哈希值
通过哈希值找到对应的Segment
获取Segment的锁（如果获取不到则进入等待状态）
在Segment中执行put操作（类似于HashMap的put操作）
释放Segment的锁

get()方法的执行流程：

计算key的hashCode值，然后通过哈希函数处理得到哈希值
通过哈希值找到对应的Segment
在Segment中执行get操作（不需要获取锁，因为value使用了volatile修饰）

--- title: JDK 1.7 ConcurrentHashMap结构 --- graph TD A["ConcurrentHashMap"] --> B["Segment数组"] B --> C["Segment 0"] B --> D["Segment 1"] B --> E["Segment 2"] B --> F["Segment n-1"] C --> G["HashEntry数组"] G --> H["HashEntry1"] H --> I["HashEntry2"] D --> J["HashEntry数组"] J --> K["HashEntry1"] K --> L["HashEntry2"] style A fill:#f9f,stroke:#333,stroke-width:2px style B fill:#bbf,stroke:#333,stroke-width:2px style C fill:#bfb,stroke:#333,stroke-width:1px style D fill:#bfb,stroke:#333,stroke-width:1px

JDK 1.8的实现：CAS+synchronized

在JDK 1.8中，ConcurrentHashMap放弃了分段锁的设计，改用CAS（Compare And Swap）操作和synchronized关键字来保证线程安全。

核心思想：

使用CAS操作进行无锁尝试，如果失败则使用synchronized锁
锁的粒度更细，只锁住需要修改的桶（数组中的某个位置）
使用volatile变量保证可见性

数据结构：

与HashMap类似，采用数组+链表/红黑树的结构
使用Node类表示链表节点，TreeNode类表示红黑树节点
使用sun.misc.Unsafe类的CAS操作

// JDK 1.8 ConcurrentHashMap部分源码
public class ConcurrentHashMap<K,V> extends AbstractMap<K,V>
    implements ConcurrentMap<K,V>, Serializable {
    
    // Node数组
    transient volatile Node<K,V>[] table;
    
    // Node类
    static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        volatile V val;
        volatile Node<K,V> next;
        // ...
    }
    
    // TreeNode类
    static final class TreeNode<K,V> extends Node<K,V> {
        TreeNode<K,V> parent;  // red-black tree links
        TreeNode<K,V> left;
        TreeNode<K,V> right;
        TreeNode<K,V> prev;    // needed to unlink next upon deletion
        boolean red;
        // ...
    }
}

put()方法的执行流程：

计算key的hashCode值，然后通过哈希函数处理得到哈希值
通过(n - 1) & hash计算数组下标
使用CAS操作尝试在该位置插入新节点：
- 如果该位置为空，使用CAS操作直接插入
- 如果该位置不为空，使用synchronized锁住该位置，然后进行插入操作
判断是否需要扩容：如果元素数量超过阈值，则进行扩容

get()方法的执行流程：

计算key的hashCode值，然后通过哈希函数处理得到哈希值
通过(n - 1) & hash计算数组下标
在该位置查找key：
- 如果该位置为空，返回null
- 如果该位置不为空，根据是链表还是红黑树进行查找
找到则返回对应的value，否则返回null

size()方法的实现：

在JDK 1.8中，ConcurrentHashMap的size()方法不再像JDK 1.7那样直接统计所有Segment的元素数量
而是使用一个计数器（baseCount）和多个计数器数组（counterCells）来统计元素数量
通过CAS操作更新计数器，避免了锁竞争

--- title: JDK 1.8 ConcurrentHashMap线程安全机制 --- graph TD A["ConcurrentHashMap"] --> B["CAS操作"] A --> C["synchronized锁"] A --> D["volatile变量"] B --> E["无锁尝试"] B --> F["原子更新"] C --> G["锁住桶"] C --> H["细粒度锁"] D --> I["保证可见性"] D --> J["禁止指令重排序"] style A fill:#f9f,stroke:#333,stroke-width:2px style B fill:#bbf,stroke:#333,stroke-width:1px style C fill:#bbf,stroke:#333,stroke-width:1px style D fill:#bbf,stroke:#333,stroke-width:1px

JDK 1.7与JDK 1.8实现对比

特性	JDK 1.7	JDK 1.8
锁机制	分段锁（Segment）	CAS+synchronized
锁粒度	段级别	桶级别
数据结构	Segment数组+HashEntry数组+链表	Node数组+链表/红黑树
并发度	默认16，取决于Segment数量	理论上可以达到数组长度
查询时间复杂度	O(n)	O(log n)（红黑树）
内存占用	较高（每个Segment都有自己的HashEntry数组）	较低（共享一个Node数组）
扩容机制	段内扩容，不影响其他段	多线程协助扩容

--- title: JDK 1.7与JDK 1.8 ConcurrentHashMap对比 --- graph TD A["ConcurrentHashMap版本对比"] --> B["JDK 1.7"] A --> C["JDK 1.8"] B --> D["分段锁"] B --> E["Segment数组"] B --> F["锁粒度：段级别"] B --> G["并发度：默认16"] C --> H["CAS+synchronized"] C --> I["Node数组"] C --> J["锁粒度：桶级别"] C --> K["并发度：理论上可达数组长度"] style A fill:#f9f,stroke:#333,stroke-width:2px style B fill:#bfb,stroke:#333,stroke-width:1px style C fill:#bbf,stroke:#333,stroke-width:1px

account_tree