ConcurrentHashMap

ConcurrentHashMap 是线程安全的 HashMap 实现，是高并发场景下的首选 Map 实现。理解其实现原理，特别是 JDK 7 和 JDK 8 的巨大差异，是面试的高频考点。

一、为什么需要 ConcurrentHashMap

1.1 HashMap 的问题

HashMap 不是线程安全的，在并发环境下会出现问题：

// 问题1：并发扩容导致死循环（JDK 7 头插法）
// 问题2：数据丢失（并发 put）
// 问题3：数据不一致
 
// 多线程扩容时可能形成环形链表
// 导致 get 操作死循环

1.2 Hashtable 的问题

Hashtable 是线程安全的，但性能差：

// Hashtable 所有方法都加 synchronized
public synchronized V put(K key, V value) { }
public synchronized V get(Object key) { }
public synchronized V remove(Object key) { }
 
// 问题：锁粒度太大，整个表一把锁，并发度极低

1.3 ConcurrentHashMap 的优势

对比项	HashMap	Hashtable	ConcurrentHashMap
线程安全	❌	✅	✅
锁粒度	无	整表	分段/节点
并发度	高（不安全）	低	高
性能	最高	最低	高
允许 null	✅	❌	❌

二、JDK 7 实现：分段锁

2.1 数据结构

JDK 7 采用**分段锁（Segment）**机制，每个 Segment 是一个小的 HashMap。

┌─────────────────────────────────────────────────────────────┐
│                    ConcurrentHashMap (JDK 7)                │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  Segment[] segments                                         │
│  ┌─────────┬─────────┬─────────┬─────────┬─────────┐       │
│  │Segment 0│Segment 1│Segment 2│Segment 3│   ...   │       │
│  └────┬────┴────┬────┴────┬────┴────┬────┴─────────┘       │
│       │         │         │         │                       │
│       ▼         ▼         ▼         ▼                       │
│   ┌─────┐  ┌─────┐  ┌─────┐  ┌─────┐                        │
│   │Hash │  │Hash │  │Hash │  │Hash │  每个 Segment 是        │
│   │Entry│  │Entry│  │Entry│  │Entry│  一个 HashMap          │
│   │ []  │  │ []  │  │ []  │  │ []  │                        │
│   └──┬──┘  └──┬──┘  └──┬──┘  └──┬──┘                        │
│      │        │        │        │                           │
│      ▼        ▼        ▼        ▼                           │
│    链表     链表     链表     链表                           │
│                                                             │
│  每个 Segment 一把锁，默认 16 个 Segment，并发度 16           │
└─────────────────────────────────────────────────────────────┘

2.2 核心参数

public class ConcurrentHashMap<K, V> {
    // 默认初始容量
    static final int DEFAULT_INITIAL_CAPACITY = 16;
    
    // 默认负载因子
    static final float DEFAULT_LOAD_FACTOR = 0.75f;
    
    // 默认并发级别（Segment 数量）
    static final int DEFAULT_CONCURRENCY_LEVEL = 16;
    
    // Segment 数组
    final Segment<K,V>[] segments;
    
    // Segment 内部类
    static final class Segment<K,V> extends ReentrantLock {
        transient volatile HashEntry<K,V>[] table;  // 每个 Segment 维护一个链表数组
        transient int count;                         // 元素个数
        transient int modCount;                      // 修改次数
        transient int threshold;                     // 扩容阈值
        final float loadFactor;                      // 负载因子
    }
}

2.3 put 操作

public V put(K key, V value) {
    if (value == null)
        throw new NullPointerException();
    int hash = hash(key);
    return segmentFor(hash).put(key, hash, value, false);
}
 
// 定位 Segment
final Segment<K,V> segmentFor(int hash) {
    return segments[(hash >>> segmentShift) & segmentMask];
}
 
// Segment.put
V put(K key, int hash, V value, boolean onlyIfAbsent) {
    // 1. 尝试获取锁，失败则自旋等待
    lock();
    try {
        int c = count;
        if (c++ > threshold) // 检查是否需要扩容
            rehash();
        
        HashEntry<K,V>[] tab = table;
        int index = hash & (tab.length - 1);
        HashEntry<K,V> first = tab[index];
        
        // 2. 遍历链表查找
        for (HashEntry<K,V> e = first; e != null; e = e.next) {
            if (e.hash == hash && key.equals(e.key)) {
                V oldValue = e.value;
                if (!onlyIfAbsent)
                    e.value = value;
                return oldValue;
            }
        }
        
        // 3. 头插法插入新节点
        HashEntry<K,V> newEntry = new HashEntry<K,V>(key, hash, first, value);
        tab[index] = newEntry;
        count = c;
        return null;
    } finally {
        unlock();
    }
}

2.4 get 操作（无锁）

public V get(Object key) {
    int hash = hash(key);
    return segmentFor(hash).get(key, hash);
}
 
V get(Object key, int hash) {
    // 不加锁，使用 volatile 保证可见性
    HashEntry<K,V>[] tab = table;
    HashEntry<K,V> e = tab[hash & (tab.length - 1)];
    while (e != null) {
        if (e.hash == hash && key.equals(e.key))
            return e.value;
        e = e.next;
    }
    return null;
}

三、JDK 8 实现：CAS + synchronized

3.1 数据结构

JDK 8 抛弃了 Segment，采用数组 + 链表 + 红黑树，锁粒度细化到每个节点。

┌─────────────────────────────────────────────────────────────┐
│                    ConcurrentHashMap (JDK 8)                │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  Node[] table                                               │
│  ┌─────┬─────┬─────┬─────┬─────┬─────┬─────┬─────┐         │
│  │ null│ Node│ null│ Node│ null│ Tree│ null│ Node│         │
│  └─────┴──┬──┴─────┴──┬──┴─────┴──┬──┴─────┴──┬──┘         │
│           │           │           │           │              │
│           ▼           ▼           ▼           ▼              │
│         链表        链表       红黑树       链表              │
│                                                             │
│  锁粒度：单个 Node 节点（CAS 或 synchronized）               │
│                                                             │
└─────────────────────────────────────────────────────────────┘

3.2 核心参数

public class ConcurrentHashMap<K,V> extends AbstractMap<K,V>
    implements ConcurrentMap<K,V>, Serializable {
    
    // 默认初始容量
    private static final int DEFAULT_CAPACITY = 16;
    
    // 最大容量
    private static final int MAXIMUM_CAPACITY = 1 << 30;
    
    // 默认负载因子
    private static final float LOAD_FACTOR = 0.75f;
    
    // 链表转红黑树阈值
    static final int TREEIFY_THRESHOLD = 8;
    
    // 红黑树转链表阈值
    static final int UNTREEIFY_THRESHOLD = 6;
    
    // 扩容时的最小步长
    private static final int MIN_TRANSFER_STRIDE = 16;
    
    // 扩容时生成 stamp
    private static int RESIZE_STAMP_BITS = 16;
    
    // sizeCtl：控制标识符
    // -1：正在初始化
    // -N：有 N-1 个线程正在扩容
    // 正数：扩容阈值
    private transient volatile int sizeCtl;
    
    // 扩容时的 nextTable
    private transient volatile Node<K,V>[] nextTable;
    
    // 基础计数器
    private transient volatile long baseCount;
    
    // 计数器单元格数组（高并发时使用）
    private transient volatile CounterCell[] counterCells;
}

3.3 put 操作

public V put(K key, V value) {
    return putVal(key, value, false);
}
 
final V putVal(K key, V value, boolean onlyIfAbsent) {
    // 1. key 和 value 都不能为 null
    if (key == null || value == null) throw new NullPointerException();
    
    // 2. 计算 hash
    int hash = spread(key.hashCode());
    int binCount = 0;
    
    for (Node<K,V>[] tab = table;;) {
        Node<K,V> f; int n, i, fh;
        
        // 3. 表为空则初始化
        if (tab == null || (n = tab.length) == 0)
            tab = initTable();
        
        // 4. 位置为空，CAS 插入
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            if (casTabAt(tab, i, null, new Node<K,V>(hash, key, value, null)))
                break;
        }
        
        // 5. 正在扩容，帮助扩容
        else if ((fh = f.hash) == MOVED)
            tab = helpTransfer(tab, f);
        
        // 6. 正常插入
        else {
            V oldVal = null;
            synchronized (f) {  // 只锁当前节点
                if (tabAt(tab, i) == f) {
                    // 链表
                    if (fh >= 0) {
                        binCount = 1;
                        for (Node<K,V> e = f;; ++binCount) {
                            K ek;
                            if (e.hash == hash &&
                                ((ek = e.key) == key ||
                                 (ek != null && key.equals(ek)))) {
                                oldVal = e.val;
                                if (!onlyIfAbsent)
                                    e.val = value;
                                break;
                            }
                            Node<K,V> pred = e;
                            if ((e = e.next) == null) {
                                pred.next = new Node<K,V>(hash, key, value, null);
                                break;
                            }
                        }
                    }
                    // 红黑树
                    else if (f instanceof TreeBin) {
                        Node<K,V> p;
                        binCount = 2;
                        if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key, value)) != null) {
                            oldVal = p.val;
                            if (!onlyIfAbsent)
                                p.val = value;
                        }
                    }
                }
            }
            
            // 7. 链表转红黑树
            if (binCount != 0) {
                if (binCount >= TREEIFY_THRESHOLD)
                    treeifyBin(tab, i);
                if (oldVal != null)
                    return oldVal;
                break;
            }
        }
    }
    
    // 8. 更新计数，检查扩容
    addCount(1L, binCount);
    return null;
}

3.4 get 操作（无锁）

public V get(Object key) {
    Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
    int h = spread(key.hashCode());
    
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (e = tabAt(tab, (n - 1) & h)) != null) {
        
        // 头节点匹配
        if ((eh = e.hash) == h) {
            if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                return e.val;
        }
        // hash < 0：红黑树或 ForwardingNode
        else if (eh < 0)
            return (p = e.find(h, key)) != null ? p.val : null;
        
        // 遍历链表
        while ((e = e.next) != null) {
            if (e.hash == h &&
                ((ek = e.key) == key || (ek != null && key.equals(ek))))
                return e.val;
        }
    }
    return null;
}

3.5 多线程扩容

JDK 8 的 ConcurrentHashMap 支持多线程协同扩容：

┌─────────────────────────────────────────────────────────────┐
│                    多线程扩容过程                            │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  扩容前：Thread1 触发扩容                                    │
│                                                             │
│  ┌───┬───┬───┬───┬───┬───┬───┬───┬───┬───┬───┬───┬───┬───┐ │
│  │ 0 │ 1 │ 2 │ 3 │ 4 │ 5 │ 6 │ 7 │ 8 │ 9 │10 │11 │12 │13 │ │
│  └─┬─┴───┴─┬─┴───┴───┴───┴───┴───┴───┴───┴───┴───┴───┴───┘ │
│    │       │                                               │
│    ▼       ▼                                               │
│  Thread1  Thread2（帮助扩容）                               │
│                                                             │
│  每个线程负责一段区间（stride），协同完成扩容                 │
│  通过 transferIndex 分配任务                                │
│                                                             │
│  已迁移的节点设置为 ForwardingNode（hash = MOVED）           │
│  其他线程遇到 ForwardingNode 会帮助扩容                      │
│                                                             │
└─────────────────────────────────────────────────────────────┘

四、JDK 7 vs JDK 8 对比

对比项	JDK 7	JDK 8
数据结构	Segment + HashEntry 数组 + 链表	Node 数组 + 链表 + 红黑树
锁机制	Segment 分段锁（ReentrantLock）	CAS + synchronized
锁粒度	Segment 级别（默认 16）	Node 节点级别
并发度	受 Segment 数量限制	更高（Node 级别）
扩容	单线程扩容	多线程协同扩容
内存占用	较高（多个 Segment）	较低
查询效率	O(1)	O(1) 或 O(log n)（红黑树）

五、重要方法

5.1 spread（哈希计算）

static final int spread(int h) {
    return (h ^ (h >>> 16)) & HASH_BITS;
    // HASH_BITS = 0x7fffffff（最高位为 0）
    // 保证 hash 为正数，负数有特殊含义
    // MOVED = -1：正在扩容
    // TREEBIN = -2：红黑树根节点
}

5.2 size() 方法

// JDK 8 使用 LongAdder 思想
public int size() {
    long n = sumCount();
    return ((n < 0L) ? 0 :
            (n > (long)Integer.MAX_VALUE) ? Integer.MAX_VALUE :
            (int)n);
}
 
final long sumCount() {
    CounterCell[] as = counterCells; CounterCell a;
    long sum = baseCount;
    if (as != null) {
        for (int i = 0; i < as.length; ++i) {
            if ((a = as[i]) != null)
                sum += a.value;
        }
    }
    return sum;
}

六、常见面试题

Q1: ConcurrentHashMap 如何保证线程安全？

JDK 7：Segment 分段锁，每个 Segment 继承 ReentrantLock
JDK 8：CAS + synchronized，锁粒度更细

Q2: JDK 7 和 JDK 8 的 ConcurrentHashMap 有什么区别？

对比项	JDK 7	JDK 8
数据结构	分段锁	数组+链表+红黑树
锁粒度	Segment	Node
锁类型	ReentrantLock	synchronized + CAS
并发度	固定（Segment 数）	更高

Q3: ConcurrentHashMap 为什么不允许 null 键/值？

二义性问题：get(key) 返回 null 时，无法区分是 key 不存在还是 value 为 null
多线程环境下无法用 containsKey 判断

// 如果允许 null
if (map.containsKey(key)) {
    return map.get(key);  // 可能是 null
} else {
    return null;
}
 
// 在多线程中，这两步操作之间 map 可能被修改

Q4: ConcurrentHashMap 的扩容过程？

JDK 7：单线程扩容，持有 Segment 锁
JDK 8：多线程协同扩容
- 每个线程负责一段区间
- 已迁移节点设为 ForwardingNode
- 其他线程遇到会帮助扩容

Q5: ConcurrentHashMap 的 get 为什么不需要加锁？

Node 的 val 和 next 都是 volatile 的，保证可见性
数组用 volatile 读取（tabAt 使用 Unsafe.getObjectVolatile）
即使在扩容过程中，ForwardingNode 也能正确转发请求

Q6: ConcurrentHashMap 能完全替代 Hashtable 吗？

大部分场景可以
但 Hashtable 的迭代是强一致性的
ConcurrentHashMap 的迭代是弱一致性的（可能不反映最新修改）

七、总结

特性	JDK 7	JDK 8
数据结构	Segment + HashEntry	Node + 链表 + 红黑树
锁机制	分段锁（ReentrantLock）	CAS + synchronized
锁粒度	Segment（粗）	Node（细）
get 操作	无锁	无锁
put 操作	锁 Segment	CAS 或锁 Node
扩容	单线程	多线程协同
size()	累加各 Segment	LongAdder 思想

一句话总结：JDK 8 的 ConcurrentHashMap 用更细粒度的锁和 CAS 实现了更高的并发度。

最后更新：2026年3月2日

HashMap HashSet vs TreeSet