知识模块
☕ Java 知识模块
二、Java 集合框架
ConcurrentHashMap

ConcurrentHashMap

ConcurrentHashMap 是线程安全的 HashMap 实现,是高并发场景下的首选 Map 实现。理解其实现原理,特别是 JDK 7 和 JDK 8 的巨大差异,是面试的高频考点。


一、为什么需要 ConcurrentHashMap

1.1 HashMap 的问题

HashMap 不是线程安全的,在并发环境下会出现问题:

// 问题1:并发扩容导致死循环(JDK 7 头插法)
// 问题2:数据丢失(并发 put)
// 问题3:数据不一致
 
// 多线程扩容时可能形成环形链表
// 导致 get 操作死循环

1.2 Hashtable 的问题

Hashtable 是线程安全的,但性能差:

// Hashtable 所有方法都加 synchronized
public synchronized V put(K key, V value) { }
public synchronized V get(Object key) { }
public synchronized V remove(Object key) { }
 
// 问题:锁粒度太大,整个表一把锁,并发度极低

1.3 ConcurrentHashMap 的优势

对比项HashMapHashtableConcurrentHashMap
线程安全
锁粒度整表分段/节点
并发度高(不安全)
性能最高最低
允许 null

二、JDK 7 实现:分段锁

2.1 数据结构

JDK 7 采用**分段锁(Segment)**机制,每个 Segment 是一个小的 HashMap。

┌─────────────────────────────────────────────────────────────┐
│                    ConcurrentHashMap (JDK 7)                │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  Segment[] segments                                         │
│  ┌─────────┬─────────┬─────────┬─────────┬─────────┐       │
│  │Segment 0│Segment 1│Segment 2│Segment 3│   ...   │       │
│  └────┬────┴────┬────┴────┬────┴────┬────┴─────────┘       │
│       │         │         │         │                       │
│       ▼         ▼         ▼         ▼                       │
│   ┌─────┐  ┌─────┐  ┌─────┐  ┌─────┐                        │
│   │Hash │  │Hash │  │Hash │  │Hash │  每个 Segment 是        │
│   │Entry│  │Entry│  │Entry│  │Entry│  一个 HashMap          │
│   │ []  │  │ []  │  │ []  │  │ []  │                        │
│   └──┬──┘  └──┬──┘  └──┬──┘  └──┬──┘                        │
│      │        │        │        │                           │
│      ▼        ▼        ▼        ▼                           │
│    链表     链表     链表     链表                           │
│                                                             │
│  每个 Segment 一把锁,默认 16 个 Segment,并发度 16           │
└─────────────────────────────────────────────────────────────┘

2.2 核心参数

public class ConcurrentHashMap<K, V> {
    // 默认初始容量
    static final int DEFAULT_INITIAL_CAPACITY = 16;
    
    // 默认负载因子
    static final float DEFAULT_LOAD_FACTOR = 0.75f;
    
    // 默认并发级别(Segment 数量)
    static final int DEFAULT_CONCURRENCY_LEVEL = 16;
    
    // Segment 数组
    final Segment<K,V>[] segments;
    
    // Segment 内部类
    static final class Segment<K,V> extends ReentrantLock {
        transient volatile HashEntry<K,V>[] table;  // 每个 Segment 维护一个链表数组
        transient int count;                         // 元素个数
        transient int modCount;                      // 修改次数
        transient int threshold;                     // 扩容阈值
        final float loadFactor;                      // 负载因子
    }
}

2.3 put 操作

public V put(K key, V value) {
    if (value == null)
        throw new NullPointerException();
    int hash = hash(key);
    return segmentFor(hash).put(key, hash, value, false);
}
 
// 定位 Segment
final Segment<K,V> segmentFor(int hash) {
    return segments[(hash >>> segmentShift) & segmentMask];
}
 
// Segment.put
V put(K key, int hash, V value, boolean onlyIfAbsent) {
    // 1. 尝试获取锁,失败则自旋等待
    lock();
    try {
        int c = count;
        if (c++ > threshold) // 检查是否需要扩容
            rehash();
        
        HashEntry<K,V>[] tab = table;
        int index = hash & (tab.length - 1);
        HashEntry<K,V> first = tab[index];
        
        // 2. 遍历链表查找
        for (HashEntry<K,V> e = first; e != null; e = e.next) {
            if (e.hash == hash && key.equals(e.key)) {
                V oldValue = e.value;
                if (!onlyIfAbsent)
                    e.value = value;
                return oldValue;
            }
        }
        
        // 3. 头插法插入新节点
        HashEntry<K,V> newEntry = new HashEntry<K,V>(key, hash, first, value);
        tab[index] = newEntry;
        count = c;
        return null;
    } finally {
        unlock();
    }
}

2.4 get 操作(无锁)

public V get(Object key) {
    int hash = hash(key);
    return segmentFor(hash).get(key, hash);
}
 
V get(Object key, int hash) {
    // 不加锁,使用 volatile 保证可见性
    HashEntry<K,V>[] tab = table;
    HashEntry<K,V> e = tab[hash & (tab.length - 1)];
    while (e != null) {
        if (e.hash == hash && key.equals(e.key))
            return e.value;
        e = e.next;
    }
    return null;
}

三、JDK 8 实现:CAS + synchronized

3.1 数据结构

JDK 8 抛弃了 Segment,采用数组 + 链表 + 红黑树,锁粒度细化到每个节点。

┌─────────────────────────────────────────────────────────────┐
│                    ConcurrentHashMap (JDK 8)                │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  Node[] table                                               │
│  ┌─────┬─────┬─────┬─────┬─────┬─────┬─────┬─────┐         │
│  │ null│ Node│ null│ Node│ null│ Tree│ null│ Node│         │
│  └─────┴──┬──┴─────┴──┬──┴─────┴──┬──┴─────┴──┬──┘         │
│           │           │           │           │              │
│           ▼           ▼           ▼           ▼              │
│         链表        链表       红黑树       链表              │
│                                                             │
│  锁粒度:单个 Node 节点(CAS 或 synchronized)               │
│                                                             │
└─────────────────────────────────────────────────────────────┘

3.2 核心参数

public class ConcurrentHashMap<K,V> extends AbstractMap<K,V>
    implements ConcurrentMap<K,V>, Serializable {
    
    // 默认初始容量
    private static final int DEFAULT_CAPACITY = 16;
    
    // 最大容量
    private static final int MAXIMUM_CAPACITY = 1 << 30;
    
    // 默认负载因子
    private static final float LOAD_FACTOR = 0.75f;
    
    // 链表转红黑树阈值
    static final int TREEIFY_THRESHOLD = 8;
    
    // 红黑树转链表阈值
    static final int UNTREEIFY_THRESHOLD = 6;
    
    // 扩容时的最小步长
    private static final int MIN_TRANSFER_STRIDE = 16;
    
    // 扩容时生成 stamp
    private static int RESIZE_STAMP_BITS = 16;
    
    // sizeCtl:控制标识符
    // -1:正在初始化
    // -N:有 N-1 个线程正在扩容
    // 正数:扩容阈值
    private transient volatile int sizeCtl;
    
    // 扩容时的 nextTable
    private transient volatile Node<K,V>[] nextTable;
    
    // 基础计数器
    private transient volatile long baseCount;
    
    // 计数器单元格数组(高并发时使用)
    private transient volatile CounterCell[] counterCells;
}

3.3 put 操作

public V put(K key, V value) {
    return putVal(key, value, false);
}
 
final V putVal(K key, V value, boolean onlyIfAbsent) {
    // 1. key 和 value 都不能为 null
    if (key == null || value == null) throw new NullPointerException();
    
    // 2. 计算 hash
    int hash = spread(key.hashCode());
    int binCount = 0;
    
    for (Node<K,V>[] tab = table;;) {
        Node<K,V> f; int n, i, fh;
        
        // 3. 表为空则初始化
        if (tab == null || (n = tab.length) == 0)
            tab = initTable();
        
        // 4. 位置为空,CAS 插入
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            if (casTabAt(tab, i, null, new Node<K,V>(hash, key, value, null)))
                break;
        }
        
        // 5. 正在扩容,帮助扩容
        else if ((fh = f.hash) == MOVED)
            tab = helpTransfer(tab, f);
        
        // 6. 正常插入
        else {
            V oldVal = null;
            synchronized (f) {  // 只锁当前节点
                if (tabAt(tab, i) == f) {
                    // 链表
                    if (fh >= 0) {
                        binCount = 1;
                        for (Node<K,V> e = f;; ++binCount) {
                            K ek;
                            if (e.hash == hash &&
                                ((ek = e.key) == key ||
                                 (ek != null && key.equals(ek)))) {
                                oldVal = e.val;
                                if (!onlyIfAbsent)
                                    e.val = value;
                                break;
                            }
                            Node<K,V> pred = e;
                            if ((e = e.next) == null) {
                                pred.next = new Node<K,V>(hash, key, value, null);
                                break;
                            }
                        }
                    }
                    // 红黑树
                    else if (f instanceof TreeBin) {
                        Node<K,V> p;
                        binCount = 2;
                        if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key, value)) != null) {
                            oldVal = p.val;
                            if (!onlyIfAbsent)
                                p.val = value;
                        }
                    }
                }
            }
            
            // 7. 链表转红黑树
            if (binCount != 0) {
                if (binCount >= TREEIFY_THRESHOLD)
                    treeifyBin(tab, i);
                if (oldVal != null)
                    return oldVal;
                break;
            }
        }
    }
    
    // 8. 更新计数,检查扩容
    addCount(1L, binCount);
    return null;
}

3.4 get 操作(无锁)

public V get(Object key) {
    Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
    int h = spread(key.hashCode());
    
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (e = tabAt(tab, (n - 1) & h)) != null) {
        
        // 头节点匹配
        if ((eh = e.hash) == h) {
            if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                return e.val;
        }
        // hash < 0:红黑树或 ForwardingNode
        else if (eh < 0)
            return (p = e.find(h, key)) != null ? p.val : null;
        
        // 遍历链表
        while ((e = e.next) != null) {
            if (e.hash == h &&
                ((ek = e.key) == key || (ek != null && key.equals(ek))))
                return e.val;
        }
    }
    return null;
}

3.5 多线程扩容

JDK 8 的 ConcurrentHashMap 支持多线程协同扩容:

┌─────────────────────────────────────────────────────────────┐
│                    多线程扩容过程                            │
├─────────────────────────────────────────────────────────────┤
│                                                             │
│  扩容前:Thread1 触发扩容                                    │
│                                                             │
│  ┌───┬───┬───┬───┬───┬───┬───┬───┬───┬───┬───┬───┬───┬───┐ │
│  │ 0 │ 1 │ 2 │ 3 │ 4 │ 5 │ 6 │ 7 │ 8 │ 9 │10 │11 │12 │13 │ │
│  └─┬─┴───┴─┬─┴───┴───┴───┴───┴───┴───┴───┴───┴───┴───┴───┘ │
│    │       │                                               │
│    ▼       ▼                                               │
│  Thread1  Thread2(帮助扩容)                               │
│                                                             │
│  每个线程负责一段区间(stride),协同完成扩容                 │
│  通过 transferIndex 分配任务                                │
│                                                             │
│  已迁移的节点设置为 ForwardingNode(hash = MOVED)           │
│  其他线程遇到 ForwardingNode 会帮助扩容                      │
│                                                             │
└─────────────────────────────────────────────────────────────┘

四、JDK 7 vs JDK 8 对比

对比项JDK 7JDK 8
数据结构Segment + HashEntry 数组 + 链表Node 数组 + 链表 + 红黑树
锁机制Segment 分段锁(ReentrantLock)CAS + synchronized
锁粒度Segment 级别(默认 16)Node 节点级别
并发度受 Segment 数量限制更高(Node 级别)
扩容单线程扩容多线程协同扩容
内存占用较高(多个 Segment)较低
查询效率O(1)O(1) 或 O(log n)(红黑树)

五、重要方法

5.1 spread(哈希计算)

static final int spread(int h) {
    return (h ^ (h >>> 16)) & HASH_BITS;
    // HASH_BITS = 0x7fffffff(最高位为 0)
    // 保证 hash 为正数,负数有特殊含义
    // MOVED = -1:正在扩容
    // TREEBIN = -2:红黑树根节点
}

5.2 size() 方法

// JDK 8 使用 LongAdder 思想
public int size() {
    long n = sumCount();
    return ((n < 0L) ? 0 :
            (n > (long)Integer.MAX_VALUE) ? Integer.MAX_VALUE :
            (int)n);
}
 
final long sumCount() {
    CounterCell[] as = counterCells; CounterCell a;
    long sum = baseCount;
    if (as != null) {
        for (int i = 0; i < as.length; ++i) {
            if ((a = as[i]) != null)
                sum += a.value;
        }
    }
    return sum;
}

六、常见面试题

Q1: ConcurrentHashMap 如何保证线程安全?

A:

  • JDK 7:Segment 分段锁,每个 Segment 继承 ReentrantLock
  • JDK 8:CAS + synchronized,锁粒度更细

Q2: JDK 7 和 JDK 8 的 ConcurrentHashMap 有什么区别?

A:

对比项JDK 7JDK 8
数据结构分段锁数组+链表+红黑树
锁粒度SegmentNode
锁类型ReentrantLocksynchronized + CAS
并发度固定(Segment 数)更高

Q3: ConcurrentHashMap 为什么不允许 null 键/值?

A:

  • 二义性问题:get(key) 返回 null 时,无法区分是 key 不存在还是 value 为 null
  • 多线程环境下无法用 containsKey 判断
// 如果允许 null
if (map.containsKey(key)) {
    return map.get(key);  // 可能是 null
} else {
    return null;
}
 
// 在多线程中,这两步操作之间 map 可能被修改

Q4: ConcurrentHashMap 的扩容过程?

A:

  • JDK 7:单线程扩容,持有 Segment 锁
  • JDK 8:多线程协同扩容
    • 每个线程负责一段区间
    • 已迁移节点设为 ForwardingNode
    • 其他线程遇到会帮助扩容

Q5: ConcurrentHashMap 的 get 为什么不需要加锁?

A:

  • Node 的 val 和 next 都是 volatile 的,保证可见性
  • 数组用 volatile 读取(tabAt 使用 Unsafe.getObjectVolatile)
  • 即使在扩容过程中,ForwardingNode 也能正确转发请求

Q6: ConcurrentHashMap 能完全替代 Hashtable 吗?

A:

  • 大部分场景可以
  • 但 Hashtable 的迭代是强一致性的
  • ConcurrentHashMap 的迭代是弱一致性的(可能不反映最新修改)

七、总结

特性JDK 7JDK 8
数据结构Segment + HashEntryNode + 链表 + 红黑树
锁机制分段锁(ReentrantLock)CAS + synchronized
锁粒度Segment(粗)Node(细)
get 操作无锁无锁
put 操作锁 SegmentCAS 或 锁 Node
扩容单线程多线程协同
size()累加各 SegmentLongAdder 思想

一句话总结:JDK 8 的 ConcurrentHashMap 用更细粒度的锁和 CAS 实现了更高的并发度。


最后更新:2026年3月2日