一、JDK1.7中HashMap扩容死锁问题
我们首先来看一下JDK1.7中put方法的源码
我们打开addEntry
方法如下,它会判断数组当前容量是否已经超过的阈值,例如假设当前的数组容量是16,加载因子为0.75,即超过了12,并且刚好要插入的索引处有元素,这时候就需要进行扩容操作,可以看到resize
扩容大小是原数组的两倍,仍然符合数组的长度是2的指数次幂
我们再进入resize
方法如下,它首先会对之前的数组容量进行判断,看是否已经达到了数组最大容量,如果没有,后面会进行数组的转移操作,即transfer
方法
我们先来看一下进行转移操作的方法,JDK1.7中HashMap存在死锁问题的原因也主要集中在这
假设我们有这样一个HashMap,如下
现在需要对其进行扩容操作(假设已经达到扩容阈值,忽略其他元素)
根据源码中,此时会产生连个指针,一个e指针,指向当前节点,另一个节点为next,指向e的下一个节点,即e.next,如下图所示
源码中的if判断实现的是重哈希,indexFor操作实现的是重新定位当前节点在新数组中的位置,我们来看一下新数组
假设此时还是定位到数组3号位
接着看源码e.next = newTable[i]
,即将e.next节点指向了扩容后数组的的3号位,因为这是刚创建的新数组,还是空数组,因此e.next = null,此时指向如下图所示
接着执行下一步newTable[i] = e
,即将当前节点e赋值给刚在新数组找到的新节点,如下图所示
最后一步e = next
,即:
至此,while循环的第一遍结束,此时e指向杨过这个节点,很明显不为空,会进行第二次循环,重复以上操作,最后产生的效果为:
可以杨过和小龙女两个节点的位置发生了改变了(这也是HashMap为什么无序的原因)
以上为单线程下进行扩容,并不会产生线程安全问题,但是如果是多线程进行扩容呢
我们假设现在有两个线程同时对数组扩容,每个线程都存在两个指针,线程1为e和next,线程2为e2和next2
假设此时线程2运行到如下红色框中的代码时线程阻塞了,对应上图则是e2指向了小龙女,next2指向了杨过
因为线程2被阻塞了,其后面的代码就没法继续执行了,而此时线程1也进入方法进行扩容,扩容后的结果就是单线程时扩容后的结果,如上图所示,此时相比于扩容前的HashMap,杨过和小龙女位置已经调换
此时刚刚被阻塞的的线程2被唤醒了,注意此时线程2中两个指针的指向,如下图所示
此时线程2执行e.next = newTable[i]
这一行,即e2的下一个节点指向其扩容的新数组,如下图所示:
再执行下面的newTable[i] = e
,即将小龙女这个节点填入数组中,如下
现在指向最后一步e = next
,由于此时next2还指向线程1扩容后数组中的杨过节点,因此现在e2和next2都指向杨过节点
接着第二次循环,结果如下:
现在进行第三次循环,仍然是e.next = newTable[i]
这一行,此时的newTable[i]是杨过节点,因此这步的结果就是小龙女节点又指回了杨过节点
此时又执行e = newTable[i]
,结果如下:
最后一步执行完后两个指针都指向了空
此时新扩容的数组也形成了一个环
以上就是HashMap扩容时死锁的原因
二、JDK1.8中对HashMap的优化
先看一下JDK8中HashMap源码
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
// 容量为空时重新赋值
if ((tab = table) == null || (n = tab.length) == 0)
n