HashMap中put方法(白话加源码分析)

本文详细解析HashMap的put方法,包括key-value存储、数组扩容、哈希计算、链表与红黑树的插入操作,以及链表转红黑树的条件。当链表长度超过阈值时,HashMap会将链表转换为红黑树以提高查找效率。同时,put方法会检查并进行必要的扩容操作,确保数据结构的高效运行。

一.首先不看代码用白话分析一下流程

我们在使用put方法的时候会传进key和value参数

在我们将这两个参数传入后,

第一步,我们的put方法会去判断这个hashmap是否为null 或者长度是否为0,如果是则对hashmap数组进行resize()扩容,

第二步,put方法会根据这个key计算hash码来得到数组的位置,(这里需要解释一下,我们的hashmap默认是由一个数组加链表组成的)

得到位置后当然是继续判断这个数组下标的值是否为null,为null 自然是直接插入我们的value值,如果不为空的话进行第三步

第三步,判断key是否为null,当key!=null我们就可以覆盖value值,key==null继续第四步

第四步,如果key值也为空,则判断结点类型是链表还是红黑树

第五步,如果节点类型为红黑树,则执行红黑树插入操作

如果节点类型为链表,那么put方法就会遍历这个链表,for循环遍历链表直至链表尾部,然后进行尾插,当链表长度>=8时,会进入链表转红黑树的方法,treeifyBin方法中还会判断数组长度,数组长度>=64,链表长度>=8同时满足,才会将链表转为红黑树;在for循环遍历过程中,如果key相同,则直接插入元素

第五步,记录操作次数变量modCount+1,最后再判断当前map中有多少元素,和阈值做对比,如果超过阈值则进行扩容当数组容量超过最大容量时就会扩容一倍(即二进制的进位),没有则返回null。

put方法是由返回值的,在插入完成后,如果插入之前已经存在这个key,则返回的是插入之前已存在元素的value

二.图解

 三.源码分析

//put方法,会先调用一个hash()方法,得到当前key的一个hash值,
//用于确定当前key应该存放在数组的哪个下标位置
//这里的 hash方法,我们姑且先认为是key.hashCode(),其实不是的,一会儿细讲
 public V put(K key, V value) {

        //返回调用putVal方法
        return putVal(hash(key), key, value, false, true);
    }
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        // tab指代是hashmap的散列表再,在下方初始化,hashmap不是在创建的时候初始化,而是在put的时候初始化,属于懒初始化
        // p表示当前散列表元素
        // n表示散列表数组长度
        // i表示路由寻址的结果
        Node<K,V>[] tab; Node<K,V> p; int n, i;
       //判断是否为空,为空的话初始化,不为空对tab和n进行赋值
        if ((tab = table) == null || (n = tab.length) == 0)
            //resize扩容
            n = (tab = resize()).length;
         //这个i就是(n-1)和hash做与运算得到的位置,p就是这个位置的Node元素
        if ((p = tab[i = (n - 1) & hash]) == null)
            //直接在当前下表newNode
            tab[i] = newNode(hash, key, value, null);
         //如果要插入的元素在这个位置有元素了,执行以下操作
        else {
            //e 临时的node元素
            //k 表示临时的一个key
            Node<K,V> e; K k;
            //如果这个桶的位置的元素的key和将要插入的key是一个,会进行替换
            // 比较 哈希值 : 引用地址  : key
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))                 
                //如果相等则老元素地址指向新元素
                e = p;
            //不相等则判断节点类型:
            //结点类型为树 TreeNode是Node的一个子类
            else if (p instanceof TreeNode)                
                //红黑树的插入操作
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            //节点类型为链表
            else {
                ///for循环:1.遍历到链表尾部,进行尾插
                //2.判断链表长度,超过8将链表改为红黑树
                for (int binCount = 0; ; ++binCount) {
                    //判断节点的下一个节点为空,遍历到链表尾部,进行尾插
                    if ((e = p.next) == null) {                       
                        //生成一个Node对象,将Node对象作为新节点插入到链表(p.next)
                        p.next = newNode(hash, key, value, null);
                          //如果链表长度 >= TREEIFY_THRESHOLD-1 = 7 因为是从0开始遍历,所以此时链表长度为8
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            //树化函数
                            treeifyBin(tab, hash);
                        break;
                    }
                    
                    //key相同时同样插入返回
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            //这种属于覆盖操作,当e中有值进入操作
            if (e != null) { // existing mapping for key
                //oldValue保存老的值,方便return
                V oldValue = e.value;
                //onlyIfAbsent传入的是false,指定能进入判断
                if (!onlyIfAbsent || oldValue == null)
                    //新元素的值将老元素的值覆盖掉
                    e.value = value;
                //HashMap提供给子类的方法
                afterNodeAccess(e);
                //put操作有返回值,返回的是插入之前已经存在的元素的value值
                return oldValue;
            }
        }

        //增加修改次数
        ++modCount;
    	//统计当前map中有多少元素,和阈值对比,判断是否需要扩容
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

<think>嗯,用户想要我用通俗易懂的语言解释ConcurrentHashMapput方法。这个问题其实挺有意思的,因为ConcurrentHashMapJava并发编程中非常重要的一个类,理解它的工作原理对写出高性能的线程安全代码很有帮助。 从对话历史看,用户已经对HashMap和ConcurrentHashMap有基本了解,现在想深入理解ConcurrentHashMapput操作。用户特别强调要“通俗易懂”和“白话”,说明ta可能不太想看枯燥的源码分析,而是想要形象化的解释。 我注意到引用中提供了很多技术细节:比如put方法会调用putVal,涉及initTable初始化、helpTransfer协助扩容、树化判断等[^5]。还有ConcurrentHashMap在JDK8中的结构是数组+链表+红黑树[^2],通过CAS和synchronized实现线程安全[^4]。 那么怎么把这些技术点转化成通俗解释呢?让我想想生活中的比喻……可以把ConcurrentHashMap想象成一个大型超市的储物柜系统: - 数组就像一排排储物柜 - 每个柜子可能挂着一个链子(链表)或者放着一个整理箱(红黑树) - CAS操作就像顾客自己尝试开柜门(无锁) - synchronized锁就像管理员用钥匙开特定柜子(细粒度锁) 具体到put过程: 1. 顾客(线程)先算储物柜位置(计算hash) 2. 如果柜子空着,直接放包(CAS) 3. 如果柜子正搬家(扩容),帮管理员搬箱子(协助扩容) 4. 如果柜子有人用,等管理员开这个柜子(synchronized锁) 5. 放包时发现链子太长了,换成整理箱(树化) 6. 最后登记放包数量(addCount) 这样解释应该比直接说源码更生动。不过最后还是要回归技术本质,强调几个关键点: - 为什么线程安全(CAS+sync只锁桶) - 如何动态扩容 - 树化退化的条件 用户可能是准备面试或者调优程序,所以我还应该准备几个相关问题,比如扩容机制、树化阈值选择等。这样能帮ta更全面地理解。 对了,引用[3]提到ConcurrentHashMap也不是绝对线程安全[^3],这点要提醒用户注意,避免ta产生误解。就像储物柜系统虽然设计得很好,但如果顾客不按规矩存包还是会出问题。 </think> ### 通俗版 ConcurrentHashMapput 方法原理 想象 `ConcurrentHashMap` 是一个大型超市的储物柜系统(数组),每个柜子(桶)可能挂着一串钥匙链(链表)或一个智能保险箱(红黑树)。存包(put)的流程如下: --- #### **步骤拆解(白话版)** 1. **找柜子(计算位置)** - 先根据你的包(key)生成一个条形码(`hash值`),比如 `hash = key.hashCode() ^ (key.hashCode() >>> 16)`[^2] - 用条形码扫描储物柜区域:`柜子位置 = hash & (柜子总数 - 1)` - *为什么这样算?* 相当于把包均匀分散到所有柜子,避免扎堆[^1]。 2. **开柜存包(分情况处理)** - **场景1:柜子空着** 直接把自己的包放进去(**CAS无锁操作**),类似自助存包,速度快[^4]。 ```java if (柜子 == null) { 用CAS把新包放进柜子; // 无锁竞争 } ``` - **场景2:柜子正在搬家(扩容中)** 主动帮管理员搬家(**协助扩容**),搬完再存包[^5]。 ```java if (柜子 == MOVED) { 入搬运队; // helpTransfer() } ``` - **场景3:柜子已有包(哈希冲突)** 管理员(**synchronized锁**)打开这个柜子,检查钥匙链: - 若链上有相同钥匙(key存在),**更新**对应的包(value)[^4] - 若没有相同钥匙,**新增**一个钥匙扣(链表节点) - 若钥匙链太长(链表长度 ≥ 8),换成智能保险箱(**转红黑树**)[^1][^5] 3. **登记存包(更新计数)** - 在超市的电子屏(`CounterCell`)上 **+1** 记录存包数量,用 **CAS 分段计数** 避免排队[^5]。 - 如果存包太多导致柜子不够(元素数 > 容量 × 0.75),**触发扩容**: - 新开一排更大的储物柜(新数组) - 把旧柜子的包**均匀迁移**到新柜子(rehash)[^1][^5] --- #### **关键设计思想** - **高并发秘诀**: - 只锁一个柜子(**桶级锁**),不同柜子可同时操作,比 `Hashtable`(锁整个超市)快得多[^2][^4] - 无冲突时用 **CAS**(无锁),冲突时才用 **synchronized**(细粒度锁) - **动态扩容**: 迁移数据时,其他线程存取包时**协助搬运**,边用边扩[^5] - **链表转树**: 单个柜子挂太多钥匙链(链表)时,换成查找更快的保险箱(红黑树),但太小时会**退化成链表**省空间[^1] > **类比总结**: > 就像去超市存包—— > 1. 扫码找空柜(CAS无锁) > 2. 若柜子被占,等管理员开锁(synchronized) > 3. 存满时超市悄悄扩建(扩容),顾客顺手帮忙搬(协助迁移) --- ### 相关问题 1. **ConcurrentHashMap 扩容时如何保证线程安全?** - 迁移数据时通过 `synchronized` 锁住当前桶,其他线程存取时若发现桶在迁移,会主动协助搬运[^5]。 2. **链表转红黑树的阈值为什么是8?退化阈值为什么是6?** - 根据泊松分布,哈希冲突达到8的概率极低(约千万分之一),此时树化收益大于链表遍历成本;退化阈值设6是为避免频繁转换的抖动[^1]。 3. **ConcurrentHashMap 的 size() 方法为什么可能不精确?** - 高并发下直接返回计数器可能遗漏其他线程的修改,实际通过分段累 `CounterCell` 数组的值,允许短暂误差以换取性能[^1]。 4. **JDK7 的分段锁和 JDK8 的 CAS+synchronized 有何区别?** - JDK7 锁的是“一组柜子”(Segment),JDK8 直接锁“单个柜子”(桶),锁粒度更细,并发度更高[^2][^4]。 5. **ConcurrentHashMap 一定线程安全吗?** - 单个操作是安全的,但组合操作(如`get`后`put`)需外部同步。例如“若没有则添”需用`computeIfAbsent`[^3]。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值