HashMap作为老生常谈的问题,备受面试官的青睐,甚至成为了面试必问的问题。由于大量的针对HashMap的解析横空出世,面试官对HashMap的要求越来越高,就像面试官对JVM掌握要求越来越高一样,今天我们来研究下HashMap的链表环化的问题,你知道其中的原理嘛?关注公众号“程序员清辞”,获取更多内容

在JDK1.7版本下,有个线程安全的问题,经常会被问到,很多求职者可能还在对比Hashtable线程安全性,其实面试官想得到的链表成环造成线程安全的问题,而这个问题在JDK1.8中已经得到了解决,但至于出现这样问题的原因,我翻看了很多帖子,大家剖析的很透彻,但是很难理解,今天结合自己的研究利用一篇帖子来阐述其中的奥秘。

JDK1.7扩容源码解析

首先我来了解下HashMap中经典的扩容代码,回顾下扩容的过程

public class HashMap<K,V> extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable {
   
   //......
   
   // 扩容方法
   void resize(int newCapacity) {
       // 1、创建临时变量,将HashMap数组数据赋值给新数组作临时存储
       Entry[] oldTable = table;
       // 2、判断老数组长度是否超过了允许的最大长度,最大长度为 1 << 30
       int oldCapacity = oldTable.length;
       if (oldCapacity == MAXIMUM_CAPACITY) {
           threshold = Integer.MAX_VALUE;
           return;
      }
// 3、创建新的Entry数组,并扩容
       Entry[] newTable = new Entry[newCapacity];
       // 4、扩容赋值,即将老数组中的数据赋值到新数组中
       // initHashSeedAsNeeded(newCapacity) 得到的是一个hash的随机值(哈希种子),
//在计算哈希码时会用到这个种子,作用是减少哈希碰撞
       transfer(newTable, initHashSeedAsNeeded(newCapacity));
       // 6、扩容后赋值
       table = newTable;
       threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
  }
   
   // newTable : 表示新数组,即扩容后创建的新数组
   // rehash : 是否需要重新计算哈希值
   void transfer(Entry[] newTable, boolean rehash) {
int newCapacity = newTable.length;
       // 5、将老map中的数据赋值到新map中(数组和链表复制迁移)
for (Entry<K,V> e : table) {  
while(null != e) {
Entry<K,V> next = e.next;
if (rehash) {
e.hash = null == e.key ? 0 :hash(e.key);
}
               // 计算Entry元素在Entry[]数组中的位置
int i = indexFor(e.hash, newCapacity);

// 链表头插法赋值过程
e.next = newTable[i];
newTable[i] = e;
e = next;
}
}
}
   
   //......
   
}
  1. 创建临时变量,将HashMap数组数据赋值给新数组作临时存储
  2. 判断老数组长度是否超过了允许的最大长度,最大长度为 1 << 30
  3. 创建新的Entry数组,并扩容
  4. 扩容赋值,即将老数组中的数据赋值到新数组中
  5. 将老map中的数据赋值到新map中(数组和链表复制迁移)
  6. 扩容后赋值

链表迁移过程

以下三行代码描述了链表头插的整个过程,下面来剖析下这个过程:

e.next = newTable[i];
newTable[i] = e;
e = next;

关注公众号“程序员清辞”,获取更多内容

假设HashMap的存储状态如下:

关注公众号“程序员清辞”,获取更多内容

e为数组位置的元素,e1、e2为e下形成的链表,h为将要赋值的位置,箭头代表链表指向

e.next = newTable[i]

对oldTable进行遍历的过程中,取出元素e,假设先取出图中的元素e,在执行这行代码时,相当于断开x位置e与e1的链表关系,并与newTable[i]建立链表关系,此时newTable[i]位置为null

newTable[i] = e

此时将oldTable中的e复制到newTable中的i位置,同时链表e指向null

问题:那oldTable中e1和e2形成的链表怎么办?

其实在之前的代码中已经阐述了,详情如下:

while(null != e) {

    // 这里已经将e.next存储为一个临时变量,也就是e1和e2形成的链表
Entry<K,V> next = e.next;
if (rehash) {
e.hash = null == e.key ? 0 :hash(e.key);
}
......
}

e = next;

将next的值赋值给e,这行代码对上述的链表没有实质的影响,并且这已经是while循环的最后一行代码了,这行代码的目的是为下一次while遍历过程能从e1元素开始,而不是e,因为此时需要的遍历的e已经变成了e1。

通过这次数据迁移可能没有得到比较有参考意义的分析,所以我们需要再进行一次遍历分析,而这次遍历分析从e1开始。这里就不详细阐述,直接上图。

e.next = newTable[i]

newTable[i] = e

最终效果

以上就是整个数据迁移的过程,通过链表实例大家发现HashMap利用头插法完成迁移的过程,下面进入重点,链表成环

并发操作链表成环

产生基本条件

  1. 多线程环境并发操作
  2. HashMap扩容时候发生

问题解析

在多线程环境下,a,b两个线程同时操作这个HashMap,由于HashMap是线程不安全的,假如线程a已经完成以上全过程,也就是下图

代码执行到如下位置,还没有完全的出栈

此时线程b同时也在遍历这条链表,同时代码运行到while循环位置

关注公众号“程序员清辞”,获取更多内容

这时线程b已经重新获取e数据时,由于a线程的操作还没有将数据同步到主内存,导致出现如下情况:

问题总结

  1. 插入的时候和平时我们追加到尾部的思路是不一致的,是链表的头结点开始循环插入,导致插入的顺序和原来链表的顺序相反的。
  2. table 是共享的,table 里面的元素也是共享的,while 循环都直接修改 table 里面的元素的 next 指向,导致指向混乱。

最新文章

  1. GNU/Linux复习笔记(2)
  2. 如何开始DDD(完)
  3. python学习-day15:局部变量与全局变量、嵌套函数、递归
  4. How Tomcat works — 六、tomcat处理请求
  5. 系统级I/O 第八周11.9~11.15
  6. [Serializable]的应用--注册码的生成,加密和验证
  7. 算法导论学习-heapsort
  8. phpcms:二、头部尾部包含
  9. 主从集群搭建及容灾部署redis
  10. Android基础工具函数代码集
  11. Java容器---Map基础
  12. 干货满满,腾讯云+社区技术沙龙 Kafka Meetup 深圳站圆满结束
  13. es6中常用方法
  14. Python3画图系列——NetworkX初探
  15. Struts2的类型转换器
  16. linux设备模型:扩展篇
  17. Oracle学习笔记:a inner join b与from a,b where a.x=b.x的差异
  18. JS模块规范
  19. 使用CDN的网络访问过程
  20. Daemon,Jos,定时器

热门文章

  1. SpringSecurity+Oauth2+Jwt实现toekn认证和刷新token
  2. vue+springboot文件下载
  3. Golang获取目录下的文件及目录信息
  4. 总结HashMap实现原理分析
  5. PHP rmdir() 函数
  6. PHP cos() 函数
  7. cobbler多机定制安装
  8. ElasticSearch添加索引
  9. hibernate数据库连接池,常用配置
  10. asp.net 远程模型验证