博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
牛客网Java刷题知识点之为什么HashMap不支持线程的同步,不是线程安全的?如何实现HashMap的同步?...
阅读量:6207 次
发布时间:2019-06-21

本文共 5249 字,大约阅读时间需要 17 分钟。

  首先,HashMap不支持线程的同步。

  同步,指的是在一个时间点只能有一个线程可以修改hash表,任何线程在执行Hashtable的更新操作前都需要获取对象锁,其他线程则等待锁的释放。

 

 

 

 

为什么HashMap是线程不安全的,实际会如何体现?

  第一,如果多个线程同时使用put方法添加元素。

  假设正好存在两个put的key发生了碰撞(hash值一样),那么根据HashMap的实现,这两个key会添加到数组的同一个位置,这样最终就会发生其中一个线程的put的数据被覆盖。

  第二,如果多个线程同时检测到元素个数超过数组大小*loadFactor。

  这样会发生多个线程同时对hash数组进行扩容,都在重新计算元素位置以及复制数据,但是最终只有一个线程扩容后的数组会赋给table,也就是说其他线程的都会丢失,并且各自线程put的数据也丢失。且会引起死循环的错误。

 

 

  HashMap底层是一个Entry数组,当发生hash冲突的时候,hashmap是采用链表的方式来解决的,在对应的数组位置存放链表的头结点。对链表而言,新加入的节点会从头结点加入

  我们来分析一下多线程访问:

   1、在hashmap做put操作的时候会调用下面方法:

// 新增Entry。将“key-value”插入指定位置,bucketIndex是位置索引。          void addEntry(int hash, K key, V value, int bucketIndex) {              // 保存“bucketIndex”位置的值到“e”中              Entry
e = table[bucketIndex]; // 设置“bucketIndex”位置的元素为“新Entry”, // 设置“e”为“新Entry的下一个节点” table[bucketIndex] = new Entry
(hash, key, value, e); // 若HashMap的实际大小 不小于 “阈值”,则调整HashMap的大小 if (size++ >= threshold) resize(2 * table.length); }

   在hashmap做put操作的时候会调用到以上的方法。现在假如A线程和B线程同时对同一个数组位置调用addEntry,两个线程会同时得到现在的头结点,然后A写入新的头结点之后,B也写入新的头结点,那B的写入操作就会覆盖A的写入操作造成A的写入操作丢失。

 

  2、删除键值对的代码

      // 删除“键为key”的元素          final Entry
removeEntryForKey(Object key) { // 获取哈希值。若key为null,则哈希值为0;否则调用hash()进行计算 int hash = (key == null) ? 0 : hash(key.hashCode()); int i = indexFor(hash, table.length); Entry
prev = table[i]; Entry
e = prev; // 删除链表中“键为key”的元素 // 本质是“删除单向链表中的节点” while (e != null) { Entry
next = e.next; Object k; if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) { modCount++; size--; if (prev == e) table[i] = next; else prev.next = next; e.recordRemoval(this); return e; } prev = e; e = next; } return e; }

  当多个线程同时操作同一个数组位置的时候,也都会先取得现在状态下该位置存储的头结点,然后各自去进行计算操作,之后再把结果写会到该数组位置去,其实写回的时候可能其他的线程已经就把这个位置给修改过了,就会覆盖其他线程的修改。

 

 

3、addEntry中当加入新的键值对后键值对总数量超过门限值的时候会调用一个resize操作,代码如下:

// 重新调整HashMap的大小,newCapacity是调整后的容量          void resize(int newCapacity) {              Entry[] oldTable = table;              int oldCapacity = oldTable.length;             //如果就容量已经达到了最大值,则不能再扩容,直接返回            if (oldCapacity == MAXIMUM_CAPACITY) {                  threshold = Integer.MAX_VALUE;                  return;              }                   // 新建一个HashMap,将“旧HashMap”的全部元素添加到“新HashMap”中,              // 然后,将“新HashMap”赋值给“旧HashMap”。              Entry[] newTable = new Entry[newCapacity];              transfer(newTable);              table = newTable;              threshold = (int)(newCapacity * loadFactor);          }

   这个操作会新生成一个新的容量的数组,然后对原数组的所有键值对重新进行计算和写入新的数组,之后指向新生成的数组。

      当多个线程同时检测到总数量超过门限值的时候就会同时调用resize操作,各自生成新的数组并rehash后赋给该map底层的数组table,结果最终只有最后一个线程生成的新数组被赋给table变量,其他线程的均会丢失。而且当某些线程已经完成赋值而其他线程刚开始的时候,就会用已经被赋值的table作为原始数组,这样也会有问题。

 

 

 

 

 

 

 

如何实现HashMap的同步?

  答:

  第一种方法:

   直接使用Hashtable,但是当一个线程访问HashTable的同步方法时,其他线程如果也要访问同步方法,会被阻塞住。举个例子,当一个线程使用put方法时,另一个线程不但不可以使用put方法,连get方法都不可以,效率很低,现在基本不会选择它了。

 

 

  第二种方法:   HashMap可以通过下面的语句进行同步,

Collections.synchronizeMap(hashMap);

  HashMap可以通过Map m = Collections.synchronizedMap(new HashMap())来达到同步的效果

  具体而言,该方法返回一个同步的Map,该Map封装了底层的HashMap的所有方法,使得底层的HashMap即使是在多线程的环境中也是安全的。

 

  第三种方法:

  直接使用JDK 5 之后的 ConcurrentHashMap,如果使用Java 5或以上的话,请使用ConcurrentHashMap

  Collections.synchronizeMap(hashMap);  又是如何保证了HashMap线程安全?

// synchronizedMap方法public static 
Map
synchronizedMap(Map
m) { return new SynchronizedMap<>(m); }// SynchronizedMap类private static class SynchronizedMap
implements Map
, Serializable { private static final long serialVersionUID = 1978198479659022715L; private final Map
m; // Backing Map final Object mutex; // Object on which to synchronize SynchronizedMap(Map
m) { this.m = Objects.requireNonNull(m); mutex = this; } SynchronizedMap(Map
m, Object mutex) { this.m = m; this.mutex = mutex; } public int size() { synchronized (mutex) { return m.size();} } public boolean isEmpty() { synchronized (mutex) { return m.isEmpty();} } public boolean containsKey(Object key) { synchronized (mutex) { return m.containsKey(key);} } public boolean containsValue(Object value) { synchronized (mutex) { return m.containsValue(value);} } public V get(Object key) { synchronized (mutex) { return m.get(key);} } public V put(K key, V value) { synchronized (mutex) { return m.put(key, value);} } public V remove(Object key) { synchronized (mutex) { return m.remove(key);} } // 省略其他方法 }

  从源码中看出 synchronizedMap()方法返回一个SynchronizedMap类的对象,而在SynchronizedMap类中使用了synchronized来保证对Map的操作是线程安全的,故效率其实也不高。

本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/7635070.html,如需转载请自行联系原作者

你可能感兴趣的文章
linux下查看文件及目录个数
查看>>
2015 CALLED THE INTERFACE OF 2014
查看>>
我是怎样成长为系统架构师的
查看>>
UGUI的优点新UI系统
查看>>
Android二维码之创建
查看>>
Python匿名函数——lambda表达式
查看>>
从Eclipse转移到IntelliJ IDEA一点心得
查看>>
Memcached总结三:Memcached常用命令及使用说明
查看>>
emoji表情引发的JNI崩溃
查看>>
python语法笔记(四)
查看>>
UIImageView圆角,自适应图片宽高比例,图片拉伸,缩放比例和图片缩微图
查看>>
Mongo读书笔记1 -- GridFS
查看>>
【iCore3 双核心板_FPGA】例程十二:Modelsim仿真实验
查看>>
Struts2原理图
查看>>
svn的merge使用例子
查看>>
Linux信号
查看>>
scikit-learn决策树算法类库使用小结
查看>>
ABP文档 - Javascript Api - AJAX
查看>>
首次构建android studio gradle 下载缓慢的问题
查看>>
mysql命令行导入和导出数据
查看>>