【Java基础】谈谈集合.CopyOnWriteArrayList
本篇博客介绍CopyOnWriteArrayList类,读完本博客你将会了解:
- 什么是COW机制;
- CopyOnWriteArrayList的实现原理;
- CopyOnWriteArrayList的使用场景。
经过之前的博客介绍,我们知道ArrayList是线程不安全的。要实现线程安全的List,我们可以使用Vector,或者使用Collections工具类将List包装成一个SynchronizedList。其实在Java并发包中还有一个CopyOnWriteArrayList可以实现线程安全的List。
在开始之前先贴一段概念
如果有多个调用者(callers)同时请求相同资源(如内存或磁盘上的数据存储),他们会共同获取相同的指针指向相同的资源,直到某个调用者试图修改资源的内容时,系统才会真正复制一份专用副本(private copy)给该调用者,而其他调用者所见到的最初的资源仍然保持不变。优点是如果调用者没有修改该资源,就不会有副本(private copy)被建立,因此多个调用者只是读取操作时可以共享同一份资源。
实现原理
Vector这个类是一个非常古老的类了,在JDK1.0的时候便已经存在,其实现安全的手段非常简单所有的方法都加上synchronized关键字,这样保证这个实例的方法同一时刻只能有一个线程访问,所以在高并发场景下性能非常低。
SynchronizedList是java.util.Collections中的一个静态内部类,其实现安全的手段稍微有一点优化,就是把Vector加在方法上的synchronized关键字,移到了方法里面变成了同步块而不是同步方法从而把锁的范围缩小了,另外,SynchronizedList中的方法不全都是同步的,比如获取迭代器方法listIterator()就不是同步的。下面看下CopyOnWriteArrayList怎么实现线程安全的。
CopyOnWriteArrayList这个类就比较特殊了,对于写来说是基于重入锁互斥的,对于读操作来说是无锁的。还有一个特殊的地方,这个类的iterator是fail-safe的,也就是说是线程安全List里面的唯一一个不会出现ConcurrentModificationException异常的类。
看下CopyOnWriteArrayList的成员变量:
//重入锁保写操作互斥
final transient ReentrantLock lock = new ReentrantLock();
//volatile保证读可见性
private transient volatile Object[] array;
下面再看下添加元素的代码逻辑
public boolean add(E e) {
final ReentrantLock lock = this.lock;
lock.lock();//加锁
try {
Object[] elements = getArray();//读取原数组
int len = elements.length;
//构建一个长度为len+1的新数组,然后拷贝旧数据的数据到新数组
Object[] newElements = Arrays.copyOf(elements, len + 1);
//把新加的数据赋值到最后一位
newElements[len] = e;
// 替换旧的数组
setArray(newElements);
return true;
} finally {
lock.unlock();
}
}
先获得锁,然后拷贝元素组并将新元素加入(添加的元素可以是null),再替换掉原来的数组。我们会发现这种实现方式非常不适合频繁修改的操作。CopyOnWriteArrayList的删除和修改的操作的原理也是类似的,这边就不贴代码了。
最后看下读操作
//直接获取index对应的元素
public E get(int index) {return get(getArray(), index);}
private E get(Object[] a, int index) {return (E) a[index];}
从以上的增删改查中我们可以发现,增删改都需要获得锁,并且锁只有一把,而读操作不需要获得锁,支持并发。为什么增删改中都需要创建一个新的数组,操作完成之后再赋给原来的引用?这是为了保证get的时候都能获取到元素,如果在增删改过程直接修改原来的数组,可能会造成执行读操作获取不到数据。
遍历时不用加锁的原因
常用的方法实现我们已经基本了解了,但还是不知道为啥能够在容器遍历的时候对其进行修改而不抛出异常。(其实这是一种fail-safe机制)
// 1. 返回的迭代器是COWIterator
public Iterator<E> iterator() {
return new COWIterator<E>(getArray(), 0);
}
// 2. 迭代器的成员属性
private final Object[] snapshot;
private int cursor;
// 3. 迭代器的构造方法
private COWIterator(Object[] elements, int initialCursor) {
cursor = initialCursor;
snapshot = elements;
}
// 4. 迭代器的方法...
public E next() {
if (! hasNext())
throw new NoSuchElementException();
return (E) snapshot[cursor++];
}
//.... 可以发现的是,迭代器所有的操作都基于snapshot数组,而snapshot是传递进来的array数组
到这里,我们应该就可以想明白了!CopyOnWriteArrayList在使用迭代器遍历的时候,操作的都是原数组!
CopyOnWriteArrayLis的缺点
- 内存占用:如果CopyOnWriteArrayList经常要增删改里面的数据,经常要执行add()、set()、remove()的话,那是比较耗费内存的。因为我们知道每次add()、set()、remove()这些增删改操作都要复制一个数组出来。
- 数据一致性:CopyOnWrite容器只能保证数据的最终一致性,不能保证数据的实时一致性。从上面的例子也可以看出来,比如线程A在迭代CopyOnWriteArrayList容器的数据。线程B在线程A迭代的间隙中将CopyOnWriteArrayList部分的数据修改了(已经调用setArray()了)。但是线程A迭代出来的是原有的数据。
使用场景
整体来说CopyOnWriteArrayList是另类的线程安全的实现,但并一定是高效的,适合用在读取和遍历多的场景下,并不适合写并发高的场景,因为数组的拷贝也是非常耗时的,尤其是数据量大的情况下。
总结
稍微总结下:
- CopyOnWriteArrayList基于可重入锁机制,增删改操作需要加锁,读操作不需要加锁;
- CopyOnWriteArrayList适合用在读取和遍历多的场景下,并不适合写并发高的场景;
- 基于fail-safe机制,不会抛出CurrentModifyException;
- 另外CopyOnWriteArrayList提供了弱一致性的迭代器,从而保证在获取迭代器后,其他线程对list的修改是不可见的,迭代器遍历的数组是一个快照。
其他网友的总结:
CopyOnWrite容器即写时复制的容器。通俗的理解是当我们往一个容器添加元素的时候,不直接往当前容器添加,而是先将当前容器进行Copy,复制出一个新的容器,然后新的容器里添加元素,添加完元素之后,再将原容器的引用指向新的容器。
CopyOnWriteArrayList中add/remove等写方法是需要加锁的,目的是为了避免Copy出N个副本出来,导致并发写。
但是,CopyOnWriteArrayList中的读方法是没有加锁的。
这样做的好处是我们可以对CopyOnWrite容器进行并发的读,当然,这里读到的数据可能不是最新的。因为写时复制的思想是通过延时更新的策略来实现数据的最终一致性的,并非强一致性。
所以CopyOnWrite容器是一种读写分离的思想,读和写不同的容器。而Vector在读写的时候使用同一个容器,读写互斥,同时只能做一件事儿。
参考
最新文章
- arcgis出图步骤(缩减版)
- Learning to rank 特征抽取
- QT学习之路--深入了解信号槽
- C++类库介绍
- 结合Vim ghostscript 将源代码文件转换成语法高亮的pdf格式文档
- 【转】通知 Toast详细用法(显示view)
- UVALive 6198 A Terribly Grimm Problem
- 颠覆你的时空观-----理解傅立叶transform
- 关于WebService、WebApi的跨域问题
- 安徽省2016“京胜杯”程序设计大赛_K_纸上谈兵
- Win10 UWP Intro to controls and events
- puppet客户端拉取服务端的资源时报错
- 基于TensorFlow的深度学习系列教程 1——Hello World!
- TFS 2017 持续集成速记
- liunx文件操作 文件查看
- 对Java通配符的个人理解(以集合为例)
- Spring 学习记录6 BeanFactory(2)
- bzoj 1189 [HNOI2007]紧急疏散evacuate 二分+网络流
- C#调用 oracle存储过程
- 使用cookie实现只出现一次的广告代码效果
热门文章
- Solve Hibernate Lazy-Init issue with hibernate.enable_lazy_load_no_trans
- 【学习笔记】python3核心技术与实践--开篇词
- Java中对象创建时的内存分配
- .NET Core使用NPOI导出复杂Word详解
- 如何在女友卸妆后,正确的找到她?---java中使用反射的小秘密
- GStreamer基础教程08 - 多线程
- hadoop之yarn详解(基础架构篇)
- java基础之泛型对象与json互转
- 特殊的ARP
- div模拟select/option解决兼容性问题及增加可拓展性