jdk 集合大家族之Collection

前言:

  此处的集合指的是java集合框架中的实现了Collection接口相关的类。所以主要为List Set 和 Queue 其他章节会专门介绍Map相关。

1. List

1.1 ArrayList

  • 从数组中间删除某个元素需要很大代价,因为被删除之后的元素都要向数组的前端移动
  • 适合查找和修改
  • ArrayList底层通过数组实现
    • 顺序存储
    • 读取 存入操作方便
    • 插入、删除操作不方便

1.1.1 ArrayList分析 (jdk 8)

从ArrayList 的初始化开始说起
  • 无参构造函数

    • 创建默认容量为10的数组
    /**
    * Constructs an empty list with an initial capacity of ten.
    */
    public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }
  • 有参构造函数
    • 根据容量的
    /**
    * Constructs an empty list with the specified initial capacity.
    *
    * @param initialCapacity the initial capacity of the list
    * @throws IllegalArgumentException if the specified initial capacity
    * is negative
    */
    public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
    // 直接指定 没有扩容操作
    this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
    this.elementData = EMPTY_ELEMENTDATA;
    } else {
    throw new IllegalArgumentException("Illegal Capacity: "+
    initialCapacity);
    }
    }
    • 使用集合作为参数
    /**
    * Constructs a list containing the elements of the specified
    * collection, in the order they are returned by the collection's
    * iterator.
    *
    * @param c the collection whose elements are to be placed into this list
    * @throws NullPointerException if the specified collection is null
    */
    public ArrayList(Collection<? extends E> c) {
    elementData = c.toArray();
    if ((size = elementData.length) != 0) {
    // c.toArray might (incorrectly) not return Object[] (see 6260652)
    if (elementData.getClass() != Object[].class)
    elementData = Arrays.copyOf(elementData, size, Object[].class);
    } else {
    // replace with empty array.
    this.elementData = EMPTY_ELEMENTDATA;
    }
    }
类的成员变量
    private static final long serialVersionUID = 8683452581122892189L;

    /**
* Default initial capacity.
*/
// 默认容量
private static final int DEFAULT_CAPACITY = 10; /**
* Shared empty array instance used for empty instances.
*/
private static final Object[] EMPTY_ELEMENTDATA = {}; /**
* Shared empty array instance used for default sized empty instances. We
* distinguish this from EMPTY_ELEMENTDATA to know how much to inflate when
* first element is added.
*/
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {}; /**
* The array buffer into which the elements of the ArrayList are stored.
* The capacity of the ArrayList is the length of this array buffer. Any
* empty ArrayList with elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA
* will be expanded to DEFAULT_CAPACITY when the first element is added.
*/
transient Object[] elementData; // non-private to simplify nested class access /**
* The size of the ArrayList (the number of elements it contains).
*
* @serial
*/
private int size; // 数组最大的长度 其中通过最终的hugeCapacity()可以突破这个限制达到Integer.MAX_VALUE
// 数组需要-8: 有些虚拟机在数组中保留了一些头信息。避免内存溢出
/**
* The maximum size of array to allocate.
* Some VMs reserve some header words in an array.
* Attempts to allocate larger arrays may result in
* OutOfMemoryError: Requested array size exceeds VM limit
*/
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

需要注意的是ArrayList存储的最大量其实跟你设置的内存也是有关系的。

ArrayList 的删除操作
public boolean remove(Object o) {
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else {
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
} /*
* Private remove method that skips bounds checking and does not
* return the value removed.
*/
private void fastRemove(int index) {
modCount++;
int numMoved = size - index - 1;
if (numMoved > 0)
// 将index后面的舒服复制到index处
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
//置空
elementData[--size] = null; // clear to let GC do its work
}
ArrayList 的扩容
  • 通过grow函数 创建一个新的数组,赋予新的长度然后覆盖掉原来的数组
   // 添加函数
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
private void ensureCapacityInternal(int minCapacity) {
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}
private static int calculateCapacity(Object[] elementData, int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
return Math.max(DEFAULT_CAPACITY, minCapacity);//空数组扩容默认值和需要的长度 取最大值
}
return minCapacity;
}
private void ensureExplicitCapacity(int minCapacity) {
// modCount: 继承自AbstractList 用于防止一个迭代器(Iterator)对集合进行修改而另一个迭代器对其进行遍历时,产生混乱的现象(并发场景下)。与modCount 搭配的是 expectedModCount
modCount++; // overflow-conscious code
// 需要的长度比数组长度大,此时确实需要扩容
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
// 目标扩容为原数组长度的1.5倍
int newCapacity = oldCapacity + (oldCapacity >> 1);
// 需要的长度比计算值大的话 取最大值
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
// 如果计算后的值比ArrayList 的MAX_ARRAY_SIZE属性还要大的话,进行终极扩容
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
// 拷贝到新数组中
elementData = Arrays.copyOf(elementData, newCapacity);
} private static int hugeCapacity(int minCapacity) {
// 溢出
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
// 最大值为Integer.MAX_VALUE 此时多余的会被舍弃掉
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}

1.2 LinkedList

  • 随机访问第n个元素需要从头开始,如果大于size()/2 则从尾端开始搜索
  • 相比数组实现的ArrayList
    • 提供了无界队列功能下面有说到
    • 插入删除时较arrayList 好
    • 适合插入和删除
  • ListIterator 接口提供两个方法可以反向遍历链表
    • previous
    • hasPrevious

1.3 Vector

  • 线程安全 因为需要同步所以会耗费大量时间
  • 通过synchronized实现加锁

2. Set

2.1 HashSet

散列集

  • 通过散列表为每个对象计算一个散列码,也称之为hash code 它是一个整数(可以是负数)
  • 通过链表数组实现
    • 数组的部分被称之为桶(bucket)
    • 桶默认16个
    • 当装填因子0.75,表中超过75%的位置已经被填入则会用双倍的桶数自动进行再散列(扩容并重新计算hash code)
    • jdk8 中桶满时会从链表变为平衡二叉树
  • 相比较于List
    • 不可重复
    • 无序
    • 可快快速查看某个元素,而不必遍历List来查找
  • 底层实现通过HashMap
    • 将值放到key中 value为空的object

2.2 TreeSet

  • 树集比散列集有所改进,是一个有序的集合

    • 因此迭代器是以排好的顺序来访问每个元素的
    • 排序的规则是实现 Coompareable接口或使用Comparator
  • 排序是通过树结构来完成的(红黑树)
  • 相比较散列集而言,插入时会有一个排序的过程,所以会慢一些(慢多少是根据数据而言,或许相差很小)

3. Queue

  • Deque: 双端队列 ,有两个端头的队列。不支持在队列中间添加元素
  • java 中的链表都是都是双向链接的
  • 队列的实现方式有两种: 数组或链表

3.1 ArrayDeque

  • 通过数组实现
  • 有边界 但是效率高

3.2 LinkedList

  • 通过链表实现
  • 无边界 没有数组实现效率高

3.3 PriorityQueue

优先级队列

  • 优先级队列的典型案例是任务调度

    • 每当启动一个新的任务时,都将优先级最高的任务从队列中删除)
    • 1 设为“最高” 优先
  • 通过堆来实现的 ,自我调整的二叉树 可以在删除和添加操作时,让最小的元素移动到根。

比较

  • 如果需要收集的对象没有上限就使用链表,如果是一个有界的(容量有限),就使用数组实现。
参考资料
  • java核心技术卷一

最新文章

  1. ES6 箭头函数中的 this?你可能想多了(翻译)
  2. CSS3学习基本记录
  3. Anchor 对象和document对象
  4. web初学之jdbc连接数据库
  5. hadoop(四):配置参数
  6. 经典SQL查询语句大全
  7. POJ 2828Buy Tickets
  8. SpringMVC注解@RequestParam(转)
  9. Swift语言中与C/C++和Java不同的语法(四)
  10. Java面试宝典-2017
  11. git只追踪特定类型的文件
  12. MaxCompute在高德大数据上的应用
  13. 1244. Minimum Genetic Mutation
  14. [转]/etc/passwd文件解析
  15. react 页面存在多 input 时
  16. C#中Main函数为什么要static
  17. 使用VSCode调试单个PHP文件
  18. Memcache 优化建议
  19. Oracle 修改用户名
  20. ExtJs中XTemplate使用(转)

热门文章

  1. win10 远程桌面 ubuntu
  2. OpenStack Train版-1.安装基础环境&amp;服务
  3. K8S(06)web管理方式-dashboard
  4. pikachu-反射性xss(get)
  5. 006.NET 项目建立+传值
  6. GitHub Secrets All In One
  7. HTML5 动效
  8. shit api &amp; shit antd
  9. JWT All In One
  10. 如何取消一个 Ajax 请求