Java集合
Java中集合类主要用于保存、盛装其他类型的数据,因此集合类也称为容器类。所有的集合类都位于java.util包下,容器类只能保存引用类型。Java中的集合类主要有两个接口:Collection和Map,本文主要讨论Collection接口。Collection接口的继承树如下:
Set接口
- Set接口与Collection基本相同,没有提供额外的方法
- Set接口的所有实现类都不允许包含重复元素
HashSet类
HashSet按照哈希码来存储集合中的元素,因此具有很好的存取和查找性能。- 不保证元素的排列顺序
- 不是线程安全的
- 元素值可以是
null
向HashSet中存入一个新元素时,HashSet会调用该对象的hashCode()方法来得到该对象的哈希值,然后根据哈希值决定该对象在集合中的存储位置。如果两个元素equals()方法返回true,但是哈希值不等,仍然可以添加成功;反过来,如果两个对象哈希值相同但是equals()返回false,也仍然可以添加成功。
如果需要把某个类型的对象保存到
HashSet中,重写该类的hashCode()方法和equals()方法时,尽量保证如果equals()方法返回true,那么其哈希值也要相等。
由于HashSet的存取和查找都是依赖于哈希值,因此在存储可变对象时会有风险,如果修改HashSet集合中的对象,有可能导致该对象的哈希值变化,从而导致HashSet无法准确访问该对象。
HashSet底层实现是基于HashMap的,具体可参照HashMap的实现。
LinkedHashSet类
LinkedHashSet是HashSet的子类,内部使用了一个链表维护了元素的插入顺序,因此性能略低于HashSet,但是在迭代时有很好的性能。
TreeSet类
TreeSet是SortedSet接口的实现类,可以确保集合元素处于排序状态。支持两种排序方法:
- 自然排序:直接调用元素的compareTo方法比较元素之间的大小(实现了Comparable接口的对象),然后将集合元素按升序排列
- 定制排序:在构造
TreeSet实例时,提供一个Comparator对象用于对元素进行比较。
Set接口性能分析
HashSet的性能总是比TreeSet好,因为排序需要额外的开销。LinkedHashSet一般情况下比HashSet略慢,但是在遍历访问时,LinkedHashSet会更快。
List接口
List接口根据整数索引访问其中的元素。
ArrayList类和Vector类
相同点:
- 长度动态可变
- 内部用
Object[]数组实现 - 不指定初始容量时,默认为10;如果需要一次性添加大量元素,可使用
ensureCapacity(int minCapacity)方法,减少重分配的次数提高性能。
不同点:
Vector是线程安全的,而ArrayList不是线程安全的Vector的性能低于ArrayList
固定长度的List
Arrays.asList(Object... a)方法可以把一个数组或一些对象转换成一个List集合,但是返回的是Arrays.ArrayList的实例,其长度固定,只能遍历访问该集合里的元素,不可增加、删除。
Queue接口
- 用于模拟队列,是一个“先进先出”(FIFO)的容器。
PriorityQueue实现类
- 即数据结构中“优先队列”的实现
- 排序方式与
TreeSet一致
Deque接口与ArrayDeque类
Deque接口是Queue接口的子接口,表示一个双端队列- 该接口有一个实现类
ArrayDeque,用数组Object[]实现
LinkedList实现类
- 内部用链表的像是保存集合中的元素
- 随机访问性能价差,插入删除元素的性能较好
各种线性表的性能分析
List接口是一种线性表接口,其不同的实现在不同的应用场景中有性能差异
- 如果需要遍历集合元素,对于
ArrayList对象和Vector对象应该使用索引来访问;而对于LinkedList对象,应该采用迭代器来遍历 - 如果需要经常执行插入、删除操作,可考虑使用
LinkedList。 - 如果有多个线程需要同时访问
List集合中的元素,可考虑使用Collections将集合包装成线程安全的。