一、集合与数组
数组(可以存储基本数据类型)是用来存现对象的一种容器,但是数组的长度固定,不适合在对象数量未知的情况下使用。
集合(只能存储对象,对象类型可以不一样)的长度可变,可在多数情况下使用。
二、层次关系
如图所示:图中,实线边框的是实现类,折线边框的是抽象类,而点线边框的是接口
Collection 接口是集合类的根接口,Java 中没有提供这个接口的直接的实现类。但是却让其被继承产生了两个接口,就是 Set 和 List。Set 中不能包含重复的元素。List 是一个有序的集合,可以包含重复的元素,提供了按索引访问的方式。
Map 是 Java.util 包中的另一个接口,它和 Collection 接口没有关系,是相互独立的,但是都属于集合类的一部分。Map 包含了 key-value 对。Map 不能包含重复的 key,但是可以包含相同的 value。
Iterator,所有的集合类,都实现了 Iterator 接口,这是一个用于遍历集合中元素的接口,主要包含以下三种方法:
- hasNext() 是否还有下一个元素。
- next() 返回下一个元素。
- remove() 删除当前元素。
三、几种重要的接口和类简介
1、List(有序、可重复)
List 里存放的对象是有序的,同时也是可以重复的,List 关注的是索引,拥有一系列和索引相关的方法,查询速度快。因为往 list 集合里插入或删除数据时,会伴随着后面数据的移动,所有插入删除数据速度慢。
2、Set(无序、不能重复)
Set 里存放的对象是无序,不能重复的,集合中的对象不按特定的方式排序,只是简单地把对象加入集合中。
3、Map(键值对、键唯一、值不唯一)
Map 集合中存储的是键值对,键不能重复,值可以重复。根据键得到值,对 map 集合遍历时先得到键的 set 集合,对 set 集合进行遍历,得到相应的值。
对比如下:
是否有序 | 是否允许元素重复 | ||
---|---|---|---|
Collection | 否 | 是 | |
List | 是 | 是 | |
Set | AbstractSet | 否 | 否 |
HashSet | 否 | 否 | |
TreeSet | 是(用二叉排序树) | 否 | |
Map | AbstractMap | 否 | 使用 key-value 来映射和存储数据,key 必须唯一,value 可以重复 |
HashMap | 否 | 使用 key-value 来映射和存储数据,key 必须唯一,value 可以重复 | |
TreeMap | 是(用二叉排序树) | 使用 key-value 来映射和存储数据,key 必须唯一,value 可以重复 |
四、遍历
在类集中提供了以下四种的常见输出方式:
Iterator:迭代输出,是使用最多的输出方式。
ListIterator:是 Iterator 的子接口,专门用于输出 List 中的内容。
foreach 输出:JDK1.5 之后提供的新功能,可以输出数组或集合。
for 循环
代码示例如下:
for 的形式:for(int i=0;i<arr.size();i++){...}
foreach 的形式: for(int i:arr){...}
iterator 的形式:
|
|
五、ArrayList 和 LinkedList
ArrayList 和 LinkedList 在用法上没有区别,但是在功能上还是有区别的。LinkedList 经常用在增删
操作较多而查询操作很少的情况下,ArrayList 则相反。
六、Map 集合
实现类:HashMap、Hashtable、LinkedHashMap 和 TreeMap
HashMap
HashMap 是最常用的 Map,它根据键的 HashCode 值存储数据,根据键可以直接获取它的值,具有很快的访问速度,遍历时,取得数据的顺序是完全随机的。因为键对象不可以重复,所以 HashMap 最多只允许一条记录的键为 Null,允许多条记录的值为 Null,是非同步的
Hashtable
Hashtable 与 HashMap 类似,是 HashMap 的线程安全版,它支持线程的同步,即任一时刻只有一个线程能写 Hashtable,因此也导致了 Hashtale 在写入时会比较慢,它继承自 Dictionary 类,不同的是它不允许记录的键或者值为 null,同时效率较低。
ConcurrentHashMap
线程安全,并且锁分离。ConcurrentHashMap 内部使用段 (Segment) 来表示这些不同的部分,每个段其实就是一个小的 hash table,它们有自己的锁。只要多个修改操作发生在不同的段上,它们就可以并发进行。
LinkedHashMap
LinkedHashMap 保存了记录的插入顺序,在用 Iteraor 遍历 LinkedHashMap 时,先得到的记录肯定是先插入的,在遍历的时候会比 HashMap 慢,有 HashMap 的全部特性。
TreeMap
TreeMap 实现 SortMap 接口,能够把它保存的记录根据键排序,默认是按键值的升序排序(自然顺序),也可以指定排序的比较器,当用 Iterator 遍历 TreeMap 时,得到的记录是排过序的。不允许 key 值为空,非同步的;
map 的遍历
第一种:KeySet()
将 Map 中所有的键存入到 set 集合中。因为 set 具备迭代器。所有可以迭代方式取出所有的键,再根据 get 方法。获取每一个键对应的值。 keySet(): 迭代后只能通过 get() 取 key 。
取到的结果会乱序,是因为取得数据行主键的时候,使用了 HashMap.keySet() 方法,而这个方法返回的 Set 结果,里面的数据是乱序排放的。
典型用法如下:
|
|
第二种:entrySet()
|
|
推荐使用第二种方式,即 entrySet() 方法,效率较高。
对于 keySet 其实是遍历了 2 次,一次是转为 iterator,一次就是从 HashMap 中取出 key 所对于的 value。而 entryset 只是遍历了第一次,它把 key 和 value 都放到了 entry 中,所以快了。两种遍历的遍历时间相差还是很明显的。
七、主要实现类区别小结
Vector 和 ArrayList
- vector 是线程同步的,所以它也是线程安全的,而 arraylist 是线程异步的,是不安全的。如果不考虑到线程的安全因素,一般用 arraylist 效率比较高。
- 如果集合中的元素的数目大于目前集合数组的长度时,vector 增长率为目前数组长度的 100%,而 arraylist 增长率为目前数组长度的 50%。如果在集合中使用数据量比较大的数据,用 vector 有一定的优势。
- 如果查找一个指定位置的数据,vector 和 arraylist 使用的时间是相同的,如果频繁的访问数据,这个时候使用 vector 和 arraylist 都可以。而如果移动一个指定位置会导致后面的元素都发生移动,这个时候就应该考虑到使用 linklist, 因为它移动一个指定位置的数据时其它元素不移动。
ArrayList 和 Vector 是采用数组方式存储数据,此数组元素数大于实际存储的数据以便增加和插入元素,都允许直接序号索引元素,但是插入数据要涉及到数组元素移动等内存操作,所以索引数据快,插入数据慢,Vector 由于使用了 synchronized 方法(线程安全)所以性能上比 ArrayList 要差,LinkedList 使用双向链表实现存储,按序号索引数据需要进行向前或向后遍历,但是插入数据时只需要记录本项的前后项即可,所以插入数度较快。
arraylist 和 linkedlist
- ArrayList 是实现了基于动态数组的数据结构,LinkedList 基于链表的数据结构。
- 对于随机访问 get 和 set,ArrayList 觉得优于 LinkedList,因为 LinkedList 要移动指针。
- 对于新增和删除操作 add 和 remove,LinedList 比较占优势,因为 ArrayList 要移动数据。 这一点要看实际情况的。若只对单条数据插入或删除,ArrayList 的速度反而优于 LinkedList。但若是批量随机的插入删除数据,LinkedList 的速度大大优于 ArrayList. 因为 ArrayList 每插入一条数据,要移动插入点及之后的所有数据。
HashMap 与 TreeMap
- HashMap 通过 hashcode 对其内容进行快速查找,而 TreeMap 中所有的元素都保持着某种固定的顺序,如果你需要得到一个有序的结果你就应该使用 TreeMap(HashMap 中元素的排列顺序是不固定的)。
- 在 Map 中插入、删除和定位元素,HashMap 是最好的选择。但如果您要按自然顺序或自定义顺序遍历键,那么 TreeMap 会更好。使用 HashMap 要求添加的键类明确定义了 hashCode() 和 equals() 的实现。
两个 map 中的元素一样,但顺序不一样,导致 hashCode() 不一样。
同样做测试:
在 HashMap 中,同样的值的 map, 顺序不同,equals 时,false;
而在 treeMap 中,同样的值的 map, 顺序不同, equals 时,true,说明,treeMap 在 equals() 时是整理了顺序了的。
HashTable 与 HashMap
- 同步性: Hashtable 是线程安全的,也就是说是同步的,而 HashMap 是线程序不安全的,不是同步的。
- HashMap 允许存在一个为 null 的 key,多个为 null 的 value 。
- hashtable 的 key 和 value 都不允许为 null。