Java集合框架概述

集合框架与数组的对比及概述

  1. 集合和数组都是对多个数据进行存储操作的结构,简称Java容器

说明:此时的存储,主要指能存界面的存储,不涉及到持久化的存储(.txt,.jpg,.avi,数据库中)

  1. 数组在存储多个数据方面的特点
    • 一旦初始化后,其长度就确定了
    • 数组一旦定义好,他的数据类型也就确定了,我们只能操作指定类型的数据了
  2. 数组才存储多个数据方面的缺点
    • 一旦初始化后,其长度就不能再修改了
    • 数组中提供的方法非常有限,对于添加、删除、插入数据等操作,非常不便,同时效率也不高
    • 获取数组中实际元素的个数的需求,数组没有现成的属性或方法可用。(创建一个长度为100的数组,却只初始化了10个数据,这10个数据才是实际元素)
    • 数组存储的特点:有序,可重复。对于无序,不可重复的需求,无法满足。

集合中的方法可以弥补上述所有缺点。

集合框架

  • Java集合可分为Colection和Map两种体系

    • Collection接口:单列数据,定义了存储一组对象的方法的集合

      • List:元素有序,可重复的集合 --> 动态数组

        • ArrayList:作为List接口的主要实现类;线程不安全的,效率高;底层使用Object[] elementData存储

        • LinkedList:对于频繁的插入、删除操作,使用此类效率比ArrayList高;底层使用双向链表存储

        • Vector:作为List接口的古老实现类;线程安全的,效率低;底层使用Object[] elementData存储

      • Set:元素无序,不可重复的集合 --> 高中数学讲的集合

        • HashSet:作为Set接口的主要实现类;线程不安全的;可以存储null值

          • LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历,对于频繁的遍历操作,LinkedHashSet效率高于HashSet.
        • TreeSet:可以按照添加对象的指定属性,进行排序。

    • Map接口:双列数据,保存具有映射关系"ket-value对"的集合 --> 高中函数:y = f(x)

      • HashMap:作为Map的主要实现类;线程不安全的,效率高;存储null的key和value

        • LinkedHashMap:保证在遍历map元素时,可以按照添加的顺序实现遍历。原因:在原有的HashMap底层结构基础上,添加了一对指针,指向前一个和后一个元素。对于频繁的遍历操作,此类执行效率高于HashMap。
      • TreeMap:保证按照添加的key-value对进行排序,实现排序遍历。此时考虑key的自然排序或定制排序。底层使用红黑树

      • Hashtable:作为古老的实现类;线程安全的,效率低;不能存储null的key和value

        • Properties:常用来处理配置文件。key和value都是String类型

Collection接口中的常用方法

变量和类型 方法 描述
boolean add(E e) 确保此集合包含指定的元素(可选操作)。
boolean addAll(Collection<? extends E> c) 将指定集合中的所有元素添加到此集合中(可选操作)。
void clear() 从此集合中删除所有元素(可选操作)。
boolean contains(0bject o) 如果此collection包含指定的元素,则返回true 。
boolean containsAll(Collection<?> c) 如果此集合包含指定集合中的所有元素,则返回true 。
boolean equals(0bject o) 将指定对象与此集合进行比较以获得相等性。
int hashCode() 返回此集合的哈希码值。
boolean idEmpty() 如果此集合不包含任何元素,则返回true 。
Iterator iterator() 返回此集合中元素的迭代器。
boolean remove(Object o) 从此集合中移除指定元素的单个实例(如果存在)(可选操作)。
boolean removeAll(Collection<?> c) 删除此集合的所有元素,这些元素也包含在指定的集合中(可选操作)。
boolean retainAll(Collection<?> c) 仅保留此集合中包含在指定集合中的元素(可选操作)。
int size() 返回此集合中的元素数。
Object[] toArray() 返回包含此集合中所有元素的数组。
T[] toArray(T[] a) 返回一个包含此collection中所有元素的数组;返回数组的运行时类型是指定数组的运行时类型。

注:对自定义类型,如果需要调用contains、remove或者equals方法,必须重写自定义类型的equals方法,但hashCode()写不写都行,没有影响。IDEA中直接用Alt+Ins一键生成就好啦

更多方法详情请参阅JDK11 API文档

Iterator迭代器接口

  • Iterator对象成为迭代器(设计模式的一种),主要用于遍历Collection集合中的元素

  • GOF 《Design Patterns: Elements of Reusable Object-Oriented Software》(即后述《设计模式》一书),由 Erich Gamma、Richard Helm、Ralph Johnson 和 John Vlissides 合著(Addison-Wesley,1995)。这几位作者常被称为"四人组(Gang of Four)"。给迭代器模式的定义为:提供一种方法访问一个容器(container)对象中的各个元素,而又不需要暴露该对象的内部细节。**迭代器模式,就是为容器而生。**类似于“公交车上的售票员”、“火车上的乘务员”、“空姐”。
  • Collection接口继承了java.lang.Iteratheor接口,该接口有一个iterator()方法,那么所有实现了Collection接口的集合类都有一个iterator()方法,用于返回一个实现了Iterator接口的对象。

  • Iterator仅用于遍历集合,Iterator本身并不提供橙装对象的能力,所以当我们想创建一个Iterator对象时,则必须有一个被迭代的集合。

  • **集合对象每次调用iterator()方法都得到一个全新的迭代器对象,**默认游标都在集合的第一个元素之前。

Iterator接口的常用方法

变量和类型 方法 描述
default void forEachRemaining( consumer<? super E> action) 对每个剩余元素执行给定操作,直到处理完所有元素或操作引发异常。
boolean hasNext() 如果迭代具有更多元素,则返回true 。
E next( ) 返回迭代中的下一个元素。
default void remove( ) 从底层集合中移除此迭代器返回的最后一个元素(可选操作)。

使用Iterator遍历Collection

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
import java.util.ArrayList;
import java.util.Collection;
import java.util.Date;
import java.util.Iterator;

public class IteratorTest {
public static void main(String[] args) {
Collection coll = new ArrayList();
coll.add(123);
coll.add(456);
coll.add("张三");
coll.add(new Date());
coll.add(true);

Iterator iterator = coll.iterator();
//方式一:主要方式
while (iterator.hasNext()) {
System.out.println(iterator.next());
}
//方式二:不推荐
for (int i = 0; i < coll.size(); i++) {
System.out.println(iterator.next());
}
}
}

Iterator遍历集合的两种错误写法

错误方式一

这种写法只会输出偶数个元素,且会越界

1
2
3
4
5
6
7
8
9
10
11
12
13
14
@Test
public void errorTest01(){
Collection coll = new ArrayList();
coll.add(123);
coll.add(456);
coll.add("张三");
coll.add(new Date());
coll.add(true);

Iterator iterator = coll.iterator();
while (iterator.next()!=null){
System.out.println(iterator.next());
}
}

错误方式二

集合对象每次调用iterator()方法都得到一个全新的迭代器对象,默认游标都在集合的第一个元素之前。
while中的迭代器和Sout中的迭代器是两个不同的迭代器,所以此种写法会陷入死循环,一直输出第一个元素。

1
2
3
4
5
6
7
8
9
10
11
12
13
@Test
public void errorTest02(){
Collection coll = new ArrayList();
coll.add(123);
coll.add(456);
coll.add("张三");
coll.add(new Date());
coll.add(true);

while (coll.iterator().hasNext()){
System.out.println(coll.iterator().next());
}
}

Iterator迭代器remove()的使用

Iterator可以删除集合的元素,但是是遍历过程中通过迭代器对象的remove方法,不是集合对象的remove方法。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
@Test
public void removeTest(){
Collection coll = new ArrayList();
coll.add(123);
coll.add(456);
coll.add("张三");
coll.add(new Date());
coll.add(true);

Iterator iterator = coll.iterator();
while (iterator.hasNext()){
Object obj = iterator.next();
if("张三".equals(obj))
iterator.remove();
}

iterator=coll.iterator();
while (iterator.hasNext())
System.out.println(iterator.next());
}

如果还未调用next()或在上一次调用next方法之后已经调用了remove方法,再调用remove都会报IllegalStateException。

新特性foreach循环遍历集合或数组

  • Java 5.0 提供了foreach循环迭代访问Collection和数组。

  • 遍历操作不需获取Collection或数组的长度,无需使用索引访问元素。

  • 遍历集合的底层调用Iterator完成操作。

  • foreach还可以用来遍历数组。(以前写代码的时候,IDEA总会提示我,for循环可替换为增强for循环,其实就是foreach循环)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
@Test
public void ForTest(){
Collection coll = new ArrayList();
coll.add(123);
coll.add(456);
coll.add("张三");
coll.add(new Date());
coll.add(true);

for (Object obj: coll) {
System.out.println(obj);
}
System.out.println("**********************");
int[] nums = new int[]{15,64,48,35,79};
for (int n : nums) {
System.out.println(n);
}
}

思考题:以下代码输出结果是李四还是张三? 答:张三

1
2
3
4
5
6
7
8
9
@Test
public void test() {
String[] str = new String[]{"张三", "张三", "张三"};
for (String s : str)
s = "李四";

for (String s : str)
System.out.println(s);
}

之前说了,foreach的底层实现是调用Iterator完成操作
所以上述代码就等效于

1
2
3
4
5
6
7
8
9
10
11
12
@Test
public void test1(){
Collection coll = Arrays.asList("张三","张三","张三");
Iterator iterator = coll.iterator();
while (iterator.hasNext()){
Object s = iterator.next();
s = "李四";
}
iterator = coll.iterator();
while (iterator.hasNext())
System.out.println(iterator.next());
}

没有对原有数据进行操作,当然还是输出张三

Collection的子接口—List接口

  • 鉴于Java中数组用来存储数据的局限性,我们通常使用List替代数组

  • List集合类中元素有序,且可重复,集合中的每个元素都有其对应的顺序索引

  • List容器中的元素都对应一个整数型的序号记载其在容器中的位置,可以根据序号存取容器中的元素

  • JDK API中List接口的实现类有:ArrayList、LinkedList和Vector

List接口常用实现类的对比

  • List:元素有序,可重复的集合 --> 动态数组

    • ArrayList:作为List接口的主要实现类;线程不安全的,效率高;底层使用Object[] elementData存储

    • LinkedList:对于频繁的插入、删除操作,使用此类效率比ArrayList高;底层使用双向链表存储

    • Vector:作为List接口的古老实现类;线程安全的,效率低;底层使用Object[] elementData存储

面试题:比较ArrayList、LinkedList和Vector的异同?

  • 同:三个类都实现了List接口,存储数据的特点相同:存储有序的,可重复的数据

  • 异:见上

ArrayList源码分析

  • ArrayList是List接口的典型实现类、主要实现类

  • 本质上,ArrayList是对象引用的一个“变长”数组

JDK1.7情况下

ArrayList list = new ArrayList(); --> 底层创建了长度是10的Object[]数组elementData

list.add(123); --> elementData[0] = new Integer(123);

···

list.add(11); --> 如果此次的添加导致底层elementData数组容量不够,则扩容。

默认情况下,扩容为原来的容量的1.5倍,同时需要将原有数组中的数据复制到新的数组中。

结论:建议开发中使用带参的构造器:ArrayList list = new ArrayList(int capacity)

jdk 8中ArrayList的变化

ArrayList list = new ArrayList();

底层Object[] elementData初始化为{}.并没有创建长度为10的数组

1
2
3
4
5
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

list.add(123);

第一次调用add()时,底层才创建了长度10的数组,并将数据123添加到elementData[0]

···

后续的添加和扩容操作与jdk 7 无异。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
public boolean add(E e) {
ensureCapacityInternal(size + 1); // 首先确认容量够不够
elementData[size++] = e;
return true;
}

private void ensureCapacityInternal(int minCapacity) {
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}

private static int calculateCapacity(Object[] elementData, int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) { //当二者相等,则说明是第一次调用
return Math.max(DEFAULT_CAPACITY, minCapacity); //private static final int DEFAULT_CAPACITY = 10;
}
return minCapacity; //返回为10 此时才创建了长度为10的数组
}

private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1); //每次扩容为1.5倍
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity); //且将原有数组复制到扩容数组
}

小结:jdk7中的ArrayList的对象的创建类似于单例的饿汉式 饿汉式:单例模式的一种,不论是否使用,都会在一开始就创建对象。单例模式(Singleton Pattern)是 Java 中最简单的设计模式之一。这种类型的设计模式属于创建型模式,它提供了一种创建对象的最佳方式。这种模式涉及到一个单一的类,该类负责创建自己的对象,同时确保只有单个对象被创建。这个类提供了一种访问其唯一的对象的方式,可以直接访问,不需要实例化该类的对象。,而jdk8中的ArrayList的对象的创建类似于单例懒汉式 懒汉式:在使用时创建对象的,延迟了数组的创建,节省内存。

LinkedList源码分析

  • 对于频繁的插入或删除元素的操作,建议使用LinkedList类,效率较高

  • LinkedList:双向链表,内部没有声明数组,而是定义了Node类型的next和prev,用于记录前驱和后继。同时,定义内部类Node,作为LinkedList中保存数据的基本结构。

数据结构里都学过,这里就不再赘述啦。

1
2
3
4
5
6
7
8
9
10
11
private static class Node<E> {
E item;
Node<E> next;
Node<E> prev;

Node(Node<E> prev, E element, Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
}

Vector源码分析

  • Vector 是一个古老的集合,JDK1.0就有了。大多数操作与ArrayList相同,区别之处在于Vector是线程安全的。

  • 在各种list中,最好把ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList;Vector总是比ArrayList慢,所以尽量避免使用。

  • Vector的底层也是创建了一个长度为10的数组,在扩容方面,默认扩容为原来数组长度的2倍

就算我们需要保证线程安全,我们也是不会用Vector的,而是想办法让ArrayList变成线程安全的。说不定哪个版本就把Vector遗弃了

1
List list = Collections.synchronizedList(new ArrayList());

List接口中的常用方法

变量和类型 方法 描述
void add(int index,E element) 将指定元素插入此列表中的指定位置(可选操作)。
boolean addAll(int index, collection<? extends E> c) 将指定集合中的所有元素插入到指定位置的此列表中(可选操作)。
E get(int index) 返回此列表中指定位置的元素。
int indexOf(Object o) 返回此列表中第一次出现的指定元素的索引,如果此列表不包含该元素,则返回-1。
int lastIndexOf(Object o) 返回此列表中指定元素最后一次出现的索引,如果此列表不包含该元素,则返回-1。
E remove(int index) 删除此列表中指定位置的元素(可选操作)。
E set(int index, E element) 用指定的元素替换此列表中指定位置的元素(可选操作)。
List subList(int fromIndex, int toIndex) 返回指定的 fromIndex (包含)和 toIndex (不包括)之间的此列表部分的视图。

Collection的子接口—Set接口

  • Set接口是Collection的子接口,set接口没有提供额外的方法

  • Set 集合不允许包含相同的元素,如果试把两个相同的元素加入同一个Set 集合中,则添加操作失败。

  • Set 判断两个对象是否相同不是使用==运算符,而是根据equals()方法

Set接口实现类的对比

  • Set:元素无序,不可重复的集合 --> 高中数学讲的集合

    • HashSet:作为Set接口的主要实现类;线程不安全的;可以存储null值

      • LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历,对于频繁的遍历操作,LinkedHashSet效率高于HashSet.
    • TreeSet:可以按照添加对象的指定属性,进行排序。

Set的无序性与不可重复性的理解

  1. 无序性:不等于随机性。存储的数据在底层数组中并非按照数组索引的顺序添加,而是根据数据的哈希值决定的 --> 数据结构中的哈希表。

  2. 不可重复性:保证添加的元素按照equals()判断时,不能返回true. 即:相同的元素只能添加一个。

下面这段代码,每次的运行结果都是相同的,并不是随机产生的。

不过由于我们没有重写自定义Person类的equals()和hashCode()方法,所以Tom还是会输出两次

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
@Test
public void HashSetTest(){
Set set = new HashSet();
set.add(123);
set.add(456);
set.add("fgd");
set.add("book");
set.add(new Person("Tom",12));
set.add(new Person("Tom",12));
set.add(129);

for (Object obj : set) {
System.out.println(obj);
}
}


public class Person {
private String name;
private int age;

public Person(String name, int age) {
this.name = name;
this.age = age;
}

@Override
public String toString() {
return "Person{" +
"name='" + name + '\'' +
", age=" + age +
'}';
}
}

下面我来详细说明一下不可重复性(有数据结构的基础更容易懂哦)

我们向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值

此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置(即为:索引位置),判断数组此位置上是否已经有元素:

  • 如果此位置上没有其他元素,则元素a添加成功。 --> 情况1

  • 如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值:

    • 如果hash值不相同,则元素a添加成功。–> 情况2

    • 如果hash值相同,进而需要调用元素a所在类的equals()方法:

      • equals()返回true,元素a添加失败

      • equals()返回false,则元素a添加成功。–> 情况3

对于添加成功的情况2和情况3而言:元素a 与已经存在指定索引位置上数据以链表的方式存储。

在JDK7中,元素a放到数组中,指向原来的元素。

在JDK8中,原来的元素在数组中,指向元素a

具体应用场景可以看一下这篇文章的 试题C:直线

我们在重写equals()和hashCode()方法时,直接用IDEA默认的生成方法就行. (ALT+INS一键生成)

HashSet中元素的添加过程

  • HashSet是Set 接口的典型实现,大多数时候使用Set 集合时都使用这个实现类。

  • HashSet按Hash 算法来存储集合中的元素,因此具有很好的存取、查找、删除性能。

  • HashSet具有以下特点:不能保证元素的排列顺序

    • HashSet不是线程安全的
    • 可以将null添加到HashSet中
  • 底层也是数组,初始容量为16,当如果使用率超过0.75,(16*0.75=12)就会扩大容量为原来的2倍。(16扩容为32,依次为64,128…等)

  • HashSet 集合判断两个元素相等的标准:两个对象通过hashCode() 方法比较相等,并且两个对象的equals()方法返回值也相等。

  • 对于存放在Set容器中的对象,对应的类一定要重写equals()和hashCode(Object obj)方法,以实现对象相等规则。即:“相等的对象必须具有相等的散列码”。

  • HashSet底层:数组+链表的结构。

LinkedHashSet的使用

  • LinkedHashSet是HashSet的子类

  • LinkedHashSet根据元素的hashCode值来决定元素的存储位置,但它同时使用双向链表维护元素的次序,这使得元素看起来是以插入顺序保存的。

  • LinkedHashSet插入性能略低于HashSet,但在迭代访问Set里的全部元素时有很好的性能。(因为使用了双向链表,很容易找到前驱和后继)

  • LinkedHashSet不允许集合元素重复。

运行一下下面的代码,输出的时候保留了原有顺序(记得去Person类中重写equals()和hashCode()方法)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
@Test
public void LinkedHashSetTest(){
Set set = new LinkedHashSet();
set.add(123);
set.add(456);
set.add("moon");
set.add("dark");
set.add(new Person("Tom",12));
set.add(new Person("Tom",12));
set.add(129);

for (Object obj : set) {
System.out.println(obj);
}
}

TreeSet的自然排序

  • TreeSet是SortedSet接口的实现类,TreeSet可以确保集合元素处于排序状态。

  • TreeSet底层使用红黑树结构存储数据

  • 新增的方法如下:(了解即可)

变量和类型 方法 描述
E first() 返回此集合中当前的第一个(最低)元素。
E last() 返回此集合中当前的最后一个(最高)元素。
E lower(E e) 返回此集合中的最大元素严格小于给定元素,如果没有这样的元素,则 null 。
E higher(E e) 返回此集合中的最小元素严格大于给定元素,如果没有这样的元素,则 null 。
SortedSet subSet(E fromElement, E toElement) 返回此set的部分视图,其元素范围从 fromElement (含)到 toElement (独占)。
E remove(int index) 删除此列表中指定位置的元素(可选操作)。
  • TreeSet两种排序方法:自然排序和定制排序。默认情况下,TreeSet采用自然排序。

  • TreeSet和后面要讲的TreeMap采用红黑树的存储结构

  • 特点:有序,查询速度比List快

  • 自然排序:TreeSet会调用集合元素的compareTo(Object obj)方法来比较元素之间的大小关系,然后将集合元素按升序(默认情况)排列。

  • 如果试图把一个对象添加到TreeSet时,则该对象的类必须实现Comparable 接口

    • 实现Comparable 的类必须实现compareTo(Object obj)方法,两个对象即通过compareTo(Object obj)方法的返回值来比较大小。
  • Comparable 的典型实现:

    • BigDecimal、BigInteger以及所有的数值型对应的包装类:按它们对应的数值大小进行比较
    • Character:按字符的unicode值来进行比较
    • Boolean:true 对应的包装类实例大于false 对应的包装类实例
    • String:按字符串中字符的unicode 值进行比较
    • Date、Time:后边的时间、日期比前面的时间、日期大

下面代码的输出结果会自动升序排序

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
@Test
public void TreeSetTest01(){
TreeSet treeSet = new TreeSet();
treeSet.add(123);
treeSet.add(123);
treeSet.add(213);
treeSet.add(231);
treeSet.add(132);
treeSet.add(321);
treeSet.add(312);
for (Object i : treeSet) {
System.out.println(i);
}
System.out.println("*****************");
treeSet = new TreeSet();
treeSet.add("AA");
treeSet.add("AA");
treeSet.add("EE");
treeSet.add("DD");
treeSet.add("FF");
treeSet.add("CC");
treeSet.add("GG");
treeSet.add("BB");
for (Object o : treeSet) {
System.out.println(o);
}
}
  • 向TreeSet中添加元素时,只有第一个元素无须比较compareTo()方法,后面添加的所有元素都会调用compareTo()方法进行比较。

  • 因为只有相同类的两个实例才会比较大小,所以向TreeSet中添加的应该是同一个类的对象。

  • 对于TreeSet集合而言,它判断两个对象是否相等的唯一标准是:两个对象通过compareTo(Object obj)方法比较返回值。

  • 因为Treeset是红黑树结构,其主要使用的是在插入的时候根据你提供的比较规则来插入。所以只需要实现Coparable,Comparotor接口的比较函数就可以。并不需要重写hashCode()和equals()方法。

由于Tree提供了TreeSet​(Comparator<? super E> comparator)构造器,所以我们可以按照下面的方式写
下面的例子是先按照姓名排序,在按照id排序

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
@Test
public void TreeSetTest02() {
Comparator comparator = new Comparator() {
@Override
public int compare(Object o1, Object o2) {
if (o1 instanceof Student && o2 instanceof Student) {
Student s1 = (Student) o1;
Student s2 = (Student) o2;
int res = s1.getName().compareTo(s2.getName());
if (res == 0) {
return Integer.compare(s1.getId(), s2.getId());
} else return res;
} else throw new RuntimeException("输入数据类型不匹配");
}
};
TreeSet<Student> treeSet = new TreeSet<Student>(comparator);
treeSet.add(new Student("A张三",18));
treeSet.add(new Student("A张三",18));
treeSet.add(new Student("A张三",18));
treeSet.add(new Student("A张三",17));
treeSet.add(new Student("A张三",19));
treeSet.add(new Student("C张三",18));
treeSet.add(new Student("B张三",18));
treeSet.add(new Student("D张三",18));
for (Student stu : treeSet) {
System.out.println(stu);
}
/*
Student{name='A张三', id=17}
Student{name='A张三', id=18}
Student{name='A张三', id=19}
Student{name='B张三', id=18}
Student{name='C张三', id=18}
Student{name='D张三', id=18}
*/
}

public class Student {
private String name;
private int id;

public String getName() {
return name;
}

public void setName(String name) {
this.name = name;
}

public int getId() {
return id;
}

public void setId(int id) {
this.id = id;
}

public Student(String name, int id) {
this.name = name;
this.id = id;
}

@Override
public String toString() {
return "Student{" +
"name='" + name + '\'' +
", id=" + id +
'}';
}
}

当然我们也可以直接在所需排序的类中,实现Comparable接口,重写compareTo()方法,先按照姓名降序排序,再按照年龄降序排序

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
@Test
public void TreeSetTest03(){
TreeSet<Person> treeSet = new TreeSet<>();
treeSet.add(new Person("A张三",31));
treeSet.add(new Person("A张三",32));
treeSet.add(new Person("A张三",30));
treeSet.add(new Person("C张三",21));
treeSet.add(new Person("D张三",81));
treeSet.add(new Person("B张三",36));
for (Person p : treeSet) {
System.out.println(p);
}
}
/*
Person{name='D张三', age=81}
Person{name='C张三', age=21}
Person{name='B张三', age=36}
Person{name='A张三', age=32}
Person{name='A张三', age=31}
Person{name='A张三', age=30}
*/

public class Person implements Comparable {
private String name;
private int age;

public Person(String name, int age) {
this.name = name;
this.age = age;
}

public String getName() {
return name;
}

public void setName(String name) {
this.name = name;
}

public int getAge() {
return age;
}

public void setAge(int age) {
this.age = age;
}

@Override
public String toString() {
return "Person{" +
"name='" + name + '\'' +
", age=" + age +
'}';
}


@Override
public int compareTo(Object o) {
if (o instanceof Person) {
Person p = (Person) o;
int res = -this.getName().compareTo(p.getName());
if (res == 0) {
return -Integer.compare(this.getAge(), ((Person) o).getAge());
} else return res;
} else throw new RuntimeException("输入数据类型不匹配");
}
}

Map接口

Map接口及其多个实现类的对比

  • Map接口:双列数据,保存具有映射关系"ket-value对"的集合 --> 高中函数:y = f(x)

    • HashMap:作为Map的主要实现类;线程不安全的,效率高;存储null的key和value

      • LinkedHashMap:保证在遍历map元素时,可以按照添加的顺序实现遍历。原因:在原有的HashMap底层结构基础上,添加了一对指针,指向前一个和后一个元素。对于频繁的遍历操作,此类执行效率高于HashMap。
    • TreeMap:保证按照添加的key-value对进行排序,实现排序遍历。此时考虑key的自然排序或定制排序。底层使用红黑树

    • Hashtable:作为古老的实现类;线程安全的,效率低;不能存储null的key和value

      • Properties:常用来处理配置文件。key和value都是String类型

HashMap的底层结构:数组+链表(JDK7及之前)。数组+链表+红黑树(JDK8及之后)

Map中存储的key-value的特点

  • Map与Collection并列存在。用于保存具有映射关系的数据:key-value

  • Map中的key和value都可以是任何引用类型的数据

  • Map中的key:无序的、不可重复的,使用Set存储所有的key --> key所在的类要重写equals()和hashCode() (以HashMap为例)

  • Map中的value:无序的、可重复的,可以理解成使用Collection存储所有的value --> value所在的类要重写equals()

  • key和value之间存在单向一对一关系,即通过指定的key总能找到唯一的、确定的value

  • Map接口的常用实现类:HashMap、TreeMap、LinkedHashMap和Properties。其中,HashMap是Map接口使用频率最高的实现类

Map实现类之一:HashMap

  • HashMap是Map接口使用频率最高的实现类。

  • 允许使用null键和null值,与HashSet一样,不保证映射的顺序。

  • 所有的key构成的集合是Set:无序的、不可重复的。所以,key所在的类要重写:equals()和hashCode()

  • 所有的value构成的集合是Collection:无序的、可以重复的。所以,value所在的类要重写:equals()

  • 一个key-value构成一个entry

  • 所有的entry构成的集合是Set:无序的、不可重复的

  • HashMap判断两个key相等的标准是:两个key通过equals()方法返回true,hashCode值也相等。

  • HashMap判断两个value相等的标准是:两个value 通过equals()方法返回true。

  • JDK 7及以前版本:HashMap是数组+链表结构(即为链地址法)

  • JDK 8版本发布以后:HashMap是数组+链表+红黑树实现。

HashMap在JDK7中的底层实现原理

1
HashMap map = new HashMap();
  • 在实例化以后,底层创建了长度是16的一维数组Entry[] table。
1
2
3
map.put(xxx, xxx);
//执行N次put操作
map.put(key1,value1);
  • 首先,调用key1所在类的hashCode()计算key1哈希值,此哈希值经过某种算法计算以后,得到在Entry数组中的存放位置。

  • 如果此位置上的数据为空,此时的key1-value1添加成功。 ----情况1

  • 如果此位置上的数据不为空,(意味着此位置上存在一个或多个数据(以链表形式存在)),比较key1和已经存在的一个或多个数据的哈希值:

    • 如果key1的哈希值与已经存在的数据的哈希值都不相同,此时key1-value1添加成功。----情况2

    • 如果key1的哈希值和已经存在的某一个数据(key2-value2)的哈希值相同,继续比较:调用key1所在类的equals(key2)方法,比较:

      • 如果equals()返回false:此时key1-value1添加成功。----情况3

      • 如果equals()返回true:使用value1替换value2。(新的替换旧的)

在不断的添加过程中,会涉及到扩容问题,当超出临界值(且要存放的位置非空)时,扩容。默认的扩容方式:扩容为原来容量的2倍,并将原有的数据复制过来。

HashMap的扩容:

当HashMap中的元素越来越多的时候,发生哈希冲突的几率也就越来越高,因为数组的长度是固定的。所以为了提高查询的效率就要对HashMap的数组进行扩容,而在HashMap数组扩容之后,最消耗性能的点就出现了:原数组中的数据必须重新计算其在新数组中的位置,并放进去,这就是resize。

那么HashMap什么时候进行扩容呢?

当HashMap中的元素个数超过数组大小四分之三时(loadFactor的默认值(DEFAULT_LOAD_FACTOR)为0.75,这是一个折中的取值。),就会进行数组扩容,也就是说,默认情况下,数组大小(DEFAULT_INITIAL_CAPACITY)为16,那么当HashMap中元素个数超过160.75=12(这个值就是代码中的threshold值,也叫做临界值)的时候,就把数组的大小扩展为216=32,即扩大一倍,然后重新计算每个元素在数组中的位置,而这是一个非常消耗性能的操作,所以如果我们已经预知HashMap中元素的个数,那么预设元素的个数能够有效的提高HashMap的性能。

HashMap在JDK8中的底层实现原理

jdk8 相较于jdk7在底层实现方面的不同:

  1. new HashMap():底层没有创建一个长度为16的数组

  2. jdk 8底层的数组是:Node[],而非Entry[]

  3. 首次调用put()方法时,底层创建长度为16的数组

  4. jdk7底层结构只有:数组+链表。jdk8中底层结构:数组+链表+红黑树。

  5. 当数组的某一个索引位置上的元素以链表形式存在的数据个数 > 8 且当前数组的长度 > 64时,此时此索引位置上的所数据改为使用红黑树存储。

LinkedHashMap的底层实现原理(了解)

  • LinkedHashMap是HashMap的子类

  • 在HashMap存储结构的基础上,使用了一对双向链表来记录添加元素的顺序

  • 与LinkedHashSet类似,LinkedHashMap可以维护Map 的迭代顺序:迭代顺序与Key-Value 对的插入顺序一致

  • HashMap中的内部类:Node

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;

Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}

public final K getKey() { return key; }
public final V getValue() { return value; }
public final String toString() { return key + "=" + value; }

public final int hashCode() {
return Objects.hashCode(key) ^ Objects.hashCode(value);
}

public final V setValue(V newValue) {
V oldValue = value;
value = newValue;
return oldValue;
}

public final boolean equals(Object o) {
if (o == this)
return true;
if (o instanceof Map.Entry) {
Map.Entry<?,?> e = (Map.Entry<?,?>)o;
if (Objects.equals(key, e.getKey()) &&
Objects.equals(value, e.getValue()))
return true;
}
return false;
}
}
  • LinkedHashMap中的内部类:Entry
1
2
3
4
5
6
static class Entry<K,V> extends HashMap.Node<K,V> {
Entry<K,V> before, after; //有前驱和后继来记录添加的元素顺序
Entry(int hash, K key, V value, Node<K,V> next) {
super(hash, key, value, next);
}
}

Map中的常用方法

参数类型
K - 此映射维护的密钥类型
V - 映射值的类型

变量和类型 方法 描述
V put(K key, V value) 将指定的值与此映射中的指定键相关联(可选操作)。
void putAll(Map<? extends K,? extends V> m) 将指定映射中的所有映射复制到此映射(可选操作)。
V remove(Object key) 如果存在,则从该映射中移除键的映射(可选操作)。
boolean containsKey(Object key) 如果此映射包含指定键的映射,则返回 true 。
boolean containsValue(Object value) 如果此映射将一个或多个键映射到指定值,则返回 true 。
void clear() 从此映射中删除所有映射(可选操作)。
int size() 返回此映射中键 - 值映射的数量。
boolean isEmpty() 如果此映射不包含键 - 值映射,则返回 true 。
Set keySet() 返回此映射中包含的键的Set视图。
boolean equals(Object o) 将指定对象与此映射进行比较以获得相等性。
Set> entrySet() 返回此映射中包含的映射的Set视图。
V get(Object key) 返回指定键映射到的值,如果此映射不包含键的映射,则返回 null 。
Collection values() 返回此映射中包含的值的Collection视图。

HashMap的遍历

  1. 遍历所有的key集:keySet()

keySet()可以返回此映射中包含的键的Set视图。

利用Set的迭代器,可以轻松遍历所有的key集

1
2
3
4
5
6
7
8
9
10
11
12
@Test
public void test01(){
HashMap map = new HashMap();
map.put(1, 2);
map.put("张三", 18);
map.put("张三", 81);
map.put("李四", 28);
Set set = map.keySet();
for (Object o : set) {
System.out.println(o);
}
}
  1. 遍历所有的value集:values()

values()可以返回此映射中包含的值的Collection视图。

利用Collection的迭代器,可以轻松遍历所有的value集

1
2
3
4
5
6
7
8
9
10
11
12
@Test
public void test02() {
HashMap map = new HashMap();
map.put(1, 2);
map.put("张三", 18);
map.put("张三", 81);
map.put("李四", 28);
Collection values = map.values();
for (Object value : values) {
System.out.println(value);
}
}
  1. 遍历所有的key-values
  • 方式一:

keySet()可以返回此映射中包含的键的Set视图,而get​(Object key)可以返回指定键映射到的值。

利用这两个方法可以轻松遍历所有的key-value

1
2
3
4
5
6
7
8
9
10
11
12
13
@Test
public void test03() {
HashMap map = new HashMap();
map.put(1, 2);
map.put("张三", 18);
map.put("张三", 81);
map.put("李四", 28);
Set set = map.keySet();
for (Object key : set) {
Object value = map.get(key);
System.out.println(key + "===" + value);
}
}
  • 方式二:

Set<Map.Entry<K,​V>> entrySet() 返回此映射中包含的映射的Set视图。

Set中的每一个元素都是key-value键值对

而Map.Entry中又提供了getKey()和getValue()分别返回对应的键和值

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
@Test
public void test04() {
HashMap map = new HashMap();
map.put(1, 2);
map.put("张三", 18);
map.put("张三", 81);
map.put("李四", 28);
Set set = map.entrySet();
for (Object kv : set) {
Map.Entry entry = (Map.Entry) kv;
Object key = entry.getKey();
Object value = entry.getValue();
System.out.println(key + "===" + value);
}
}

TreeMap两种添加方式的使用

  • TreeMap存储Key-Value 对时,需要根据key-value对进行排序。TreeMap可以保证所有的Key-Value 对处于有序状态。

  • TreeSet底层使用红黑树结构存储数据

  • TreeMap的Key的排序:

    • 自然排序:TreeMap的所有的Key 必须实现Comparable接口,而且所有的Key应该是同一个类的对象,否则将会抛出ClasssCastException

    • 定制排序:创建TreeMap时,传入一个Comparator对象,该对象负责对TreeMap中的所有key进行排序。此时不需要Map的Key实现Comparable接口。(言外之意就是两种方法二选一,跟之前的TreeSet的写法相同。)

  • TreeMap判断两个key相等的标准:两个key通过compareTo()方法或者compare()方法返回0(不需要重写equals方法)。

下面的例子是key实现Comparable接口,按照姓名升序排序,如果姓名相同,则按照age升序排序

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
@Test
public void test05() {
TreeMap treeMap = new TreeMap<Student, Integer>();
treeMap.put(new Student("A张三", 18), 23);
treeMap.put(new Student("C张三", 16), 32);
treeMap.put(new Student("E张三", 15), 97);
treeMap.put(new Student("D张三", 19), 51);
treeMap.put(new Student("B张三", 15), 15);
treeMap.put(new Student("E张三", 29), 97);
treeMap.put(new Student("E张三", 20), 97);

Set set = treeMap.keySet();
for (Object stu : set) {
Student s = (Student) stu;
System.out.println(s);
}
}

//Student类
public class Student implements Comparable{
private String name;
private int age;

public Student() {
}

public Student(String name, int age) {
this.name = name;
this.age = age;
}

public String getName() {
return name;
}

public void setName(String name) {
this.name = name;
}

public int getAge() {
return age;
}

public void setAge(int age) {
this.age = age;
}

@Override
public String toString() {
return "Student{" +
"name='" + name + '\'' +
", age=" + age +
'}';
}

@Override
public int compareTo(Object o) {
if(o instanceof Student){
Student stu = (Student) o;
int res = this.getName().compareTo(stu.getName());
if(res == 0){
return Integer.compare(this.getAge(),stu.getAge());
}else return res;
}else throw new RuntimeException("输入数据类型不匹配");
}
}

下面的例子是按照name降序排序,name相同则按照id降序排序

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
@Test
public void test06() {
TreeMap treeMap = new TreeMap<Person, Integer>(new Comparator<Person>() {
@Override
public int compare(Person o1, Person o2) {
int res = -o1.getName().compareTo(o2.getName());
if(res==0){
return Integer.compare(o1.getId(),o2.getId());
}else return res;
}
});
treeMap.put(new Person("A张三", 18), 23);
treeMap.put(new Person("C张三", 16), 32);
treeMap.put(new Person("E张三", 15), 97);
treeMap.put(new Person("D张三", 19), 51);
treeMap.put(new Person("B张三", 15), 15);
treeMap.put(new Person("E张三", 20), 97);
treeMap.put(new Person("E张三", 17), 97);

Set set = treeMap.keySet();
for (Object person : set) {
Person p = (Person) person;
System.out.println(p);
}
}

//Perosn类
public class Person {
private String name;
private int id;

public String getName() {
return name;
}

public void setName(String name) {
this.name = name;
}

public int getId() {
return id;
}

public void setId(int id) {
this.id = id;
}

public Person() {
}

public Person(String name, int id) {
this.name = name;
this.id = id;
}

@Override
public String toString() {
return "Person{" +
"name='" + name + '\'' +
", id=" + id +
'}';
}
}

Hashtable

  • Hashtable是个古老的Map 实现类,JDK1.0就提供了。不同于HashMap,Hashtable是线程安全的。

  • Hashtable实现原理和HashMap相同,功能相同。底层都使用哈希表结构,查询速度快,很多情况下可以互用。

  • 与HashMap不同,Hashtable不允许使用null 作为key和value

  • 与HashMap一样,Hashtable也不能保证其中Key-Value 对的顺序

  • Hashtable判断两个key相等、两个value相等的标准,与HashMap一致。

Properties处理属性文件

  • Properties 类是Hashtable的子类,该对象用于处理属性文件

  • 由于属性文件里的key、value都是字符串类型,所以Properties里的key和value都是字符串类型

  • 存取数据时,建议使用setProperty(String key,Stringvalue)方法和getProperty(String key)方法

新建一个test.properties文件,并写入以下内容,注意不要加空格,直接顶着等号写就行。

1
2
name=Kyle
password=!@#@$%Fga8

下面用Properties读取配置文件中的信息

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
//注:此方法不能用单元测试类,只能写在主函数里
public static void main(String[] args) {
FileInputStream fil = null;
try {
Properties pro = new Properties();
fil = new FileInputStream("test.properties");
pro.load(fil);
String name = pro.getProperty("name");
String password = pro.getProperty("password");
System.out.println("name = "+name+"\npassword = "+password);
} catch (IOException e) {
e.printStackTrace();
} finally {
if(fil!=null){
try {
fil.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
}

Collections工具类

  • Collections 是一个操作Set、List和Map 等集合的工具类

  • Collections中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作,还提供了对集合对象设置不可变、对集合对象实现同步控制等方法

P.S:操作数组的工具类:Arrays

Collections工具类常用方法

变量和类型 方法 描述
static void shuffle(List<?> list) 使用默认的随机源随机置换指定的列表。
static void reverse(List<?> list) 反转指定列表中元素的顺序。
static > void sort(List list) 根据其元素的natural ordering ,将指定列表按升序排序。
static void sort(List list, Comparator<? super T> c) 根据指定比较器引发的顺序对指定列表进行排序。
static void swap(List<?> list, int i, int j) 交换指定列表中指定位置的元素。
static > T max(Collection<? extends T> coll) 根据元素的 自然顺序返回给定集合的最大元素。
static T max(Collection<? extends T> coll, Comparator<? super T> comp) 根据指定比较器引发的顺序返回给定集合的最大元素。
static > T min(Collection<? extends T> coll) 根据元素的 自然顺序返回给定集合的最小元素。
static T min(Collection<? extends T> coll, Comparator<? super T> comp) 根据指定比较器引发的顺序返回给定集合的最小元素。
static int frequency(Collection<?> c, Object o) 返回指定集合中等于指定对象的元素数。
static void copy(List<? super T> dest, List<? extends T> src) 将一个列表中的所有元素复制到另一个列表中。
static boolean replaceAll(List list, T oldVal, T newVal) 用列表替换列表中所有出现的指定值。