Java 集合框架面试题

发布日期: 2025-03-06

更新日期: 2025-03-20

文章字数: 2.9k

阅读时长: 12 分

阅读次数:

Java集合框架详解与面试题分析

在Java编程中，集合框架是最常用的API之一，它提供了一系列接口和类来存储、操作和处理对象组。本文将深入探讨Java集合框架的核心概念、常用实现类以及面试中的常见问题。

集合框架概述

什么是Java集合框架？

Java集合框架是一个用于表示和操作集合的统一架构，它实现了一系列接口和类，使得集合的使用变得简单高效。Java集合框架主要包括以下几个部分：

接口（Interfaces）：代表集合的抽象数据类型，如List、Set、Map等
实现类（Implementations）：接口的具体实现，如ArrayList、LinkedList、HashSet、HashMap等
算法（Algorithms）：对集合进行操作的方法，如排序、搜索等

集合框架层次结构

java.util.Collection[I]
	java.util.List[I]
		java.util.ArrayList[C]
		java.util.LinkedList[C]
		java.util.Vector[C]  //线程安全
			java.util.Stack[C]  //线程安全
			
	java.util.Set[I]
		java.util.HashSet[C]
		java.util.SortedSet[I]
			java.util.TreeSet[C]
			
	java.util.Queue[I]
		java.util.Deque[I]
		java.util.PriorityQueue[C]
		
java.util.Map[I]
	java.util.SortedMap[I]
		java.util.TreeMap[C]
		
	java.util.Hashtable[C]  //线程安全
	java.util.HashMap[C]
	java.util.LinkedHashMap[C]
	java.util.WeakHashMap[C]

--
[I]:接口
[C]:类

核心接口详解

Collection接口

Collection是集合层次结构的根接口，它提供了所有集合都应该实现的基本操作。

public interface Collection<E> extends Iterable<E> {
    // 基本操作
    boolean add(E e);
    boolean remove(Object o);
    boolean contains(Object o);
    int size();
    boolean isEmpty();
    void clear();
    
    // 批量操作
    boolean addAll(Collection<? extends E> c);
    boolean removeAll(Collection<?> c);
    boolean retainAll(Collection<?> c);
    boolean containsAll(Collection<?> c);
    
    // 数组操作
    Object[] toArray();
    <T> T[] toArray(T[] a);
    
    // 迭代器
    Iterator<E> iterator();
}

List接口

List是有序集合，允许重复元素，用户可以通过索引访问元素。

public interface List<E> extends Collection<E> {
    // 位置访问操作
    E get(int index);
    E set(int index, E element);
    void add(int index, E element);
    E remove(int index);
    
    // 搜索操作
    int indexOf(Object o);
    int lastIndexOf(Object o);
    
    // 列表迭代器
    ListIterator<E> listIterator();
    ListIterator<E> listIterator(int index);
    
    // 视图
    List<E> subList(int fromIndex, int toIndex);
}

Set接口

Set是不允许重复元素的集合。

public interface Set<E> extends Collection<E> {
    // 继承自Collection的所有方法
}

Map接口

Map是键值对映射，不允许重复的键。

public interface Map<K, V> {
    // 基本操作
    V put(K key, V value);
    V get(Object key);
    V remove(Object key);
    boolean containsKey(Object key);
    boolean containsValue(Object value);
    int size();
    boolean isEmpty();
    void clear();
    
    // 批量操作
    void putAll(Map<? extends K, ? extends V> m);
    
    // 视图
    Set<K> keySet();
    Collection<V> values();
    Set<Map.Entry<K, V>> entrySet();
    
    // 内部接口
    interface Entry<K, V> {
        K getKey();
        V getValue();
        V setValue(V value);
    }
}

常用实现类详解

ArrayList

ArrayList是基于动态数组实现的List接口，支持随机访问。

特点：

基于数组实现，支持随机访问，访问元素的时间复杂度为O(1)
插入和删除元素的时间复杂度为O(n)
初始容量为10，每次扩容为原来的1.5倍
非线程安全

适用场景：

频繁访问元素
很少插入和删除元素
需要根据索引访问元素

List<String> arrayList = new ArrayList<>();
arrayList.add("Java");
arrayList.add("Python");
arrayList.add("C++");
System.out.println(arrayList.get(1)); // 输出: Python

LinkedList

LinkedList是基于双向链表实现的List接口，支持高效的插入和删除操作。

特点：

基于双向链表实现
插入和删除元素的时间复杂度为O(1)（如果已知位置）
访问元素的时间复杂度为O(n)
非线程安全

适用场景：

频繁插入和删除元素
实现栈、队列等数据结构

LinkedList<String> linkedList = new LinkedList<>();
linkedList.add("Java");
linkedList.addFirst("Python"); // 在头部添加元素
linkedList.addLast("C++");    // 在尾部添加元素
System.out.println(linkedList); // 输出: [Python, Java, C++]

HashSet

HashSet是基于HashMap实现的Set接口，不允许重复元素。

特点：

基于HashMap实现（元素作为HashMap的键，值为一个固定的Object对象）
不保证元素的顺序
允许使用null元素
基本操作的时间复杂度为O(1)
非线程安全

适用场景：

需要去重
不关心元素顺序

Set<String> hashSet = new HashSet<>();
hashSet.add("Java");
hashSet.add("Python");
hashSet.add("Java"); // 重复元素不会被添加
System.out.println(hashSet.size()); // 输出: 2

TreeSet

TreeSet是基于TreeMap实现的Set接口，可以对元素进行排序。

特点：

基于红黑树实现
元素按照自然顺序或指定的比较器排序
基本操作的时间复杂度为O(log n)
非线程安全

适用场景：

需要元素保持排序状态
需要按照自定义规则排序

TreeSet<String> treeSet = new TreeSet<>();
treeSet.add("Java");
treeSet.add("Python");
treeSet.add("C++");
System.out.println(treeSet); // 输出: [C++, Java, Python]（按字母顺序排序）

HashMap

HashMap是基于哈希表实现的Map接口，允许null键和null值。

特点：

基于哈希表实现（数组+链表+红黑树）
JDK 1.8后，当链表长度超过8时，会转换为红黑树
不保证元素的顺序
基本操作的时间复杂度为O(1)
非线程安全

适用场景：

需要键值对映射
需要高效的查找、插入和删除操作

Map<String, Integer> hashMap = new HashMap<>();
hashMap.put("Java", 1);
hashMap.put("Python", 2);
hashMap.put("C++", 3);
System.out.println(hashMap.get("Python")); // 输出: 2

TreeMap

TreeMap是基于红黑树实现的Map接口，可以对键进行排序。

特点：

基于红黑树实现
键按照自然顺序或指定的比较器排序
基本操作的时间复杂度为O(log n)
非线程安全

适用场景：

需要键保持排序状态
需要按照自定义规则排序

TreeMap<String, Integer> treeMap = new TreeMap<>();
treeMap.put("Java", 1);
treeMap.put("Python", 2);
treeMap.put("C++", 3);
System.out.println(treeMap.keySet()); // 输出: [C++, Java, Python]（按键的字母顺序排序）

集合类的性能对比

时间复杂度对比

集合类	添加	删除	查找	遍历
ArrayList	O(1)*	O(n)	O(1)	O(n)
LinkedList	O(1)	O(1)**	O(n)	O(n)
HashSet	O(1)	O(1)	O(1)	O(n)
TreeSet	O(log n)	O(log n)	O(log n)	O(n)
HashMap	O(1)	O(1)	O(1)	O(n)
TreeMap	O(log n)	O(log n)	O(log n)	O(n)

*: 添加到末尾时为O(1)，添加到中间需要移动元素，为O(n)
**: 如果已知位置为O(1)，否则需要先查找位置，为O(n)

并发容器详解

CopyOnWriteArrayList

适用于读多写少的并发场景，通过写时复制实现线程安全。

实现原理：

所有修改操作（add/set/remove）都会复制底层数组
保证遍历操作的迭代器不会抛出ConcurrentModificationException

CopyOnWriteArrayList<String> cowList = new CopyOnWriteArrayList<>();
cowList.add("Java");
// 遍历时使用快照
for (String s : cowList) { 
    System.out.println(s);
}

ConcurrentHashMap

JDK1.8采用CAS+synchronized实现高并发：

数组+链表/红黑树结构
Node节点使用volatile保证可见性
并发控制使用synchronized和CAS

ConcurrentHashMap<String, Integer> concurrentMap = new ConcurrentHashMap<>();
concurrentMap.put("Java", 1);
concurrentMap.computeIfAbsent("Python", k -> 2);

集合工具类

Collections工具类

常用操作方法：

List<Integer> list = Arrays.asList(3,1,4,2);
Collections.sort(list); // 排序
Collections.reverse(list); // 反转
Collections.shuffle(list); // 随机打乱
Collections.synchronizedList(list); // 获取同步列表

Arrays工具类

数组操作示例：

int[] arr = {3,1,4,2};
Arrays.sort(arr); // 数组排序
int index = Arrays.binarySearch(arr, 4); // 二分查找
int[] copy = Arrays.copyOf(arr, arr.length); // 数组复制

集合工具类高级用法

Collections进阶技巧

创建不可修改集合：

List<String> unmodifiableList = Collections.unmodifiableList(new ArrayList<>(Arrays.asList("Java", "Python")));
unmodifiableList.add("C++"); // 抛出UnsupportedOperationException

自定义排序（按字符串长度）：

List<String> languages = new ArrayList<>(Arrays.asList("Java", "Python", "C"));
Collections.sort(languages, Comparator.comparingInt(String::length));
// 结果：[C, Java, Python]

查找极值：

List<Integer> numbers = Arrays.asList(3,1,4,2);
int max = Collections.max(numbers); // 4
int min = Collections.min(numbers); // 1

Arrays高级操作

并行排序：

int[] bigData = new int[1000000];
// 填充数据...
Arrays.parallelSort(bigData); // 利用多核并行排序

数组转流处理：

String[] languages = {"Java", "Python", "C++"};
long count = Arrays.stream(languages)
                  .filter(s -> s.length() > 3)
                  .count(); // 2

深度比较：

Object[] a1 = {"Java", new ArrayList<>()};
Object[] a2 = {"Java", new ArrayList<>()};
System.out.println(Arrays.equals(a1, a2));       // false
System.out.println(Arrays.deepEquals(a1, a2)); // true

Java8 Stream API

集合操作优化示例：

List<String> langs = Arrays.asList("Java", "Python", "C++");

// 传统方式
List<String> filtered = new ArrayList<>();
for (String s : langs) {
    if (s.startsWith("J")) {
        filtered.add(s.toUpperCase());
    }
}

// Stream方式
List<String> streamFiltered = langs.stream()
    .filter(s -> s.startsWith("J"))
    .map(String::toUpperCase)
    .collect(Collectors.toList());

主要优势：

声明式编程风格
支持并行处理（parallelStream）
链式操作提高可读性

迭代器与Fail-Fast机制

迭代器工作原理

Java集合通过Iterator接口提供标准遍历方式：

public interface Iterator<E> {
    boolean hasNext();
    E next();
    void remove();
}

// 使用示例
List<String> list = new ArrayList<>();
Iterator<String> it = list.iterator();
while(it.hasNext()) {
    String item = it.next();
    System.out.println(item);
}

Fail-Fast机制

实现原理：

集合内部维护modCount（修改计数器）
迭代时检查modCount是否与expectedModCount一致

触发场景：

List<String> list = new ArrayList<>();
list.add("Java");
Iterator<String> it = list.iterator();
list.add("Python"); // 结构性修改
it.next(); // 抛出ConcurrentModificationException

解决方案：

使用并发集合类（如CopyOnWriteArrayList）
通过迭代器的remove方法修改集合

常见面试题解析

1. ArrayList和LinkedList的区别？

答案：

ArrayList和LinkedList都实现了List接口，但它们的实现方式和性能特点有很大不同：

底层数据结构：
- ArrayList基于动态数组实现
- LinkedList基于双向链表实现
性能特点：
- ArrayList随机访问效率高（O(1)），但插入删除效率低（O(n)）
- LinkedList随机访问效率低（O(n)），但插入删除效率高（O(1)，如果已知位置）
内存占用：
- ArrayList只需要存储元素和少量管理数组的变量
- LinkedList除了存储元素外，还需要存储前驱和后继节点的引用，内存占用较大
适用场景：
- ArrayList适合频繁随机访问的场景
- LinkedList适合频繁插入删除的场景

2. HashMap的实现原理？

答案：

HashMap基于哈希表实现，在JDK 1.8中的具体实现如下：

数据结构：数组+链表+红黑树
工作原理：
- 通过hash函数计算键的哈希值
- 通过哈希值确定在数组中的位置
- 如果发生哈希冲突，使用链表或红黑树存储冲突的元素
特殊优化：
- 当链表长度超过8且数组长度超过64时，链表会转换为红黑树，提高查询效率
- 当红黑树节点数量小于6时，会转换回链表
扩容机制：
- 初始容量为16，负载因子为0.75
- 当元素数量超过容量*负载因子时，会进行扩容
- 每次扩容为原来的2倍

3. ConcurrentHashMap和Hashtable的区别？

答案：

线程安全实现方式：
- Hashtable使用synchronized关键字对整个方法进行同步，效率较低
- ConcurrentHashMap在JDK 1.7中使用分段锁（Segment）提高并发性能，JDK 1.8中使用CAS和synchronized关键字对单个节点进行同步
性能：
- ConcurrentHashMap的并发性能远高于Hashtable
空值：
- Hashtable不允许null键和null值
- ConcurrentHashMap不允许null键和null值