我们介绍了Stream
的几个常见操作:map()
、filter()
、reduce()
。这些操作对Stream
来说可以分为两类,一类是转换操作,即把一个Stream
转换为另一个Stream
,例如map()
和filter()
,另一类是聚合操作,即对Stream
的每个元素进行计算,得到一个确定的结果,例如reduce()
。
区分这两种操作是非常重要的,因为对于Stream
来说,对其进行转换操作并不会触发任何计算!我们可以做个实验:
import java.util.function.Supplier; import java.util.stream.Stream; public class Main { public static void main(String[] args) { Stream s1 = Stream.generate(new NatualSupplier()); Stream s2 = s1.map(n -> n * n); Stream s3 = s2.map(n -> n - 1); System.out.println(s3); // java.util.stream.ReferencePipeline$3@49476842 } } class NatualSupplier implements Supplier { long n = 0; public Long get() { n++; return n; } }
因为s1
是一个Long
类型的序列,它的元素高达922亿个,但执行上述代码,既不会有任何内存增长,也不会有任何计算,因为转换操作只是保存了转换规则,无论我们对一个Stream
转换多少次,都不会有任何实际计算发生。
而聚合操作则不一样,聚合操作会立刻促使Stream
输出它的每一个元素,并依次纳入计算,以获得最终结果。所以,对一个Stream
进行聚合操作,会触发一系列连锁反应:
Stream s1 = Stream.generate(new NatualSupplier()); Stream s2 = s1.map(n -> n * n); Stream s3 = s2.map(n -> n - 1); Stream s4 = s3.limit(10); s4.reduce(0, (acc, n) -> acc + n);
我们对s4
进行reduce()
聚合计算,会不断请求s4
输出它的每一个元素。因为s4
的上游是s3
,它又会向s3
请求元素,导致s3
向s2
请求元素,s2
向s1
请求元素,最终,s1
从Supplier
实例中请求到真正的元素,并经过一系列转换,最终被reduce()
聚合出结果。
可见,聚合操作是真正需要从Stream
请求数据的,对一个Stream
做聚合计算后,结果就不是一个Stream
,而是一个其他的Java对象。
输出为List
reduce()
只是一种聚合操作,如果我们希望把Stream
的元素保存到集合,例如List
,因为List
的元素是确定的Java对象,因此,把Stream
变为List
不是一个转换操作,而是一个聚合操作,它会强制Stream
输出每个元素。
下面的代码演示了如何将一组String
先过滤到空字符串,然后把非空字符串保存到List
中:
import java.util.*; import java.util.stream.*; public class Main { public static void main(String[] args) { Stream stream = Stream.of("Apple", "", null, "Pear", " ", "Orange"); List list = stream.filter(s -> s != null && !s.isBlank()).collect(Collectors.toList()); System.out.println(list); } }
把Stream
的每个元素收集到List
的方法是调用collect()
并传入Collectors.toList()
对象,它实际上是一个Collector
实例,通过类似reduce()
的操作,把每个元素添加到一个收集器中(实际上是ArrayList
)。
类似的,collect(Collectors.toSet())
可以把Stream
的每个元素收集到Set
中。
输出为数组
把Stream的元素输出为数组和输出为List类似,我们只需要调用toArray()
方法,并传入数组的“构造方法”:
List list = List.of("Apple", "Banana", "Orange"); String[] array = list.stream().toArray(String[]::new);
注意到传入的“构造方法”是String[]::new
,它的签名实际上是IntFunction
定义的String[] apply(int)
,即传入int
参数,获得String[]
数组的返回值。
输出为Map
如果我们要把Stream的元素收集到Map中,就稍微麻烦一点。因为对于每个元素,添加到Map时需要key和value,因此,我们要指定两个映射函数,分别把元素映射为key和value:
import java.util.*; import java.util.stream.*; public class Main { public static void main(String[] args) { Stream stream = Stream.of("APPL:Apple", "MSFT:Microsoft"); Map map = stream .collect(Collectors.toMap( // 把元素s映射为key: s -> s.substring(0, s.indexOf(':')), // 把元素s映射为value: s -> s.substring(s.indexOf(':') + 1))); System.out.println(map); } }
分组输出
Stream
还有一个强大的分组功能,可以按组输出。我们看下面的例子: