Java 8 Strem基本操作

栏目: 编程语言 · Java · 发布时间: 5年前

内容简介:本文提供了有关Java 8 Stream的深入概述。当我第一次读到的Stream API,我感到很困惑,因为它听起来类似Java I/O的在函数式编程中,monad是表示定义为步骤序列的计算的结构。具有monad结构的类型定义链操作的含义,或将该类型的函数嵌套在一起。本文详解如何使用Java 8 Stream以及如何使用不同类型的可用流操作。您将了解处理顺序以及流操作的顺序如何影响运行时性能。并对更强大的

本文提供了有关 Java 8 Stream的深入概述。当我第一次读到的Stream API,我感到很困惑,因为它听起来类似Java I/O的 InputStreamOutputStream 。但Java 8 Stream是完全不同的东西。Streams是Monads,因此在为Java提供函数式编程方面发挥了重要作用:

在函数式编程中,monad是表示定义为步骤序列的计算的结构。具有monad结构的类型定义链操作的含义,或将该类型的函数嵌套在一起。

本文详解如何使用Java 8 Stream以及如何使用不同类型的可用流操作。您将了解处理顺序以及流操作的顺序如何影响运行时性能。并对更强大的 reducecollectflatMap 流操作详细介绍。

如果您还不熟悉Java 8 lambda表达式,函数接口和方法引用,那么您可能需要了解Java 8。

Stram如何工作

Stream表示一系列元素,并支持不同类型的操作以对这些元素执行计算:

List<String> streams =
    Arrays.asList("a1", "a2", "b1", "c2", "c1");

streams
    .stream()
    .filter(s -> s.startsWith("c"))
    .map(String::toUpperCase)
    .sorted()
    .forEach(System.out::println);
复制代码

以上代码的产出:

C1
C2
复制代码

Stream操作是中间操作或终端操作。中间操作返回一个流,因此我们可以链接多个中间操作而不使用分号。终端操作无效或返回非流结果。在上述例子中 filtermapsorted 是中间操作,而 forEach 是一个终端的操作。有关所有可用流操作的完整列表,请参阅Stream Javadoc。如上例中所见的这种流操作链也称为操作管道。

大多数流操作都接受某种lambda表达式参数,这是一个指定操作的确切行为的功能接口。大多数这些操作必须是不受干扰和无状态。

当函数不修改流的基础数据源时,该函数是不受干扰的,例如在上面的示例中,没有lambda表达式通过从集合中添加或删除元素来修改streams。

当操作的执行是确定性的时,函数是无状态的,例如在上面的示例中,没有lambda表达式依赖于任何可变变量或来自外部作用域的状态,其可能在执行期间改变。

不同种类的Stream

可以从各种数据源创建流,尤其是集合。 ListsSets 支持新的方法 stream()parallelStream() 来创建顺序流或并行流。并行流能够在多个线程上操作,后面的部分将对此进行介绍。我们现在关注的是顺序流:

Arrays.asList("a1", "a2", "a3")
    .stream()
    .findFirst()
    .ifPresent(System.out::println);
复制代码

以上代码的产出:

a1
复制代码

在对象列表上调用 stream() 方法将返回常规对象流。但是我们不必创建集合以便使用流,就像我们在下一个代码示例中看到的那样:

Stream.of("a1", "a2", "a3")
    .findFirst()
    .ifPresent(System.out::println);
复制代码

以上代码的产出:

a1
复制代码

只是用来 Stream.of() 从一堆对象引用创建一个流。

除了常规对象流之外,Java 8还附带了特殊类型的流,用于处理原始数据类型 intlong 以及 double 。你可能已经猜到了 IntStreamLongStream , DoubleStream

IntStreams可以使用 IntStream.range() 方法替换常规for循环:

IntStream.range(1, 4)
    .forEach(System.out::println);
复制代码

以上代码的产出:

1
2
3
复制代码

所有这些原始流都像常规对象流一样工作,但有以下不同之处:原始流使用专门的lambda表达式,例如 IntFunction 代替 FunctionIntPredicate 代替 Predicate 。原始流支持额外的终端聚合操作, sum() , average()

Arrays.stream(new int[] {1, 2, 3})
    .map(n -> 2 * n + 1)
    .average()
    .ifPresent(System.out::println);
复制代码

以上代码的产出:

5.0
复制代码

有时将常规对象流转换为基本流是有用的,反之亦然。为此,对象流支持特殊的映射操作 mapToInt()mapToLong()mapToDouble

Stream.of("a1", "a2", "a3")
    .map(s -> s.substring(1))
    .mapToInt(Integer::parseInt)
    .max()
    .ifPresent(System.out::println);
复制代码

以上代码的产出:

3
复制代码

可以通过 mapToObj() 方式将原始流转换为对象流:

IntStream.range(1, 4)
    .mapToObj(i -> "a" + i)
    .forEach(System.out::println);
复制代码

以上代码的产出:

a1
a2
a3
复制代码

下面是一个组合示例:双精度流首先映射到int流,然后映射到字符串的对象流:

Stream.of(1.0, 2.0, 3.0)
    .mapToInt(Double::intValue)
    .mapToObj(i -> "a" + i)
    .forEach(System.out::println);
复制代码

以上代码的产出:

a1
a2
a3
复制代码

处理过程

现在我们已经学会了如何创建和使用不同类型的流,让我们深入了解如何在流程下处理流操作。

中间操作的一个重要特征是懒惰。查看缺少终端操作的示例:

Stream.of("d2", "a2", "b1", "b3", "c")
    .filter(s -> {
        System.out.println("filter: " + s);
        return true;
    });
复制代码

执行此代码段时,不会向控制台打印任何内容。这是因为只有在存在终端操作时才执行中间操作。

让我们通过 forEach 终端操作扩展上面的例子:

Stream.of("d2", "a2", "b1", "b3", "c")
    .filter(s -> {
        System.out.println("filter: " + s);
        return true;
    })
    .forEach(s -> System.out.println("forEach: " + s));
复制代码

执行此代码段会在控制台上产生所需的输出:

filter:  d2
forEach: d2
filter:  a2
forEach: a2
filter:  b1
forEach: b1
filter:  b3
forEach: b3
filter:  c
forEach: c
复制代码

结果的顺序可能会令人惊讶。默认认为是在流的所有元素上一个接一个地水平执行操作。但相反,每个元素都沿着链垂直移动。第一个字符串“d2”通过filter,然后forEach,然后处理第二个字符串“a2”。

此行为可以减少对每个元素执行的实际操作数,如下一个示例所示:

Stream.of("d2", "a2", "b1", "b3", "c")
    .map(s -> {
        System.out.println("map: " + s);
        return s.toUpperCase();
    })
    .anyMatch(s -> {
        System.out.println("anyMatch: " + s);
        return s.startsWith("A");
    });
复制代码

代码产出

map:      d2
anyMatch: D2
map:      a2
anyMatch: A2
复制代码

一旦谓词应用于给定的输入元素, anyMatch 操作将返回true。这对于传递给“A2”的第二个元素是正确的。由于流链的垂直执行, map 在这种情况下映射只需执行两次。因此,不是映射流的所有元素,而是 map 尽可能少地调用。

复杂的处理过程

下一个示例包括两个 map , filter 中间操作和 forEach 终端操作。让我们再次检查这些操作是如何执行的:

Stream.of("d2", "a2", "b1", "b3", "c")
    .map(s -> {
        System.out.println("map: " + s);
        return s.toUpperCase();
    })
    .filter(s -> {
        System.out.println("filter: " + s);
        return s.startsWith("A");
    })
    .forEach(s -> System.out.println("forEach: " + s));
复制代码

代码产出:

map:     d2
filter:  D2
map:     a2
filter:  A2
forEach: A2
map:     b1
filter:  B1
map:     b3
filter:  B3
map:     c
filter:  C
复制代码

正如您可能已经猜到的,对于底层集合中的每个字符串,map和filter都被调用5次,而forEach只被调用一次。

如果我们改变操作的顺序,移动filter到链的开头,我们可以大大减少实际的执行次数:

Stream.of("d2", "a2", "b1", "b3", "c")
    .filter(s -> {
        System.out.println("filter: " + s);
        return s.startsWith("a");
    })
    .map(s -> {
        System.out.println("map: " + s);
        return s.toUpperCase();
    })
    .forEach(s -> System.out.println("forEach: " + s));
复制代码

代码产出:

filter:  d2
filter:  a2
map:     a2
forEach: A2
filter:  b1
filter:  b3
filter:  c
复制代码

现在,map只调用一次,因此操作管道对大量输入元素的执行速度要快得多。在编写复杂的方法链时要记住这一点。

让我们通过一个 sorted 额外的操作来扩展上面的例子:

Stream.of("d2", "a2", "b1", "b3", "c")
    .sorted((s1, s2) -> {
        System.out.printf("sort: %s; %s\n", s1, s2);
        return s1.compareTo(s2);
    })
    .filter(s -> {
        System.out.println("filter: " + s);
        return s.startsWith("a");
    })
    .map(s -> {
        System.out.println("map: " + s);
        return s.toUpperCase();
    })
    .forEach(s -> System.out.println("forEach: " + s));
复制代码

排序是一种特殊的中间操作。这是一个所谓的有状态操作,因为为了对在 排序 期间必须维护状态的元素集合进行排序。

执行此示例将导致以下控制台输出:

sort:    a2; d2
sort:    b1; a2
sort:    b1; d2
sort:    b1; a2
sort:    b3; b1
sort:    b3; d2
sort:    c; b3
sort:    c; d2
filter:  a2
map:     a2
forEach: A2
filter:  b1
filter:  b3
filter:  c
filter:  d2
复制代码

首先,对整个输入集合执行排序操作。换句话说,sorted是水平执行的。因此,在这种情况下sorted,对输入集合中的每个元素的多个组合调用八次。

我们可以通过重新排序链来优化性能:

Stream.of("d2", "a2", "b1", "b3", "c")
    .filter(s -> {
        System.out.println("filter: " + s);
        return s.startsWith("a");
    })
    .sorted((s1, s2) -> {
        System.out.printf("sort: %s; %s\n", s1, s2);
        return s1.compareTo(s2);
    })
    .map(s -> {
        System.out.println("map: " + s);
        return s.toUpperCase();
    })
    .forEach(s -> System.out.println("forEach: " + s));
复制代码

代码产出

filter:  d2
filter:  a2
filter:  b1
filter:  b3
filter:  c
map:     a2
forEach: A2
复制代码

在此示例sorted从未被调用过,因为filter将输入集合减少到只有一个元素。因此,对于较大的输入集合,性能会大大提高。

重用Stream

Java 8 Stream无法重用。只要您调用任何终端操作,流就会关闭:

Stream<String> stream =
    Stream.of("d2", "a2", "b1", "b3", "c")
        .filter(s -> s.startsWith("a"));

stream.anyMatch(s -> true);    // ok
stream.noneMatch(s -> true);   // exception
复制代码

在同一流上的 anyMatch 之后调用 noneMatch 会导致以下异常:

java.lang.IllegalStateException: stream has already been operated upon or closed
    at java.util.stream.AbstractPipeline.evaluate(AbstractPipeline.java:229)
    at java.util.stream.ReferencePipeline.noneMatch(ReferencePipeline.java:459)
    at com.winterbe.java8.Streams5.test7(Streams5.java:38)
    at com.winterbe.java8.Streams5.main(Streams5.java:28)
复制代码

为了克服这个限制,我们必须为我们想要执行的每个终端操作创建一个新的流链,例如我们可以创建一个流供应商来构建一个新的流,其中已经设置了所有中间操作:

Supplier<Stream<String>> streamSupplier =
    () -> Stream.of("d2", "a2", "b1", "b3", "c")
            .filter(s -> s.startsWith("a"));

streamSupplier.get().anyMatch(s -> true);   // ok
streamSupplier.get().noneMatch(s -> true);  // ok
复制代码

每次调用get()构造一个我们保存的新流,以调用所需的终端操作。


以上所述就是小编给大家介绍的《Java 8 Strem基本操作》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

搜索引擎

搜索引擎

李晓明 / 科学出版社发行部 / 2005-4 / 33.00元

《搜索引擎:原理技术与系统》系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。《搜索引擎:原理技术与系统》分三篇共13章内容,从基本工作原理概述,到一个小型简单搜索引擎具体细节的实现,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后介绍了面向主题和个性化的web信息服务,阐述了中文网页自动分类等技术及其应用。《搜索引擎:原理技术与系统》层次分明,由浅入深;既有深入的......一起来看看 《搜索引擎》 这本书的介绍吧!

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具