问题描述
由于某种原因,Java Stream 生成了更多的值(调用迭代器的 hasNext() 和 next() 方法。
这是合成示例。
@requiredArgsConstructor
static class TestIterator implements Iterator<Integer> {
private final int bound;
private final Random rnd = new Random();
private int current = 0;
@Override public boolean hasNext() {
return current < bound;
}
@Override public Integer next() {
current = rnd.nextInt(20);
System.out.println("Generated: " + current);
return current;
}
}
现在,我正在尝试创建一个由几个迭代器组成的扁平流
public static void main(String... args) {
List<Iterator<Integer>> iterators = asList(
new TestIterator(18),new TestIterator(18),new TestIterator(18));
Stream<Integer> streams = iterators.stream()
.map(iter -> (Iterable<Integer>) () -> iter)
.flatMap(iter -> StreamSupport.stream(iter.spliterator(),false)) // <-- Here the stream of streams is flatten to a single stream of integers and 'parallel' is set to false
.limit(5); // <-- Here the limit is set
streams.forEach(i -> System.out.println("***Consumed: " + i));
}
而且,令我惊讶的是,输出如下:
Generated: 1
***Consumed: 1
Generated: 19
***Consumed: 19
Generated: 7
***Consumed: 7
Generated: 7
***Consumed: 7
Generated: 7
***Consumed: 7
Generated: 4
Generated: 3
Generated: 8
Generated: 14
Generated: 0
Generated: 16
Generated: 10
Generated: 3
Generated: 19
因此,Stream 生成的结果比在 forEach 中传递给消费者的结果要多。 即使它明确设置了 'parallel = false'。
在我的实际场景中,hasNext() 和 next() 函数非常昂贵,需要从外部服务获取数据。
谁能解释一下如何在限制结果方面做得更好?
提前致谢。
解决方法
这是一个 known JDK bug,已在 JDK 10+ 中修复并反向移植到 openjdk8u222
,因此更新您的 Java 版本将解决该问题。
因为它是一个不可变的值,所以你的 hasNext() 函数调用不间断地运行。