问题描述
我有一个向量v
,该向量由0分隔成组。可以通过for循环或迭代器将这些分隔的组的总和累加:
fn main() {
let v = vec![55,23,75,12,34,97,71,0];
// for loop
let mut acc = 0;
for &vi in &v {
acc += vi;
if vi == 0 {
println!("for yield {}",acc);
acc = 0;
}
}
// iter 'loop'
v.iter()
.scan(0,|acc,&vi| {
*acc += vi;
Some(if vi == 0 {
let total = *acc;
*acc = 0;
Some(total)
} else {
None
})
})
.filter_map(|acc| acc)
.for_each(|acc| println!("iter yield {:?}",acc));
}
scan
用作 ad hoc 协程,当迭代器产生值时返回Some(value)
,而在迭代器仍在处理时返回None
。 None
会被滤除并打印出总和。
上面的例子有些琐碎,因为两个操作都产生相同的结果。但是,我的项目需要消化数据流(无法收集到向量中)并有条件地折叠它们(例如,这里的条件可能是acc
被10整除而不是定界为0)。
折叠条件本身是流水线的,因此每个流水线都可以提供一个迭代器(请考虑嵌套的协程)。我想看看Iterator::scan
-> Iterator::filter_map
是否有替代方法,无论他们是否使用迭代器。请记住,不可能收集整个数据流,因为数据流可能是无限的。
解决方法
for
循环或带有scan()
的版本都没有问题。如果我正在寻找更清晰的替代方法,则可以考虑使用group_by
中的itertools
crate。这个版本很优雅,几乎可以满足您的需求:
use itertools::Itertools;
v.iter()
.group_by(|&&vi| vi != 0)
.into_iter()
.map(|(_,group)| group.sum::<u32>())
.for_each(|s| println!("sum {}",s));
问题在于,它输出数字153、0、46、0、191和0。0源自这样一个事实,即它认为元素0只是键的另一个组(表达式{ {1}}恰好是假的而不是真实的。要解决此问题,您需要将vi != 0
更改为map
,类似于对filter_map
的操作:
scan()
不够完美,但仍比原始表述更加优雅,因为它使分组更加明确。