问题描述
我有一个模块,它接受实体 ID 和“解析类型”作为参数,然后通过返回 Flux 的多个操作异步收集数据(主要)。解析被分解为多个(主要是再次)异步操作,每个操作都用于收集有助于解析的不同数据类型。我说“主要”是异步的,因为某些解析类型需要一些必须同步发生的初步操作,以便为解析的其余异步 Flux 操作提供信息。现在,当这个同步操作发生时,整个异步解析操作的至少一部分可以开始。我想在同步操作发生时启动这些 Flux 操作。然后,一旦同步数据得到解决,我就可以为正在进行的剩余操作获取每个 Flux。某些解析类型将让所有 Flux 操作返回数据,而其他解析类型收集的信息较少,并且某些 Flux 操作将保持为空。解析操作非常耗时,我希望能够更早地开始一些 Flux 操作,以便我可以稍微压缩时间——这对我正在完成的工作非常重要。所以急切订阅是理想的,只要我能保证我不会错过任何项目发射。
考虑到这一点,我该怎么做:
- 为解决所有问题所需的每个 Flux 操作创建一个“持有者”或“容器”,并将它们初始化为空(如
Flux.empty()
) - 将项目添加到我在上面的项目 1 中可以创建的任何内容中——它被初始化为空,但我可能想要来自一个或多个有限和异步 Flux 操作的数据,但我不关心将它们分开,而且它们当我对它们使用
collectList()
来生成Mono
时,可以作为一个流出现。 - 当其中一些
Flux
操作应该先于其他一些操作开始时,我该如何启动它们并确保不会遗漏任何数据?例如,如果我启动名称解析 Flux,我可以添加到它,如上面的第 2 项中吗?假设我想开始检索一些数据,然后执行一个同步操作,然后我从同步操作的结果中创建另一个名称解析 Flux,我可以将此新 Flux 附加到原始名称解析 Flux,因为它将返回相同的数据类型?我知道Flux.merge()
,但如果可能的话,使用我可以不断添加的单个 Flux 参考会很方便。
我是否需要一个集合对象,比如一个列表,然后使用合并操作?最初,我考虑使用 ConnectableFlux
,直到我意识到它用于连接多个订阅者,而不是连接多个发布者。我认为连接多个发布商是满足我需求的一个很好的解决方案,除非这是一种可以以更好的方式处理的常见模式。
我只做响应式编程的时间很短,所以请耐心等待我试图描述我想做的事情的方式。如果我能更好地澄清我的意图,请告诉我我不清楚的地方,我会很乐意尝试澄清它。提前感谢您的时间和帮助!
编辑: 这是最终的 Kotlin 版本,简洁明了:
private val log = KotlinLogging.logger {}
class ReactiveDataService {
private val createMono: () -> Mono<List<Int>> = {
Flux.just(9,8,7)
.flatMap {
Flux.fromIterable(List(it) { Random.nextInt(0,100) })
.parallel()
.runOn(Schedulers.boundedElastic())
}
.collectList()
.cache()
}
private val processResults: (List<String>,List<String>) -> String =
{ d1,d2 -> "\n\tdownstream 1: $d1\n\tdownstream 2: $d2" }
private val convert: (List<Int>,Int) -> Flux<String> =
{ data,multiplier -> Flux.fromIterable(data.map { String.format("%3d",it * multiplier) }) }
fun doQuery(): String? {
val mono = createMono()
val downstream1 = mono.flatMapMany { convert(it,1) }.collectList()
val downstream2 = mono.flatMapMany { convert(it,2) }.collectList()
return Mono.zip(downstream1,downstream2,processResults).block()
}
}
fun main() {
val service = ReactiveDataService()
val start = System.currentTimeMillis()
val result = service.doQuery()
log.info("{}\n\tTotal time: {}ms",result,System.currentTimeMillis() - start)
}
和输出:
downstream 1: [ 66,39,40,88,97,35,70,91,27,12,84,37,15,45,85,22,55,89,81,21,43,62]
downstream 2: [132,78,80,176,194,140,182,54,24,168,74,30,90,170,44,110,178,162,42,86,124]
Total time: 209ms
解决方法
这听起来像是反应堆的理想工作。可以使用弹性调度程序将同步调用包装为 Fluxes(或 Monos)返回,以允许它们并行执行。然后使用各种运算符,您可以将它们组合在一起以形成表示结果的单个 Flux。订阅那个 Flux,整个机器就会启动。
我认为您需要使用 Mono.flatMapMany 而不是 Flux.usingWhen。
public class ReactiveDataService {
public static void main(final String[] args) {
ReactiveDataService service = new ReactiveDataService();
service.doQuery();
}
private Flux<Integer> process1(final List<Integer> data) {
return Flux.fromIterable(data);
}
private Flux<Integer> process2(final List<Integer> data) {
return Flux.fromIterable(data).map(i -> i * 2);
}
private String process3(List<Integer> downstream1,List<Integer> downstream2) {
System.out.println("downstream 1: " + downstream1);
System.out.println("downstream 2: " + downstream2);
return "Done";
}
private void doQuery() {
final Mono<List<Integer>> mono =
Flux.just(9,8,7)
.flatMap(
limit ->
Flux.fromStream(
Stream.generate(() -> new Random().nextInt(100))
.peek(
i -> {
try {
Thread.sleep(500);
} catch (InterruptedException ignored) {
}
})
.limit(limit))
.parallel()
.runOn(Schedulers.boundedElastic()))
.collectList()
.cache();
final Mono<List<Integer>> downstream1 = mono.flatMapMany(this::process1).collectList();
final Mono<List<Integer>> downstream2 = mono.flatMapMany(this::process2).collectList();
Mono.zip(downstream1,downstream2,this::process3).block();
}
}