Apache Flink 和将工作分配给任务

问题描述

我有一个与 apache flink 相关的问题。目前我正在研究 apache flink 作为我们的工作框架。

本质上,我们有一个内容摄取工作,我们从提要中摄取一些内容,该提要本质上是分页的。 Feed 的内容可以是 xml 或 json 格式,每页可以有 1000 条记录。

我需要的是将这 1000 条记录分成任务并并行处理。

我知道 flink 有一些方法可以并行化其作业,但可以将其划分为任务槽。 我想知道我们如何做到这一点,或者任何在线资源将不胜感激。

我看到我们可以使用 setParallelism() 进行设置,但我很难找到设置处理的方法。

所以只是给你一个想法..这是一个示例供稿

<mainTag>
    <subTag>
    ......
    </subTag>
    <subTag>
    ......
    </subTag>
    <subTag>
    ....
    </subTag>
</mainTag>

现在在上面的 xml 示例中,我想分割并并行处理它。

这类似于我们在 java 中使用 ExecutorService 进行多线程处理。

在纯 java 中,我会执行 executorService.submit(subtagTask) 来处理 subTag。

我想知道在 Flink 中是否有办法做到这一点。这将帮助我不再为处理线程而头疼以及随之而来的头疼。

感谢任何帮助。

问候。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)