有没有办法通过 applicationID 以及链接的 spark-submit 命令获取纱线日志?

问题描述

我在 Amazon EMR 上有大约 400 个 yarn 应用程序,我以 20 个为一组运行这些应用程序。像这样:

  1. for i in seq 20; do spark-submit --master yarn <other arguments> &; done

我希望此过程完全自动化,因此希望以编程方式捕获任何失败日志。我知道可以通过以下 yarn 命令查看应用程序日志,如果我们有 applicationId

  1. yarn logs -applicationId <applicationId>

但是,我无法找到如何将 applicationId 链接到相应的 spark submit 命令。

假设上面 (1.​​) 中的命令一次向 yarn 提交 20 个 spark-submit 作业,其中 3 个失败,我怎么知道哪个 spark-submit 命令失败了? 有没有办法以编程方式检索 (1.) 中每个 spark-submit 命令的 applicationId 并利用 (2.) 来获取相应的日志?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)