问题描述
我在 Amazon EMR 上有大约 400 个 yarn 应用程序,我以 20 个为一组运行这些应用程序。像这样:
for i in seq 20; do spark-submit --master yarn <other arguments> &; done
我希望此过程完全自动化,因此希望以编程方式捕获任何失败日志。我知道可以通过以下 yarn 命令查看应用程序日志,如果我们有 applicationId:
yarn logs -applicationId <applicationId>
但是,我无法找到如何将 applicationId 链接到相应的 spark submit 命令。
假设上面 (1.) 中的命令一次向 yarn 提交 20 个 spark-submit
作业,其中 3 个失败,我怎么知道哪个 spark-submit
命令失败了?
有没有办法以编程方式检索 (1.) 中每个 spark-submit
命令的 applicationId 并利用 (2.) 来获取相应的日志?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)