问题描述
我的工作最多可能需要几个小时。可能由于某种原因(例如内存不足或集群重新平衡),它只是失败了。问题是作业通常是通宵运行,早上需要有人检查,手动重启(大部分时间就够了)。我想知道这个问题是否可以使用spring cloud数据流来解决。
理想情况下,我希望 SCDF 在作业完成(失败或成功)时发送电子邮件(或调用 webhook),并在失败时重试整个作业。可以这样做吗?
解决方法
SCDF 是一个轻量级的 Spring Boot 应用程序,它公开了一组 RESTful APIs,因此您可以利用这些 API 来构建所需的自动化。
目前没有内置的电子邮件功能来自动执行开箱即用的工作流程。
但是,您可以编写一个定期与 SCDF 的 RESTful API 交互的小型应用程序,并且根据所需的有状态场景,您可以启动电子邮件和/或重新启动操作。