问题描述
我正在运行 celery 4.4.7。
Worker 在 Kubernetes 集群中作为 Pod 运行。
我的任务出现异常并且仍然标记为 SUCCESS 状态:
怎么可能? (我希望看到它被标记为 FAILURE)
附加信息:
- 这是我的配置:
broker_pool_limit = None
result_expires = 172800
task_acks_late = True
task_reject_on_worker_lost = True
task_track_started = True
task_time_limit = 21600
task_soft_time_limit = task_time_limit - 10
worker_max_tasks_per_child = 1
worker_prefetch_multiplier = 1
- 我看到工作人员同时收到了 SIGTERM。
- 请注意,有成功 + 失败时间。任务耗时约 10 分钟。
我的猜测是终止 pod 上的任务没有结束,相同的任务在一个新的 worker(pod)上再次开始——这可以解释这个异常,但我不确定为什么一个新任务在原创完成。
可能与task_reject_on_worker_lost
有关?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)