在具有2个或更多副本的容器化django应用程序中运行CronJob的最佳方法是什么

问题描述

我正在研究一个项目,该项目作为3个副本作为服务部署在docker swarm上。我想运行一个简单的管理命令,如果日期已过,则从表中删除一些行。我已经为此写了一个django命令,但想使用cron作业使运行自动化。我确实要确保作业每天仅从属于我服务范围的任何容器中运行一次。在互联网上,我发现了一些为运行Django应用程序的cron作业而构建的软件包,但它们中没有一个考虑多个容器。一些软件包具有基于锁的方法,但它是基于文件的锁,而不是共享锁。我不想为这个简单的任务而忙碌。

以下是我的命令:


class Command(BaseCommand):
    """Command to clear user subscription if end_date has passed"""

    def handle(self,*args,**options):
        try:
            deleted_count,relative_deleted = MyModel.delete_inactive_instances()
        except Exception:
            raise CommandError('Could Not Remove Inactive Subscriptions From DB')
        else:
            self.stdout.write(self.style.SUCCESS('Successfully Removed Inactive Subscriptions %s ' % deleted_count))

我目前每天由docker exec运行一条命令:

python manage.py delete_inactive_instances

以下是我的docker-stack文件

services:
  production_app:
    image: {id}.dkr.ecr.{region}.amazonaws.com/xxxxxx:latest
    expose:
      - 8000
    deploy:
      replicas: 2
    command: >
        sh -c "python manage.py migrate && gunicorn app.wsgi:application --workers 3 --bind 0.0.0.0:8000"
    env_file:
      - .prod.env

  Nginx:
    image: {id}.dkr.ecr.{region}.amazonaws.com/Nginx:latest
    ports:
      - 80:80

解决方法

您可以使用Celery和Celery Beat调度程序。它与Django完美集成。在您的docker swarm配置中,您将添加以下服务:

  • 芹菜节拍器:1个副本
  • 芹菜工人:您想要的副本数量
  • redis(用于消息代理)

如果您不想向集群添加其他服务,则还可以在django容器中将芹菜工作者作为后台任务运行。节拍调度程序是控制任务何时运行的程序,但实际上是由芹菜工作者执行的。

您可以在此项目上找到使用docker compose配置进行工作设置的示例: https://github.com/testdrivenio/django-celery-beat

作为替代方案,您可以在堆栈配置中使用相同的映像但入口点不同的方式定义其他服务:该服务将负责运行入口点定义的cron任务

,

您可以使用Celery和Celery Beat调度程序。它与Django完美集成。在您的docker swarm配置中,您将添加以下服务:

  • 芹菜节拍器:1个副本
  • 芹菜工作者:您想要的副本数量
  • redis(用于消息代理)

如果您不想向集群添加其他服务,则还可以在django容器中将芹菜工人作为后台任务运行。但是,您只应运行一个节拍调度程序的实例以防止任务重复。节拍调度程序是控制任务何时运行的程序,但实际上是由芹菜工作者执行的。

您可以在此处找到docker compose配置的示例: https://github.com/testdrivenio/django-celery-beat